Je kunt soldaten leren hoe ze een geweer moeten afvuren, maar hoe weet je of ze daadwerkelijk schieten als de vijand nadert? Om een betere selectie te kunnen maken bij hun rekruten vroeg het Amerikaanse leger in de Eerste Wereldoorlog aan wetenschappers een test te ontwikkelen, die voorspelt of een soldaat goed presteert op het slagveld.
De Army Alpha-test was een van de eerste grootschalige toepassingen van een assessment test: een methode om met vragenlijsten de eigenschappen van een sollicitant te meten, en zo te voorspellen of zij of hij geschikt is voor een functie. Vaak worden ‘cognitieve vermogens’ (intelligentie) of persoonlijkheidskenmerken (assertief, of juist afwachtend) gemeten. Inmiddels zijn er alleen in Nederland al zo’n driehonderd bureaus die zulke testen aanbieden.
De belofte van die bureaus is in grote lijnen hetzelfde. Maarten Hack, mede-eigenaar van bureau HR Organizer en al vijfentwintig jaar in het vak, legt uit. Een bedrijf zoekt een manager, callcentermedewerker, trainee of loodgieter. Allereerst stelt zijn bureau dan een werkprofiel op: een opsomming van de belangrijkste eigenschappen waarover de ideale kandidaat beschikt. Dat is vooral een kwestie van schrappen en afbakenen. Anders zoekt elk bedrijf naar een schaap met vijf poten. Een medewerker die creatief én gestructureerd is, zelfstandig maar ook een ‘teamplayer’ – dat kan niet.
Aan de hand van het werkprofiel stelt het algoritme van HR Organizer vervolgens een online testprogramma samen. Volgens Hack zijn er al zoveel testen ontwikkeld waarvan wetenschappelijk is bewezen dat ze werken, dat „je niet steeds een nieuwe test hoeft te ontwikkelen”. Het is een kwestie van de juiste samenstelling van testvragen vinden. HR Organizer put daarbij uit de database van Cut-e, een internationale ontwikkelaar.
Eens in de drie jaar laat Hack zijn testen door een externe partij controleren op validiteit en betrouwbaarheid. Validiteit houdt in dat een test meet wat hij moet meten: als een kandidaat volgens de test stressbestendig is, moet hij dat in de praktijk ook zijn. Een betrouwbare test geeft bij dezelfde persoon, onder dezelfde omstandigheden, telkens dezelfde uitkomst.
:format(jpeg):fill(f8f8f8,true)/s3/static.nrc.nl/images/gn4/stripped/data32861660-ab57cc.png)
Onderbuikgevoel
Het laten keuren van je testmethodes is in Nederland niet bij wet verplicht. Bovendien kan iedereen een assessmentbureau beginnen en testen ontwikkelen. Janneke Oostrom en Jos Akkermans zijn aan de Vrije Universiteit verbonden als onderzoeker op het gebied van recruitment en selectie, onderzoeker Sanne Nijs is dat op het gebied van talentmanagement en identificatie. Hoewel het inzetten van testen in sollicitatieprocedures volgens hen voor de kandidaat én de organisatie gunstig kan uitpakken, zien ze een aantal problemen.
Eerst het goede nieuws: een goede intelligentietest, vaak in combinatie met een persoonlijkheidstest, voorspelt volgens de drie veel béter welke kandidaat geschikt is dan een cv en een klassiek sollicitatiegesprek. Sterker nog: als organisaties naast testen ook gesprekken afnemen, gaat de voorspellende waarde van de test omlaag. Hoe komt dat?
Oostrom: „Zodra mensen een gesprek met een kandidaat hebben gevoerd, vertrouwen ze blindelings op hun eigen vermogen om talent te herkennen. Ook als de test iets anders uitwijst. Maar mensen zijn hier, zelfs al hebben ze jarenlange ervaring als recruiter, gewoon niet zo goed in.” Een probleem is volgens de onderzoekers dan ook dat mensen het een onprettig idee vinden om intuïtie en ‘menselijke’ aspect uit het sollicitatieproces te halen, door enkel op een test te vertrouwen.
Volgens Akkermans, Nijs en Oostrom is het bovendien niet zo dat veel assessmentbureaus met bewezen onbetrouwbare methodes werken, maar weten ze vaak óók niet of hun methodes wél betrouwbaar en valide zijn, omdat ze het simpelweg niet hebben laten controleren. Bij organisaties als de Cotan (Commissie Testaangelegenheden Nederland) kunnen bedrijven hun methodes laten testen door psychologen van het Nederlands Instituut Psychologen (NIP). Het kopen van testvragen uit een database garandeert namelijk nog niet dat de voorspellende waarde van een test bewezen is.
/s3/static.nrc.nl/bvhw/files/2018/02/130218car_breinscouting_24896640.jpg)
Zo kan de omgeving waarin een test wordt gemaakt soms al van invloed zijn op de uitkomsten. Als kandidaten in hun functie op een hele rumoerige plaats moeten werken, maar op een hele rustige plaats worden getest, dan leveren de resultaten geen goede voorspelling op. En van sommige testmethodes, zoals het gebruiken van kleurenmodellen om persoonlijkheidstypen in te delen (geel staat voor expressief, blauw voor analytisch), is nooit wetenschappelijk aangetoond dat ze ook echt werken, aldus de onderzoekers. Akkermans: „Dat je jezelf herkent in een beschrijving, zegt nog niets over de betrouwbaarheid ervan. Denk aan een horoscoop.”
Zij raden kandidaten die in een sollicitatieprocedure een test moeten maken, aan om na te gaan of de ontwikkelaar van de test geregistreerd staat bij de Cotan, of op een andere manier de juistheid van de methode kan aantonen. Als dat niet het geval is, dan kunnen sollicitanten een klacht indienen bij het NIP.
Hack gelooft vooral in „de antidiscriminerende werking van assessment testen”, zegt hij. „Bij echt goede testen worden mensen beoordeeld op hun kwaliteiten, en niet op hun uiterlijk, geslacht of achternaam. Dat maakt dit werk zo mooi.”
Voorbeeldvragen
1. De kandidaat heeft zes bollen, die hij of zij kan verdelen over de drie onderstaande eigenschappen. In hoeverre zijn de volgende standpunten op hem/haar van toepassing:
Ik werk goed samen met anderen.
Ik stel uitdagende doelen voor mezelf.
Ik herken de kern van een probleem.
Onderzoeker Janneke Oostrom: „Dit soort vragen worden gebruikt om inzicht te krijgen in de rangorde van eigenschappen bij één sollicitant. Het gaat dan dus niet alleen om absolute scores, maar ook om de verhouding van scores ten opzichte van elkaar.”
2. De kandidaat moet een schuifje verplaatsen dat varieert tussen „minder waar voor mijzelf dan voor anderen”, via „voor mijzelf evenzo waar als voor anderen”, naar „méér waar voor mijzelf dan voor anderen.”
Ik help anderen graag en vaak.
Volgens Oostrom wordt deze vraagstelling nog niet heel vaak gebruikt. Wel zijn er enkele onderzoeken, zoals die van Candese onderzoekers aan de University of Western Ontario, waaruit blijkt dat mensen zichzelf altijd in relatie tot anderen beoordelen. Door een vraag op deze manier te formuleren zou iemand zijn eigen kwaliteiten daarom beter kunnen inschatten.
3. De cijferreeks. Vul aan: 6, 2, 12, 4, 24.
Kies uit: 7, 8, 6, 10 of 14.
Oostrom: „Cijferreeksen zijn een goede meting van de algemene intelligentie.”
Bron: HR Organizer