Hoe fijn is klein? De zwakke onderbouwing van de kleine-klassenpolitiek

De klassen moeten kleiner, vindt de onderwijspolitiek, die zich gesteund waant door onderzoek. Wie zich in dat onderzoek verdiept, komt tot de onvermijdelijke conclusie: dat kleinere klassen leiden tot betere leerprestaties is geenszins bewezen.

HET 'WETTIG EN overtuigend' bewijs was eindelijk geleverd. Verkleining van klassen in het basisonderwijs - met name in de onderbouw - is een noodzakelijke voorwaarde voor beter basisonderwijs.

Aldus luidden vrijwel unaniem de reactie van staatssecretaris Netelenbos en de beschouwingen in de pers naar aanleiding van het rapport 'Klassenverkleining' dat de Commissie Kwalitatieve Aspecten van Groepsgrootte in het Basisonderwijs - onder voorzitterschap van Van Eijndhoven - vorige maand presenteerde. De indruk werd zelfs gewekt dat minister Zalm van Financiën wel bereid zou zijn de extra 923 miljoen gulden die jaarlijks (!) voor klassenverkleining nodig zijn, beschikbaar te stellen.

Deze unanimiteit was niet verwacht. Toen een paar maanden geleden uitkomsten van experimenten in de Amerikaanse staat Tennessee bekend werden, hield de staatssecretaris nog een flinke slag om de arm. Maar vooral omdat er nu ook specifiek aan de Nederlandse situatie ontleende onderzoeksuitkomsten beschikbaar zijn, is zij overtuigd.

Naar onze mening zou de staatssecretaris echter het rapport eens goed moeten lezen, en het daarin aangeboden bewijsmateriaal kritisch tegen het licht moeten houden. Zij zal dan moeten concluderen dat de bewijzen veel minder hard zijn dan de commissie suggereert; in feite zijn ze boterzacht.

De stellingname van de commissie is dat klassenverkleining noodzakelijk is voor betere prestaties van leerlingen in het basisonderwijs. Klassenverkleining alleen is niet voldoende, er is 'flankerend beleid' nodig, aldus de commissie: ruimtelijke voorzieningen, het afleggen van rekenschap door de scholen en professionalisering van leerkrachten.

Zo geformuleerd is het een voorzichtige stellingname, die ook niet gemakkelijk te weerleggen is. Want pas als leerlingen in grote klassen beter presteren dan leerlingen in kleine klassen, is ze niet houdbaar meer. Want als empirisch zou worden gevonden dat de klassengrootte géén invloed heeft op de prestaties, kan dat altijd nog worden verklaard uit het feit dat het flankerend beleid kennelijk onvoldoende is geweest om de door klassenverkleining gecreëerde voordelen te benutten.

Maar de commissie draagt ook materiaal aan om te laten zien dat leerlingen in grote klassen wel degelijk minder goed presteren dan leerlingen in kleine klassen. Voor die onderbouwing worden brokstukken bewijs geleverd die zijn ontleend aan internationaal onderzoek, de mening van door de commissie gehoorde deskundigen, onderzoek op basis van Nederlandse gegevens, en internationaal vergelijkende gegevens.

Het meeste onderzoek uit andere landen geeft weinig aanleiding voor de stellingname dat kleine klassen gepaard gaan met betere leerprestaties. Op een paar na. Het bekendst daarvan is het recente STAR-experiment, uitgevoerd in de Amerikaanse staat Tennessee. In dit onderzoek zijn in 79 scholen drie soorten groepen gevormd: klassen van 13-17 leerlingen, klassen van 22-25 leerlingen, en klassen van 22-25 leerlingen met een fulltime onderwijsassistent. Gevonden wordt dat zowel voor taal als voor rekenen leerlingen in de kleine klassen belangrijk beter scoren dan die in de grote klassen. De aanwezigheid van een onderwijsassistent heeft geen invloed op de prestaties.

BUITEN DE ORDE

Dit lijkt sterk bewijs, maar er zijn belangrijke kanttekeningen. Ten eerste: scholen deden op basis van vrijwilligheid mee aan het experiment, en niet - zoals wetenschappelijk zou moeten - door toewijzing op grond van het toeval. Ten tweede: de klassengrootte waar de betere resultaten worden vastgesteld is die van dertien tot zeventien leerlingen. Dit is aanzienlijk buiten de orde van grootte van 25 leerlingen waarover de discussie in Nederland wordt gehouden. Er zijn geen aanwijzingen dat vergelijkbare effecten ook bij andere schalen worden gerealiseerd. Ten derde: de onderwijzers van de grote klassen hadden er persoonlijk belang bij om het experiment te laten slagen, omdat zij dan in de toekomst ook met kleinere klassen kunnen werken. Evenzo hadden leerkrachten in kleine klassen reden om er een schepje bovenop te doen: om het werken in kleine klassen ook voor de toekomst veilig te stellen.

De commissie heeft ten behoeve van haar standpuntbepaling een aantal deskundigen geraadpleegd. Waarom juist deze deskundigen zijn geselecteerd en geen anderen wordt niet verantwoord. Wat opvalt is dat hun aantal beperkt is: slechts zeventien. Kinderen zijn niet gehoord.

Met de mening van de deskundigen wordt nogal opportunistisch omgegaan: als die mening voor het betoog niet uitkomt, wordt die aan de kant gezet ten gunste van uitkomsten uit buitenlands onderzoek. Dat kan natuurlijk best als dat buitenlands onderzoek overtuigend is, maar waarom zouden we de deskundigen dan op andere plaatsen wel moeten geloven? Bovendien wordt nooit aangegeven hoeveel deskundigen een bepaalde mening aanhangen. Verhullende formuleringen als: 'opvatting van deskundigen ..', 'Deskundigen vinden ...', worden gebruikt. Hoewel dat er niet expliciet bij staat, suggereren die formuleringen dat kennelijk niet alle deskundigen dezelfde mening zijn toegedaan. Ook dat kan natuurlijk best, maar zonder uitgebreide verslaglegging van wat alle geraadpleegde deskundigen ergens van vinden, zijn zulke opmerkingen weinig waard. En zelfs als de geraadpleegde deskundigen wel unaniem zouden zijn, is hun aantal te klein, en is bovendien niet vermeld op basis waarvan zij wel en anderen niet geraadpleegd zijn.

De derde bron van bewijs voor de stelling dat klassenverkleining gunstig is voor leerprestaties wordt gevormd door een speciaal voor de commissie uitgevoerd onderzoek van Roel Bosker en Joop Hox. Dit onderzoek is als bijlage bij het rapport gevoegd. De onderzoekers zijn op basis van het zogenoemde PRIMA-cohort nagegaan wat de relaties zijn tussen klassengrootte enerzijds en variabelen als rekenvaardigheid, taalvaardigheid, welbevinden van leerlingen en het functioneren van leerkrachten (werkbeleving en attitude) anderzijds. Wie de hoofdtekst leest en de aankondiging van het rapport heeft gevolgd, verwacht dat in deze bijlage het onomstotelijk bewijs wordt geleverd dat kleinere klassen betere scores op deze variabelen opleveren. Maar dat is geenszins het geval.

De effecten van klassengrootte op reken- en taalvaardigheid zijn afzonderlijk berekend voor jaargroep 2 enerzijds en jaargroepen 4, 6 en 8 anderzijds. Voor rekenvaardigheid in jaargroep 2 wordt gevonden dat leerlingen in klassen van 5-9, 10-14 en 15-19 leerlingen het even goed doen als leerlingen in klassen van 20-24 leerlingen: geen effect van klassengrootte derhalve. 'Tweede-groepers' in klassen van 25-29, 30-34 en 35-39 leerlingen scoren slechter dan leerlingen in klassen van 20-24 leerlingen.

Maar het patroon is bepaald niet monotoon: in klassen van 30-34 doen leerlingen het weer beter dan in klassen van 25-29; en 35-39 scoort even goed als 25-29. De rekenvaardigheid van 2de-groepers gaat er dus op vooruit als leerlingen uit een klas van 25-29 naar een kleinere klas van 20-24 kinderen gaan. Maar een deel van de vooruitgang wordt ook geboekt als diezelfde leerlingen in een veel grotere klas, van 30-34, worden ondergebracht. Belangrijk verschil is natuurlijk dat klassenverkleining geld kost en klassenvergroting geld bespaart.

De samenhang tussen klassengrootte en rekenvaardigheid bij 4de-, 6de- en 8ste-groepers is nog opmerkelijker. Er zijn geen significante verschillen in rekenprestaties tussen leerlingen in klassen van 5-9, 10-14, 15-19, 20-24 of 25-29 leerlingen. Leerlingen in klassen van 30-34 scoren significant beter (!), en alleen als de klassen meer dan 35 leerlingen bevatten zijn de prestaties slechter. Onthutsend is hoe selectief deze bevindingen in de hoofdtekst zijn opgenomen. ''De effecten die gerapporteerd zijn voor jaargroep-2-leerlingen in Nederland zijn behoorlijk groot (...) Voor de hogere groepen zijn de bevindingen minder geprononceerd... Desalniettemin zijn er indicaties dat leerlingen in klassen van 35 of meer leerlingen enigszins achterblijven in hun leerprestaties vergeleken met leerlingen in kleinere klassen'' (p.78). Dat leerlingen in grote (30-34) klassen het beter doen dan leerlingen in kleine (5-29) klassen, wordt verzwegen.

TAALVAARDIGHEID

Op het domein van de taalvaardigheid is het beeld niet veel anders. En de samenhangen tussen klassengrootte enerzijds en het welbevinden van leerlingen, de werkbeleving van leerkrachten en de attitudes van leerkrachten anderzijds zijn snel samengevat: er is geen samenhang.

De laatste bron van bewijs wordt tot slot gevormd door tabellen met internationaal vergelijkende cijfers. In het rapport worden voor 15 landen gegevens gepresenteerd over de gemiddelde klassengrootte in het basisonderwijs en de uitgaven per leerling. Alleen Spanje, Nieuw-Zeeland en Ierland hebben gemiddeld grotere klassen dan de 25,7 van Nederland. Qua uitgaven per leerling zijn alleen Hongarije, Spanje, Nieuw-Zeeland en Ierland zuiniger. In een andere tabel worden voor 27 landen de gemiddelde leerlingscores voor begrijpend lezen van 9-jarigen gegeven. Nederland neemt in deze tabel een 21ste positie in: vlak achter Hongarije en Slovenië en vlak voor Cyprus en Portugal. Finland, de Verenigde Staten en Zweden voeren deze ranglijst aan.

De commissie concludeert uit deze twee tabellen “dat de gemiddelde leerling/leerkracht-ratio in Nederland te hoog is” (p.37). Dit is gebaseerd op de positie van een enkele waarneming (Nederland) in de twee tabellen.

Alle landen uit de eerste tabel komen echter ook in de tweede tabel voor, en het is verleidelijk om na te gaan of het gesuggereerde verband ook voor de 14 andere landen opgaat. Daartoe hebben we een regressievergelijking geschat met de gemiddelde leerlingscore begrijpend lezen als afhankelijke variabele en klassengrootte en uitgaven per leerling als verklarende variabelen.

BEGRIJPEND LEZEN

Anders dan de suggestie die gewekt wordt door de plaats van Nederland in de tabellen, vinden we nu geen negatieve samenhang tussen klassengrootte en prestatie-score. Zelfs is het zo dat bij gegeven uitgaven per leerling, leerlingen in landen waarin de gemiddelde klassengrootte groot is, beter scoren dan leerlingen in landen waarin de gemiddelde klassengrootte klein is. Wel blijkt er een significant verband te bestaan tussen uitgaven per leerling en prestaties: uitgaven per leerling die 35 procent boven het OESO-gemiddelde liggen (zoals in de Verenigde Staten het geval is) gaan gepaard met een gemiddelde leerlingscore op begrijpend lezen die een standaardafwijking boven het gemiddelde ligt.

Ook ten aanzien van dit bewijsstuk is de conclusie duidelijk: vergelijking van internationale gegevens over klassengrootte en leerlingscores wijzen niet op een negatieve samenhang tussen beide grootheden. Eerder lijken er aanwijzingen te zijn voor een positieve samenhang.

De conclusie is onvermijdelijk: er is geen bewijs dat kleinere klassen leiden tot betere leerprestaties. We hebben echter niet de illusie dat onze stellingname veel invloed zal hebben op de besluitvorming. Te veel mensen met gevestigde reputaties hebben hun naam reeds aan dit onzalige idee verbonden. Maar als er dan toch geld over de balk gesmeten gaat worden, dan hopen we dat Nederlandse onderwijsbeleidsmakers daarbij voor een werkelijk experimentele opzet zullen kiezen. Een opzet waarbij de maximale klassengrootte per regio verschilt en waarbij het lot bepaald heeft welke regio welke maximale klassengrootte heeft. Dan kan in elk geval wetenschappelijk worden onderbouwd dat met geld is gesmeten.

    • Dinand Webbink
    • Hessel Oosterbeek