Turven met taal

Bij het leren van een taal spelen omgevingsfactoren én erfelijke aanleg een rol. On line statistisch leren, een techniek die baby's van acht maanden al beheersen, heeft beide componenten in zich.

Wie op de universiteit van Rochester undergraduate is bij de afdeling `Brain and Cognitive Sciences', loopt gerede kans door Elissa Newport te worden geronseld om mee te doen aan een taalexperiment. Tegen een vergoeding van $6.00 of $7.50, al naar gelang de tijd die het kost en de toestand van de kas, nemen studenten plaats in een geluiddichte cel, waarna de synthetische vrouwenstem Victoria ze minutenlang vergast op series `aan elkaar geplakte', monotoon uitgesproken nonsenswoorden: dikitaepokigakegubugutaedi... Na ruim twintig minuten is het leed geleden en mag de student in een test zijn kennis van de zojuist `verworven' kunsttaal etaleren.

Newport, hoogleraar op Rochester sinds 1988, doet dit type onderzoek naar taalverwerving al tien jaar. Behalve artificiële miniatuurtaaltjes in het lab heeft ook het leren van natuurlijke talen, met name gebarentaal, haar belangstelling, en in experimenten werkt ze zowel met baby's, kinderen als volwassenen. Haar doel: achterhalen wat precies de mechanismen achter taalverwerving zijn, en hoe het komt dat het leren van een taal razendsnel en met groot succes verloopt. Vorige week gaf Newport in Seattle op de jaarbijeenkomst van de AAAS (American Association for the Advancement of Science; de vereniging die het tijdschrift Science uitgeeft) een overzicht haar (deels nog ongepubliceerde) resultaten.

De centrale notie in Newports onderzoek is statistical learning. Een belangrijk deel van het taalverwervingsproces, zo is de stelling, heeft te maken met statistiek: wie een stroom klanken krijgt aangeboden houdt bij hoe vaak bepaalde klanken samengaan, hoe vaak woorden in dezelfde context gebruikt worden, etcetera. Die statistische patroonkennis komt goed van pas zodra het erom gaat on line, dus razendsnel, uit te maken of een aangeboden taalfragment `klopt' of dat er sprake is van foutief gebruik.

vrouwenstem

Statistisch leren trok december 1996 voor het eerst wijd de aandacht toen Newport samen met collega's Jenny Saffran en Richard Aslin het effect aantoonde in een laboratoriumexperiment met baby's van acht maanden. Het leverde het drietal een publicatie in Science op. De onderzoeksopzet was als volgt. Na op hun gemak gesteld te zijn kregen de kinderen twee minuten lang van een vrouwenstem uit een spraaksynthesizer een continue, monotone klankenstroom te horen. Het ging om willekeurige opeenvolgingen van vier drielettergrepige nonsenswoorden: tupiro, golabu, bidaku en padoti, in een tempo van 270 lettergrepen per minuut. Aanduidingen waar een woord ophield of begon, zoals pauzes of toonhoogteverschillen, ontbraken totaal. Om woorden uit de stroom te vissen waren de kinderen dus aangewezen op louter statistische informatie. Bijvoorbeeld: terwijl tu altijd werd gevolgd door pi, was dat (door de willekeurige volgorde van de woorden) bij de combinatie bu en bi maar in eenderde van de gevallen zo. Wisten de kinderen, zo vroeg Newport zich af, raad met zulke statistiek?

Ja, luidde het antwoord. Toen de baby's na afloop van de twee minuten nonsenstaal één drielettergrepenwoord te horen kregen, toonden ze significant meer belangstelling als het om een `verhaspeld' woord ging met de lettergrepen op de verkeerde plaats, bijvoorbeeld pirotu, dan bij een correct woord als tupiro. Het nieuwe trekt meer aandacht dan het vertrouwde (zeker bij baby's), maar dan moeten de kinderen dat onderscheid wel kunnen maken. Conclusie: kinderen van acht maanden destilleren op basis van on line bedreven statistiek woorden uit een klankenrij.

Om meer zekerheid te krijgen omtrent de juistheid van deze interpretatie, werd het verhaspelen van woorden in een tweede experiment subtieler ingekleed. Ditmaal kregen de baby's na de twee minuten nonsenswoorden niet als alternatieven een correct woord en een geheel verhaspeld woord te horen, maar een correct woord en een samengesteld woord (`part word'). Dat laatste bestond uit de laatste lettergreep van een woord gevolgd door de eerste twee lettergrepen van een ander woord, bijvoorbeeld rogola. Ook deze samenstellingen (die uit de klankenrij te snijden zijn), zo bleek, trokken langer de aandacht en dat houdt in dat twee minuten voor de baby's van acht maanden voldoende was om de grenzen tussen de woorden vast te stellen en te onthouden.

Kinderen van 5 à 6 jaar bleken hetzelfde kunstje te beheersen, zonder vooraf ook maar te zijn geattendeerd op de klankenrij – in hun geval achtergrondgeluid tijdens een kleuropdracht. Hetzelfde gold voor volwassenen. Statistisch leren beperkt zich niet tot nonsenswoorden. Het experiment is in dezelfde opzet herhaald met reeksen van drietonen in plaats van woorden van drie lettergrepen, met vergelijkbaar resultaat. Ook met visuele input (patronen van oplichtende blokjes in een 43-matrix op een computerscherm) en bij een motorische taak (het indrukken van steeds wisselende oplichtende knoppen) lukte het volwassenen de `woord'-grenzen te determineren. Zelfs zijdeaapjes bleken – al mochten ze langer aan de taal wennen – de kunst van het statistische leren te beheersen.

Twee vragen dienden zich nu aan. Gebruiken taalverwervers deze statistische aanpak om imperfecte taal te stroomlijnen? Filteren ze regels uit taalaanbod met een enigszins diffuus karakter waarin niettemin een patroon schuilgaat? En een tweede vraag: is de techniek van het statistisch leren ook op complexere patronen van toepassing dan die tussen aangrenzende elementen? En zo ja, wat zijn de beperkingen?

Om met het laatste te beginnen: in het komende maartnummer van Cognitive Psychology publiceren Elissa Newport en Richard Aslin over onderzoek naar statistisch leren in geval van patronen in niet-aangrenzende taalelementen, zoals die tussen twee lettergrepen gescheiden door een derde. Voor het overige was de aanpak dezelfde als die bij de eerdere experimenten, zoals hierboven beschreven.

Neem de volgende nonsenswoorden: badite, bakute, batote, bapate; gudido, gukudo, gutodo, gupado, en nog zo wat. De onderliggende structuur bestaat in dit geval uit de vormen ba-te, gu-do, pi-ra, ke-du en lo-ki, terwijl op de plaats van het streepje di, ku, to of pa ingevuld dient te worden. In totaal geeft dat twintig drielettergrepige woorden. Het systeem is dat de eerste en derde lettergreep voor 100 procent aan elkaar gekoppeld zijn: op ba volgt steeds te en na gu komt altijd do, etc. Maar tussen naaste buren, binnen of buiten een woord, is de correlatie veel lager: 20 of 25 procent. Aan de proefpersonen de taak om, na drie keer zeven minuten een monotone woordenrij te hebben ondergaan, in een testje na afloop uit te maken of een woord `echt' was of niet. Onechte woorden (part words) bevatten steeds twee lettergrepen van een echt woord, terwijl de derde lettergreep van een ander woord (van een andere vorm) afkomstig was: bakudo, etc.

De verrassende uitkomst: proefpersonen hadden het bij deze opzet in minder dan 50 procent van de gevallen goed. Ze presteerden dus nog onder het kansniveau. Wat kon hiervan de verklaring zijn? Was het vocabulaire van twintig woorden te groot? Maakte het feit dat het om een patroon in niet-naaste buren ging de keuze tussen `echt' en `onecht' opeens aanzienlijk zwaarder? In een serie vervolgexperimenten probeerden Newport en Allis van alles aan variaties uit: proefpersonen mochten langer dan 21 minuten luisteren (één pechvogel werd tien dagen achtereen aan de nonsenstaal blootgesteld); het werd ze eenvoudiger gemaakt door in de test de `part words' te vervangen door `non words' met dezelfde drie lettergrepen maar dan in een volgorde die de spraakstroom nooit te horen gaf. De proef werd overgedaan met andere lettergrepen en ook werd de taal stapsgewijs steeds simpeler gemaakt: geen twintig woorden meer maar twaalf of zes (respectievelijk vier basisvormen en drie tussenlettergrepen, dan wel van beide één minder). Het maakte allemaal niets uit, steeds bleven de prestaties van de proefpersonen onder het kansniveau van vijftig procent. Was bij aangrenzende lettergrepen statistisch leren een fluitje van een cent, nu ontbrak het totaal.

Als aanloop naar een mogelijke verklaring wijst Newport er op dat patronen tussen niet-aangrenzende lettergrepen in natuurlijke talen nauwelijks voorkomen. Zou statistisch leren bij alternatieve patronen, zoals regelmaat in niet-aangrenzende klinkers of in niet-aangrenzende medeklinkers, wel optreden? Talen als het Arabisch of Hebreeuws bezitten stammen van medeklinkers terwijl tussenliggende klinkers zaken als enkelvoud / meervoud of tegenwoordige tijd / verleden tijd aangegeven. Het Turks is weer een voorbeeld van een taal met klinkerharmonie: binnen een woord komen alleen bepaalde combinaties klinkers voor.

En dus ontwierpen Newport en Aslin nieuwe nonsenstalen met óf een patroon tussen niet-aangrenzende klinkers, óf een patroon tussen niet-aangrenzende medeklinkers. Dat leidde tot woorden van de vorm p-g-t of d-k-b, met op de plaats van de streepjes een van de klinkers a, i, ae, o, u of e. Of van de vorm -a-u-e of -o-i-ae met op de plaats van de streepjes een van de medeklinkers p, g, t, d, k en b – twee minikunsttalen met een vocabulaire van twaalf drielettergrepige nonsenswoorden met ingebouwde regelmaat. Een nieuwe lichting studenten `Brain and Cognitive Sciences' werd onderworpen aan de vertrouwde proefopzet: 21 minuten monotone woordenstroom en een testje na afloop. Bij beide minitaaltjes, zowel die met patronen tussen medeklinkers als tussen klinkers, gaven de proefpersonen ditmaal wél blijk van statistisch leren. Bij het kiezen tussen echte woorden en `part words' zaten ze in 70 à 80 procent van de gevallen goed.

Conclusie: ook bij niet-aangrenzende elementen speelt statistisch leren een rol, maar niet altijd. Het lijkt erop, aldus Newport, dat patronen in kunstmatige nonsenstalen waarbij het effect optreedt lijken op patronen die in natuurlijke talen daadwerkelijk voorkomen. Andersom: in zijn talen gebruikt de mens – apen haken bij deze complexiteit af – alleen die niet-lokale patronen waarmee hij cognitief overweg kan. En een afperking van het aantal patronen dat we aankunnen is geen overbodige luxe omdat het on line bijhouden van alle mogelijkheden anders al snel uitdraait op gekkenwerk.

Onderzoek naar het stroomlijnen van taal door gebruikers die haar op imperfecte wijze krijgen aangeboden, is een tweede onderzoekslijn van Elissa Newport. Ook in dit soort situaties spelen statistische effecten. Onderzoek naar kinderen die hun moedertaal leren van ouders/verzorgers die die taal zelf niet vloeiend spreken, wordt aangevuld met laboratoriumexperimenten waarin proefpersonen op gecontroleerde wijze in een variabel `morsige' leeromgeving opereren. Het taalaanbod is statistisch in de zin dat het toepassen van een morfologische regel, zoals een meervoudsvorm, in een bepaald percentage van de gevallen correct verloopt, met voor de rest tal van fouten die onderling sterk variëren.

Kinderen, zo wees Newports onderzoek uit, stijgen in zulke omstandigheden boven het niveau van de taalaanbieder uit. Aanwezige statistische patronen, zelfs als die bedolven gaan onder veel ruis, nemen zij in verscherpte mate over.

Dove kinderen die gebarentaal (American Sign Language of ASL) leren zijn in dit verband een zeer waardevolle onderzoeksgroep. Ouders leren hun dove kind van jongs af aan ASL, zo goed en zo kwaad als het gaat. Zoals in het geval van `Simon' (niet zijn echte naam). Simon, gedeeltelijk doof, is enig kind van twee dove ouders die zichzelf pas als jong volwassene ASL eigen maakten. Dat Simon alleen van zijn ouders ASL krijgt, die het zelf lang niet foutloos toepassen, maakt dit gezin tot een ideaal onderzoeksobject. Vanaf tweejarige leeftijd is de dove jongen in zijn beheersing van ASL gevolgd. Toen hij bijna acht jaar was werden zowel Simon als zijn ouders getest op hun gebruik van morfemen (betekeniseenheden) bij ASL-werkwoorden aangaande `bewegen'. De ouders deden het in 70 procent van de gevallen goed, een typisch getal voor late starters. Simons score daarentegen was bijna 90 procent. Ook bij andere gebaarmorfemen overtroffen zijn prestaties die van zijn ouders, al bleven ze iets achter bij die van native speakers van ASL.

taalaanbod

Newport heeft ook dove kinderen van horende ouders onderzocht.Zulke ouders zijn in de regel pas ASL gaan leren toen hun kinderen eraan toe waren, en in veel gevallen zijn hun prestaties ronduit belabberd. Het meest extreme geval in Newports onderzoek vormde `Sarah', een doof meisje met alleen een moeder die een score van een magere 15 procent neerzette. Toch had Sarah aan dit beroerde ASL-taalaanbod genoeg om het correcte gebruik van bewegingsmorfemen te destilleren: ze scoorde ruim 70 procent goed. Hoe kan dat? Newport houdt het er op dat kinderen uit het statistisch verspreide aanbod van correct en foutief morfeemgebruik `verscherpen': minder uitbundige variatie in fouten, vaker goed.

De situatie doet denken aan de vorming van creooltalen. Wanneer twee groepen mensen die elkaars taal totaal niet spreken (zoals in het verleden slaven en plantage-eigenaren) veel met elkaar omgaan ontstaat een pidgin of contacttaal. Die heeft nauwelijks grammatica, veel meer dan een serie woorden is het niet en redundantie ontbreekt. Zo'n pidgin kan zich ontwikkelen tot een creooltaal met grammatica. De vraag die Newport zich stelde was: speelt statistisch leren ook hier een rol?

Om dat uit te zoeken keerde ze terug naar het laboratorium. Proefpersonen kregen ditmaal in hun klankenstroom een patroon aangeboden dat niet consequent werd gehandhaafd: in een bepaald percentage van de gevallen bevatte het fouten. Vervolgens werden in experimenten diverse zaken gevarieerd: kinderen versus volwassenen, het percentage `correct' in het aanbod, en de mate van spreiding over foutieve alternatieven. In haar AAAS-lezing in Seattle gaf Elissa Newport een eerste voorlopig overzicht van de resultaten – het onderzoek loopt nog en publicaties zullen nog even op zich laten wachten.

Om te beginnen blijken kinderen het gemankeerde taalaanbod stukken beter te stroomlijnen dan volwassenen. Verder kwam uit experimenten naar voren dat zelfs bij een input waarbij het patroon in de meerderheid van de gevallen geschonden werd (op allerlei manieren; in het aanbod van gehanteerde vormen kwam de enig correcte nog wel het vaakst voor) de proefpersoon het patroon vaker goed toepast dan Victoria op de band. En al even opmerkelijk was dat het `creolisatie-effect', zoals Newport dit strakkere hanteren van het patroon noemt, sterker optreedt naarmate het aantal foute alternatieven, (de mate van scatter) hoger ligt. Voorbeeld: klopte het patroon voor 60 procent, met twee foute vormen die ieder 20 procent `pakten', dan was het creolisatie-effect beduidend geringer dan bij tien foute varianten die ieder 4 procent voor hun rekening namen.

Het onderzoek van Elissa Newport is nog lang niet afgerond en veel vragen die zich opdringen wachten nog op antwoord. Hoe zit het met de selectiviteit van statistisch leren? Hoe beïnvloedt statistisch leren onze kijk op natuurlijke taal? Intussen lijkt onbetwistbaar dat statistische leren bij taalverwerving een krachtig mechanisme is.