IBM bijna klaar met luister- en vertaalprogramma's

Computers die brieven vertalen, computers die een gesproken tekst op het scherm zichtbaar maken en computers waaraan je ku vragen hoe je naar het museum moet lopen. Tijdens een tweedaagse conferentie ('Computer Solutions in Science') die afgelopen maandag en dinsdag in het Noorse Bergen werd gehouden, liet IBM zien dat die dingen er al bijna zijn. Verschillende 'Scientific Centers' van IBM (er zijn er een stuk of tien) toonden hun vorderingen op het gebied van spraak- en taaltechnologie. Echt revolutionair waren de toepassingen niet, maar dat was ook niet de bedling. Wat Big Blue vooral wilde laten zien was hoe dicht de science fiction van gisteren al bij een commerciele toepassing staat.

Dr. Urike Schwab van het het Heidelberg Scientific Center uit Duitsland demonstreerde een programma voor 'machine vertalen' dat een Duitse, vrij gecompliceerde zakenbrief in vlekkeloos Engels vertaalde.

Niet bekend

Een toepassing die al bijna het produktiestadium heeft bereikt werd getoond door dr. Giorgio Sommi van het IBM Scientific Center in Rome.

Met een microfoon om de nek sprak hij staande voor eecomputer een volzin met een groot aantal medische termen uit. Met een achterstand van enkele woorden volgde het scherm hem op de voet. Deze toepassing van 'voice-recognition' is ontwikkeld voor een beperkt doel.

Radiologen plegen hun rapportjes in een microfoon in te spreken, terwijl ze langs de opgehangen foto's lopen. Nijvere secretaresses tikken de bandjes uit en tot slot controleert de radioloog of de tekst overeenkomt met hetgeen hij zei. De voortschrijdende stemherkenningstechniek maakte het mogelijk dit hle proces drastisch te vereenvoudigen. De radioloog spreekt zijn commentaar nog steeds in de microfoon, maar ditmaal gaan de elektrische signalen niet de bandrecorder, maar de computer in. Daar worden de binnenkomende elektrische trillingen gedigitaliseerd: zo'n 20.000 keer per seconde wordt een 'monster' van het signaal genomen waaraan een digitale code wordt toegekend. De getallenbrij die hier het gevo van is, wordt vervolgens vergeleken met een groot aantal woordcodes die zijn opgeslagen in een thesaurus. Deze vergelijking heeft een aantal kandidaten voor het juiste woord tot resultaat, die in volgorde van waarschijnlijkheid worden gerangschikt. Vervolgens komt er nog een afwegingsproces, waarin met gebruikmaking van in het programma opgeslagen semantische en grammaticale informatie een kansberekening wordt gemaakt. Als de uitgesproken zin 'de zon lacht' was, en het systeem in eerste instantie twijfelde tussen 'nacht', 'lacht' en 'macht', dan zal het op grond van de grammaticale kansberekening uiteindelijk de voorkeur geven aan 'lacht'. Hoewel de radiologen eerst even moesten trainen - de woorden moeten bijvoorbeeld door een korte pauze van elkaar worden gescheiden - blijkt het systeem goed te functioneren. Een van de pluspunten is dat het betrekkelijk sprekers-onafhankelijk is. In verschillende Italiaanse ziekenhuizen wordt het op dit moment reeds gebruikt.

Nog lang niet verkrijgbaar was het programma dat Dr. Peter Bosch (BM Stuttgart) toonde. Hij liet een tienregelige beschrijving van een museum zien, zoals die wel in toeristische folders voorkomt: met openingstijden, entreeprijzen, adres, aard van de collectie, etcetera.

Het programma (LEU-2 geheten) maakt het mogelijk aan deze informatie vragen te stellen in natuurlijke taal. Het intypen van de vraag 'is het museum om 14.00 uur open?' leverde een even kort als juist antwoord op ('ja'). Op de vraag naar de kortste route van het marktplein naar het museum antwodde de computer met een goed lopende zin van een regel of vier, waarin op efficiente wijze de weg werd gewezen.