Typen zonder toetsenbord

,,Spraak is niet alleen de toekomst van Windows, maar de toekomst van de informatica zelf'', sprak Bill Gates eind jaren negentig. Met de introductie van verschillende softwarepakketten zoals VoiceXpress van Lernout & Hauspie en Free Speech van Philips was er in die tijd sprake van een ware hype rond het fenomeen spraaktechnologie. Veel consumenten keken halsreikend uit naar een nieuwe generatie software. Het toetsenbord leek welhaast ten dode opgeschreven en Microsoft schafte gretig aandelen Lernout & Hauspie aan.

De eens zo succesvolle Belgische onderneming kwam echter op een roemloze manier aan haar einde. De hype werd gevolgd door een grote stilte en bij de grote spelers in de markt werden de bakens verzet.

,,Iedereen zag gouden bergen in die tijd'', vertelt Marcel Wassing, managing director Speech Processing Software bij Philips. Philips concentreert zich, wat spraaktechnologie betreft, alleen nog op de zakelijke markt. ,,De producten voor consumenten bleken jaren geleden niet erg aan te slaan. Te hoge verwachtingen waren daar veelal debet aan'', aldus Wassing. ,,Zo viel het veel gebruikers tegen dat de software eerst `getraind' moet worden, om zodoende de software te leren om de spraak van de gebruiker optimaal te herkennen.'' Philips is in de zakelijke markt overigens zeer actief met Speechmagic, een spraakherkenningproduct dat vooral wordt ingezet in de medische, juridische en financiële wereld. Wassing sluit niet uit dat Philips in de toekomst opnieuw met producten voor consumenten zal komen. ,,Ik verwacht dat het dan waarschijnlijk veel eerder om software zal gaan voor andere apparaten dan pc's, zoals pda's en apparatuur voor in de auto.''

Mark Erwich, marketing director bij Scansoft, is van mening dat de komst van de tablet pc een sterke impuls zal geven aan het gebruik van spraaktechnologie. Alleen al wegens het feit dat de alternatieven voor het invoeren van tekst op een tablet pc zo hun beperkingen met zich meebrengen. Scansoft is ook in Nederland zeer actief met software voor spraakherkenning. Daarvoor heeft het bedrijf de nodige kennis én 200 man personeel overgenomen van Lernout & Hauspie. Met de nieuwe versie van Dragon NaturallySpeaking richt het bedrijf zich echter niet alleen op het bedrijfsleven, maar ook op consumenten. Behalve dat NaturallySpeaking gebruikt kan worden voor het `besturen' van de pc met spraakcommando's, is het pakket vooral gemaakt voor het dicteren van teksten die dan vervolgens in programma's als Word, Outlook, Excel of Corel WordPerfect verschijnen. Met de Nederlandse versie van dit programma is het mogelijk te dicteren in het Nederlands, Duits, Engels en Frans. Om met Dragon NaturallySpeaking te kunnen werken, dient de gebruiker allereerst een aantal teksten die in beeld verschijnen in te spreken, zodat er een profiel kan worden vastgelegd waarbij de software de spraak van de gebruiker herkent. De luistervaardigheid van de software is van een hoog niveau. Dat het programma af en toe toch nog wat moeite heeft met bepaalde woorden, is eenvoudig te corrigeren. Woorden die niet worden herkend of niet voorkomen in de standaard woordenlijst van zo'n 250.000 woorden, kunnen afzonderlijk worden toegevoegd. Wie veel vakjargon gebruikt of in een omgeving werkt waar bepaalde namen, straatnamen of andere afwijkende woorden gebezigd worden, kan ook complete documenten met woorden toevoegen. Bij het trainen van de software is het belangrijk om de microfoon niet te dicht bij de mond te plaatsen, in een normaal tempo te spreken en duidelijk te articuleren. Het programma is behoorlijk snel. Bij de conversie van spraak naar tekst kan zelfs een snelheid worden gehaald van 160 woorden per minuut.

Om goed met de software te kunnen werken, moet zowel de gebruiker als de software door een leerproces. ,,De komende tijd zullen we ons intensief bezighouden met het verkorten van de trainingstijd. Uiteindelijk is het ons streven de software sprekersonafhankelijk te maken, waardoor de gebruiker sneller met de software uit de voeten zal kunnen. Nu moet iedere gebruiker immers een eigen profiel opbouwen en dat kost nu eenmaal tijd'', aldus Erwich.

Hoewel de kwaliteit van de software inmiddels een hoog niveau heeft bereikt, blijft het een gebruiker nog wel het nodige doorzettingsvermogen kosten om überhaupt te wennen aan deze totaal andere manier van werken.

In veel situaties kan het gebruik van spraakherkenning veel uitkomst bieden. Met name gebruikers met RSI-klachten, maar ook blinden en slechtzienden zullen met dergelijke software toch een hoge mate van productiviteit kunnen bereiken.

,,Zo'n drie jaar geleden boden pc's nog niet genoeg processorkracht om spraakherkenningsoftware goed te kunnen gebruiken. Inmiddels hebben we de kwaliteit van onze software aanmerkelijk kunnen verbeteren doordat het nu mogelijk is meer complexe algoritmes te gebruiken'', zegt Hans Engelberts, Sales Leader Enterprise Voice Systems bij IBM. Met ViaVoice, de spraakherkenningsoftware van IBM, is Big Blue een belangrijke marktspeler in Europa en Amerika. Met de onlangs geïntroduceerde tiende versie is de `luistervaardigheid' opnieuw verbeterd en reageert de software sneller op gesproken besturingscommando's. ViaVoice is er in diverse talen, maar vooralsnog niet in het Nederlands. In tegenstelling tot de software van Scansoft, is ViaVoice niet verkrijgbaar in de winkel, maar uitsluitend via het web (www.ibm.com/software/speech). De prijs van de software bedraagt 85 dollar. Een standalone versie van NaturallySpeaking kost 179 euro.

    • Laurens van Aggelen