Big Blue in Big Data

Supercomputer Watson versloeg de mens in spelshow Jeopardy!. Nu komt het echte werk: Watson gaat artsen en banken helpen met analyse van grote hoeveelheden data. Het begin van een nieuw digitaal tijdperk, denkt IBM.

Mocht er voor de volgende James Bond-film nog een spectaculaire locatie nodig zijn, dan is IBM’s hoofdlaboratorium in het Amerikaanse Yorktown Heights een goede optie. Alsof er net een gigantische vliegende schotel geland is in de bossen langs de Hudson-rivier.

Binnen, in een stampend datacentrum, staat supercomputer Watson die vorig jaar de populaire Amerikaanse spelshow Jeopardy! won van de twee beste menselijke kandidaten. Net zo’n historische overwinning als de IBM-computer die in 1997 grootmeester Kasparov versloeg in een schaaktoernooi.

Voor een supercomputer oogt Watson bescheiden: 90 snelle servers met een paars lampje erop – voor het dramatische effect. Aan de achterkant hangt de gebruikelijke kabelspaghetti. De echte kracht van Watson, legt IBM-onderzoeker Eric Brown uit, zit ’m in de software die natuurlijke taal begrijpt en kan leren van eerdere vragen. „Het is een combinatie van technologieën waar we al tientallen jaren aan werken.”

Van oudsher kunnen computers alleen overweg met data in vaste formaten. Maar Watson ‘snapt’ ook ruwe tekst; voor Jeopardy! werd bijvoorbeeld heel Wikipedia in het geheugen geladen. Ook medische dossiers, tweets of financiële berichtgeving kunnen gebruikt worden om een vraag te beantwoorden. Bovendien kan Watson zichzelf trainen met bestaande gegevens en zo slimmer worden.

Maar Google kan toch ook razendsnel in tekst zoeken? Dat is heel wat anders, legt Eric Brown uit. „Zoekmachines leiden je naar één document in een stapel data. Watson gebruikt alle gegevens om antwoorden samen te stellen en kan je uitleggen hoe de hypothesen zijn opgebouwd en hoe waarschijnlijk ze zijn.”

In andere woorden: niet zoeken naar een naald in een hooiberg, maar de hele hooiberg gebruiken om er een naald van te maken. Dat is nuttig in een tijd waarin bedrijven en instellingen grote hoeveelheden data verzamelen en willen analyseren.

Big Data is het modewoord dat daarbij hoort. De meeste managers, maar ook decision makers als artsen, vertrouwen op hun buikgevoel of op adviseurs die niet altijd objectief zijn. Watson heeft geen mening en kan een op feiten gestoeld advies geven. Al blijft de vraag wélke feiten je de computer voorschotelt.

Jeopardy! was een spelletje. Maar nu moet ‘Big Blue’, de koosnaam van het honderdjarige bedrijf, geld verdienen met Watson. Het onderzoeksteam van veertig man werpt zich nu op de medische sector. In samenwerking met onder meer verzekeraar Wellpoint (34 miljoen klanten) en het Memorial Sloan-Kettering ziekenhuis voor kankerbestrijding leert Watson nu medische dossiers, gesproken diagnoses, wettelijke voorschriften en vakliteratuur.

Wellpoint trainde Watson onder meer met 25.000 oude dossiers en test die kennis nu op 1.500 nieuwe patiënten. Voor de proef werken de IBM’ers nauw samen met medische specialisten. Eric Brown: „Het is geen wedstrijd meer; het gaat er niet om wie de betere diagnose stelt, Watson of de dokter. De arts krijgt een gefundeerd advies van Watson, kan inzien hoe de computer het bewijs voor de diagnose verzamelde. De mens neemt uiteindelijk de beslissing.”

Hoeveel de ontwikkeling van Watson gekost heeft, wil IBM niet kwijt. Maar het loopt in de miljarden: het project begon in 2005 en het terugverdienen moet nog beginnen. Watson past in IBM’s ‘Smarter Planet’-strategie en brengt de bedrijfsnaam bij het grote publiek onder de aandacht. IBM werd groot met ponskaartmachines en zakelijke main-frame computers maar staat in het gemeenschappelijk geheugen gegrift als uitvinder van de harddisk, de floppy en de personal computer. In 1981 legde de pc het fundament voor het tijdperk van MS-Dos en Windows. Maar omdat Microsoft IBM geen exclusiviteit beloofde, verwaterde het marktaandeel snel.

In 2005 stootte IBM de pc-divisie af en legde het zich toe op de zakelijke markt. Dat heeft de marktwaarde geen kwaad gedaan: IBM vecht met Microsoft om de plek van het meest waardevolle technologiebedrijf, na Apple. De pc-tak werd verkocht aan het Chinese Lenovo. Dat heeft nu IBM’s oude rivaal HP ingehaald als grootste computermaker. HP probeert zelf met de moeizame overname van het Britse Autonomy een plek te veroveren in de Big Data-markt.

IBM concurreert ondertussen met bedrijven als Oracle, SAP en EMC en groeide uit tot een kolos van 400.000 werknemers. Hardware vormt nog maar 8 procent van de inkomsten – de meeste omzet komt van software en dienstverlening.

De verwachtingen voor Watson zijn hooggespannen; ook de financiële sector en grote winkelketens hebben hulp nodig om hun Big Data te analyseren. Het wachten is op Watson 2.0, dat als smartphone-app zou moeten werken. Bernie Meyerson, directeur innovatie bij IBM, ziet al een opgevoerde versie van Apples assistent Siri voor zich. „Maar het duurt nog jaren voordat onze telefoons de rekenkracht van een supercomputer hebben.”

Zo stimuleert Watson ook IBM’s investeringen in de ontwikkeling van chiptechnologie. De afgelopen 19 jaar op rij legde IBM de meeste patenten vast. Volgens Meyerson heeft dat deels te maken met de zwakker wordende concurrentie: „Er was altijd een rijke onderzoekstraditie aan de Amerikaanse oostkust. Maar we zijn de enigen die overbleven .” Hij doelt op het wegvallen van roemrijke laboratoria, zoals Bell Labs (uitvinding transistor), Texas Instruments (uitvinding chip) en RCA (uitvinding televisie). Meyerson: „Vroeger was het een eer om de beste van de beste te zijn. Nu zijn we de beste omdat geen enkel ander bedrijf meer een groot laboratorium heeft dat fundamenteel onderzoek doet.”

IBM telt 3.000 onderzoekers en gaf in 2011 6,2 miljard dollar uit aan research, op een omzet van 107 miljard dollar. Dat is minder dan Microsoft of Oracle, maar IBM wist desondanks 6.000 patenten vast te leggen. Microsoft kwam tot 2.300 patenten.

In de IBM-kantine is de historie tastbaar: Robert Dennard eet er net een broodje. Hij is degene die in de jaren ’60 het computergeheugen (DRAM) uitvond dat anno 2012 in elke computer of gadget te vinden is. Dennard, inmiddels een tachtigjarige legende met een kast vol prijzen, komt nog vaak bij IBM over de vloer.

De wetenschappers werken sowieso tientallen jaren bij het bedrijf. Dat heeft te maken met de lange adem van de onderzoeksprojecten, zegt Supratik Guha. Hij geeft leiding aan 260 fysici: „We werken hier aan toepassingen voor de komende 20 tot 30 jaar – ontwikkelingen in hardware duren altijd langer dan software.”

IBM’s laboratoria balanceren op de grens van wetenschap en commercie. Wetenschap beoefen je niet in een ivoren toren, volgens de IBM-leer. Guha: „Dat is de reden dat we er nog zijn; onderzoek moet uiteindelijk geld opleveren. Alleen als je bij de absolute top van je vakgebied behoort kun je bij ons fundamentele research doen.”

Volgens Guha is het de kunst om schijnbaar kansloze projecten niet in de kiem te smoren. Al gaat het om exacte wetenschap bij een bedrijf dat analyse hoog in het vaandel heeft staan, er komt nog een hoop buikgevoel bij kijken als je met innovatie bezig bent, geeft Guha toe. „Veel baanbrekende uitvindingen begonnen met een fout, of leken in het begin onhaalbaar. Ze ontstonden omdat iemand de juiste intuïtie had en doorzette. En hoe bepaal ik met welke projecten we doorgaan? Ook ik gebruik mijn intuïtie.”

    • Marc Hijink