De computer weet: deze patiënt krijgt straks een aanval

Digitale gezondheidszorg Agressie bij verwarde mensen voorspellen of levensgevaar op de intensive care. Ziekenhuizen verwachten veel van data-analyse met kunstmatige intelligentie.

Illustratie Pepijn Barnard

‘Als ik dit op de afdeling vertel, vallen de monden open. Computers die agressie voorspellen? Hoe dan?”, zegt Margo Faay (31), verpleegkundige en beleidsmedewerker bij academisch ziekenhuis UMC Utrecht. Vincent Menger (29), datawetenschapper bij de Universiteit Utrecht, lacht bescheiden.

Hij heeft een algoritme ontwikkeld dat beter dan behandelaars kan voorspellen wat de kans is dat patiënten agressief worden. Een mooie innovatie, vinden medewerkers van de afdeling psychiatrie van het UMC Utrecht. Maar ze worstelen er ook mee: hoe gaan ze het op een ethische manier in de praktijk inzetten?

Academische en topklinische ziekenhuizen door het hele land experimenteren met de voorspellende kracht van data-analyse. Zo schat het UMC Maastricht met een computermodel het risico op zwangerschapsdiabetes en -vergiftiging in. In het Radboud UMC in Nijmegen krijgen patiënten op sommige afdelingen al een persoonlijke risicoscore. Die voorspelt continu of ze de komende vier tot zes uur stabiel blijven, voor- of achteruitgaan.

Er bestaan al algoritmen die het levensgevaar van een patiënt in het ziekenhuis berekenen, de ernst van een telefoontje naar de huisartsenpost en de kans dat een patiënt zelfmoord pleegt. Ziekenhuizen financieren de innovatie voor het grootste deel nog zelf. Zorgverzekeraars tonen zich geïnteresseerd.

Raadselachtig

Levens redden, ziektes voorkomen of eerder opsporen: de beloftes van data-analyse in de zorg zijn aantrekkelijk. Maar als het om de praktische toepassing gaat, blijven ziekenhuizen en zorginstellingen vaak nog weifelend op de drempel staan. Soms zijn er praktische redenen, zoals de noodzaak voor aanvullend wetenschappelijk onderzoek, maar ook omdat een computer op de doktersstoel ethische bezwaren oproept.

Zo ook in Utrecht. Faay en Menger zitten in een overleggroep die nadenkt over hoe en wanneer het algoritme zal worden ingezet op de afdeling psychiatrie. Het ziekenhuis praat er ook met patiënten over. Een van de vragen die voorligt: zouden zij wel of juist niet willen weten dat het de computer is die hen aanwijst als potentieel agressief?

Het algoritme is een black box, ongelooflijk ingewikkeld. Het heeft zichzelf met drieduizend dossiers geleerd te voorspellen wie van de psychiatrisch patiënten een hoge kans heeft binnen een maand agressief te worden. De computer zocht met kunstmatige intelligentie verbanden in de notities van behandelaars in dossiers. Dat het algoritme werkt, is aangetoond door het behalve in het UMC Utrecht ook in een Rotterdamse GGZ-instelling te valideren. Maar hoe de computer precies tot zijn oordeel komt, bleef raadselachtig.

Rood: noodmedicatie

Een student informatiekunde aan de Universiteit Utrecht heeft daarom tien weken aan een tweede algoritme gewerkt, om inzichtelijk te maken hoe het eerste tot z’n conclusies komt.

„Zal ik het je laten zien?”, zegt Menger tegen Faay. Hij klapt zijn laptop open. „Kijk, deze tabel gaat over een patiënt met een laag risico op agressie. De groene woorden aan de linkerkant zijn, in relatie tot de rest van de tekst, indicatoren voor een laag risico. De rode woorden rechts van de streep staan voor een hoog risico.”

Groen zijn de woorden: ‘genieten’, ‘piekeren’, ‘leven’ en ‘suïcidaal’. Rood: ‘schopt’, ‘gevaar’ en ‘noodmedicatie’.

„Het algoritme kijkt naar de woorden en geeft die een bepaald gewicht in de context van de hele tekst. Dat is de crux, daarom is het zo moeilijk uit te leggen”, zegt Menger. „Het woord ‘contact kan bijvoorbeeld positief of negatief zijn.”

Hij schakelt over op een patiënt bij wie de computer waarschuwt voor agressie. Een groen woord is: ‘associatief’. Rode woorden zijn: ‘politie’ en ‘grensoverschrijdend’. Maar ook: ‘vragen’ en ‘deur’. „Deur herken ik wel uit de praktijk”, zegt Faay. „Patiënten die deuren dichtslaan bijvoorbeeld.”

De kansberekening zou als vrijblijvende waarschuwing kunnen dienen voor behandelaars, legt Faay uit. „In overleg met de patiënt kan worden afgesproken hoe agressie wordt voorkomen: extra medicatie, familie die blijft slapen op de afdeling, sporten of gewoon af en toe een wandeling.”

Illustratie Pepijn Barnard

Zelfmoord voorspellen

Het algoritme van Menger werkt door text mining: data-analyse van lappen tekst. Het Nederlands instituut voor onderzoek van de gezondheidszorg Nivel deed in een proef iets vergelijkbaars: zelfmoorden voorspellen op basis van huisartsendossiers. Twee op de drie keer werd, in een onderzoek met data uit het verleden, door de computer herkend dat de patiënt een zelfmoordpoging zou doen. De huisarts herkende dat risico tijdens het laatste consult ‘maar’ bij één op de drie gevallen.

De computer woog onder meer mee of het merendeel van de consulten over psychische problemen ging en of patiënten überhaupt veel consulten hadden. Het algoritme wordt nu verder gevalideerd. De onderzoekers willen het eerst doorgronden voor ze het durven aanbieden aan huisartsenpraktijken.

Willem Herter, promovendus bij het Leids UMC en ondernemer in databedrijf Pacmed, maakt ook zo’n algoritme met text mining. Hij wilde iets doen tegen de drukte op huisartsenposten. Die zijn bedoeld voor ernstige problemen. Alleen: patiënten gaan er vaak voor wissewasjes heen, omdat ze niet tijdens werktijd hun huisarts willen bezoeken. Een triagist, een mbo-geschoolde doktersassistent, moet de urgentie taxeren, maar schat die gemiddeld hoger in dan nodig.

Herter maakte een algoritme dat tijdens het telefoongesprek, aan de hand van de aantekeningen van de telefonist, berekent hoe ernstig de situatie is. „Naast huisartsenposten tonen ook meldkamers interesse voor zulke algoritmes”, zegt Herter.

Hij doet promotieonderzoek naar machine learning in de zorg. „Deze innovatie hangt boven de markt, maar de stap tussen software ontwikkelen en op de markt brengen is best wel groot.”

Dat herkent Paul Elbers, arts op de intensive care van Amsterdam UMC, locatie VUmc. Zijn dataproject draait wél in de praktijk, zij het als proef. Het gaat om software die voorspelt hoeveel antibiotica een patiënt op de intensive care nodig heeft.

Artsen op de intensive care krijgen nu advies van de computer over de antibioticadosering. „Wij vonden het verbazingwekkend dat elke patiënt een standaardhoeveelheid antibioticum krijgt”, legt hij uit. „Ridicuul, als je erover nadenkt. Naast lengte of gewicht verschilt ook de mate van afbraak door het lichaam als je ziek wordt. Bij een one size fits all-benadering weet je zeker dat je voor een heleboel patiënten niet goed zit.”

Hoe logisch ook, het duurde nog een jaar voor de voltooide software aan het bed beschikbaar kwam. Elbers: „Aanpassingen waren nodig aan de IT-infrastructuur, we moesten goedkeuring krijgen van een ethiekcommissie, het moest voldoen aan de privacywetgeving, er waren administratieve barrières en er horen goedkeuringen bij medische apparaten. Een beetje knettergek werden we er wel van.”

Kans op overlijden

Bij het Amsterdam UMC lopen ook andere data-analyseprojecten. Vergevorderd is het project om te voorspellen of het veilig is patiënten op de intensive care terug te sturen naar andere afdelingen in het ziekenhuis, of dat dan de kans op heropname of overlijden groot is.

De intensive care is een afdeling waar continu allerlei data verzameld worden, rechtstreeks uit de apparatuur aan het bed. „Door ervaring en medische kennis worden intensivisten goed in bepalen wie we veilig terug kunnen sturen naar de normale afdelingen”, zegt Elbers. „Maar ik denk dat een machine dat uiteindelijk vaker goed zal inschatten.”

Het Amsterdam UMC ontwikkelde samen met data-analysebedrijf Pacmed een algoritme door een computer verbanden te laten zoeken in gegevens van 20.000 patiënten. Een overzicht op een beeldscherm geeft straks per patiënt aan hoeveel procent kans er is op heropname of overlijden als die naar een andere afdeling gaat.

De computer maakt z’n berekening met onder meer informatie over de ziekte en prestaties van de vitale functies, maar bleek ook naar verrassende dingen te kijken. „Zoals niet alleen de temperatuur, maar ook hoe váák de temperatuur gemeten is”, zegt Elbers. „En dus of er zorgen waren om de patiënt. Normaal kijken artsen alleen naar waardes, niet het aantal metingen.”

Het ziekenhuis hoopt de druk op de intensive care in de toekomst te kunnen verlagen. Personeel is lastig te vinden en bovendien is het een dure afdeling; zorgverzekeraars betalen tussen de 2.600 en 2.700 euro per zieke per dag.

Pionieren

Hoe nuttig voorspellen van zelfmoord of gezondheidsrisico’s ook kan zijn, er zijn nadrukkelijk kanttekeningen te maken bij deze vorm van pionieren. Zo gebeurt toekomst voorspellen slechts met data uit het verleden. En belangrijker: het algoritme kijkt nooit naar de héle situatie.

Data-analyse gaat meestal over kwantitatieve data, zoals bloeddruk die wordt gemeten als de patiënt binnenkomt. „Maar wanneer een patiënt bleek ziet en een raar geurtje heeft, is dat context, kwalitatieve data”, zegt Herter. „Die kan nog belangrijker zijn.”

Daarom vinden veel ontwikkelaars dat een computermodel niet zelfstandig beslissingen mag nemen. „Het moet beslisondersteuning zijn, in plaats van een beslisser”, zegt Elbers. „Artsen moeten kunnen besluiten ertegenin te gaan. Een dokter, die vroeg bij de ontwikkeling van het algoritme betrokken was, kan een goede barrière zijn, zodat er niks misgaat.”

Om te zorgen dat artsen een goede afweging kunnen maken, zijn experts het ook over iets anders eens: de arts móét begrijpen hoe het algoritme tot een oordeel komt. Zodat, zegt Willem Herter, „de arts ook de beperkingen van een algoritme begrijpt. We mikken daarom op algoritmes die je aan de arts kan uitleggen.”

Menger kon tijdens zijn onderzoek naar het voorspellen van agressie kiezen tussen verschillende algoritmes, van een relatief overzichtelijke ‘beslisboom’ tot een héél ingewikkeld model – dat het best presteerde. Hij koos het laatste. Nu werkt hij samen met het UMC Utrecht, om de medewerkers van de afdeling psychiatrie beter te kunnen uitleggen hoe het werkt.

„Er zijn algoritmen die zo complex zijn dat ze uitgeprint duizenden A4’tjes beslaan en over honderden kenmerken gaan”, zegt Herter. „De arts moet de belangrijkste redenen snappen die ervoor zorgen dat de patiënt in de richting van een bepaalde uitslag wordt geduwd. Bijvoorbeeld door het op een slimme manier te visualiseren.”

Eenvoudig is het niet, blijkt in het UMC. Menger: „Het openen van de black box is een redelijk nieuw vakgebied.”