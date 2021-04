Duizenden mensen die rond de jaarwisseling een coronatest deden bij een GGD-locatie in Tilburg, werd gevraagd of ze wilden meedoen aan een onderzoek met zelfsneltesten. Zo ja, dan kregen ze na de coronatest een zelftestkist van een medewerker, die een korte uitleg gaf over de werking. De deelnemers kregen zo min mogelijk aanwijzingen, want thuis hebben mensen ook geen instructeur naast zich als ze een wattenstaafje in hun neus duwen.

Thuis deden de proefpersonen de test. Ze gaven de uitslag telefonisch of per e-mail door. Uit het onderzoek dat onlangs is gepubliceerd – als preprint – bleken de twee onderzochte zelftests vier van de vijf coronagevallen te detecteren. Met een andere maatstaf scoorden de zelftests, die gelden als de betere in hun soort, maar drie uit vijf.

De nogal dubbelzinnige uitkomst is exemplarisch voor de ontwikkeling en de wetenschappelijke evaluatie van diagnostische tests. Geneesmiddelen en vaccins worden pas toegelaten na lange onderzoeken met strikte protocollen en harde, precieze uitkomsten. De tests gelden als medische hulpmiddelen en de eisen daarvoor zijn beperkt. „Een CE-keurmerk kan redelijk eenvoudig worden verkregen” zegt Patrick Bossuyt, hoogleraar klinische epidemiologie in het Amsterdam UMC. Hij bestudeert al jaren de methoden voor het evalueren van tests voor bijvoorbeeld het opsporen van kanker of trombose en constateert: „De testevaluatie hinkt decennia achter bijvoorbeeld het geneesmiddelenonderzoek aan.”

Pretparken en musea

Niettemin is er bij de geplande heropening van Nederland een sleutelrol weggelegd voor de coronasneltesten, omdat die binnen een half uur een uitslag geven, anders dan de PCR-test bij de GGD. Deze week werden pilots gestart om onder meer pretparken, musea en sportevenementen te openen voor bezoekers die een negatieve testuitslag uit een teststraat kunnen tonen. Vorig week was de lancering van de eerste zelfsneltests, die school en werkplek veiliger moeten maken; het idee is onder meer dat studenten geregeld zichzelf testen om een dag per week te mogen terugkeren naar universiteit of hogeschool. Wie positief test blijft thuis en doet alsnog een PCR-test in een GGD-teststraat.

Of je zelf een kort wattenstaafje in je neus ronddraait of dat laat doen met een wat langer staafje, de coronasneltesten werken in principe hetzelfde: ze detecteren eiwitten van het SARS-CoV-2-virus, een antigeen. De kritiek op de antigeen(zelf)sneltests, die met name in het enthousiast testende Verenigd Koninkrijk luid klinkt, is ook hetzelfde: zelfs de beste tests zijn beperkt betrouwbaar. Wie negatief test kan toch besmet zijn, zeggen pandemie-experts, en mogelijk anderen besmetten als tijdens sociale contacten de anderhalvemeterregel wordt losgelaten – waarvoor werkgeversorganisatie VNO-NCW deze week pleitte.

„Er is zeker een risico dat mensen een negatieve test beschouwen als een gezondheidscertificaat en zich onvoorzichtig gaan gedragen”, erkent Bossuyt. „Maar het is onzalig om alleen maar te wijzen naar gebreken van tests. Als je gevallen opspoort die je anders niet gevonden zou hebben, is een zwakke test beter dan helemaal geen test. Nut en noodzaak van een test hangen niet alleen af van de eigenschappen van die test, maar ook van vragen als: hoe gebruik je hem? Voor welke bevolkingsgroepen? Met welk doel?”

Betere rapportages

Dergelijke vragen moeten onderzoekers volgens Bossuyt trouwens al veel eerder stellen en beantwoorden, namelijk als ze diagnostische tests ontwikkelen en wetenschappelijk evalueren. Om dat stimuleren heeft Bossuyt met een internationale groep van epidemiologen, statistici, subsidiegevers en redacteuren van wetenschappelijke tijdschriften de Stard-richtlijnen opgesteld voor een goede rapportage van testevaluaties.

„De laatste jaren worden de rapportages beter. Tijdschriftredacteuren en peerreviewers toetsen ingestuurde artikelen veel vaker op de Stard-criteria en kijken bijvoorbeeld hoe deelnemers aan een studie zijn geworven”, signaleert Bossuyt: De coronacrisis heeft echter gezorgd voor „een terugslag”, ziet hij in de artikelen over coronatestevaluaties: „Er ontbreken nogal eens gegevens, zoals leeftijd, geslacht en aandoeningen van de deelnemers. Of data kloppen niet helemaal. Er wordt vaak een flinke bocht genomen.”

Bossuyt en zijn collega’s deden daarom vorige week in het medisch tijdschrift The BMJ een oproep om de normen, die in 2015 werden geactualiseerd, beter te volgen in het onderzoek naar coronatests. De honderden testonderzoeken die in ruim een jaar tijd zijn verschenen – meestal als preprint – zijn volgens de auteurs niet veel meer dan wat in geneesmiddelenonderzoek als „fase-1-studies” worden beschouwd. Dat wringt, zegt Bossuyt: „Want de maatschappelijke behoefte aan goed onderzochte tests is groot.”

Moeite met gebruiksaanwijzing

Die behoefte is te zien aan de snelheid waarmee de onderzoekers de zelfsneltesten-studie aan het begin van dit verhaal hebben uitgevoerd. De ruim drieduizend proefpersonen gaven van 23 december tot 17 januari hun uitslagen door. In februari publiceerden de onderzoekers hun resultaten van de studie, die is betaald door het ministerie van Volksgezondheid. Half maart verzond het ministerie een persbericht over de komst van de zelftestkist, waarvan de eerste begin april in de winkel lagen.

Toch oogt het Tilburgse onderzoek niet als een haastklus, vindt Bossuyt: „De studie is goed opgezet.” De proefpersonen zijn zorgvuldig beschreven, tot en met hun opleiding. Ouderen blijken wat meer moeite te hebben met de gebruiksaanwijzing dan jongeren; dat is nuttige informatie omdat de effectiviteit van een test óók afhangt van hoe die wordt gebruikt. Ten slotte is de antigeentest gevalideerd met de test die geldt als standaard: de PCR-test die genetisch materiaal van het coronavirus aantoont in de monsters uit neus- en keelslijm.

Dat laatste is cruciaal, zegt Bossuyt: „Heel veel tests worden ontdekt door te kijken hoe zieke mensen verschillen van gezonde, bijvoorbeeld doordat ze een bepaald eiwit hebben. Vervolgens wordt de test gevalideerd door te kijken of die het stofje vindt. Dat is geen goed idee, want er is bijvoorbeeld een groot verschil tussen iemand met uitgezaaide darmkanker en iemand met mogelijk beginnende darmkanker, zoals je hoopt te vinden in een bevolkingsonderzoek. De gouden standaard is dat je mensen met verdenking van ziekte evalueert, kijkt wat de testuitslag is en dan met een geschikte referentietest kijkt nagaat of ze inderdaad ziek zijn. Maar veel coronatests komen nu op de markt zonder te zijn vergeleken met een referentietest.”

Een afkappunt

De Tilburg-studie voldoet aan de gouden standaard, maar volgens Bossuyt zit er wel enige „spin” in de resultaten door omgang met de scores van de PCR-test. Deze genetische testen detecteren namelijk ook zeer kleine hoeveelheden virus-rna of rna dat niet meer actief is. Omdat antigeensneltests vooral zijn bedoeld om personen met veel virus te vinden – want die zijn waarschijnlijk het meest besmettelijk – strepen onderzoekers de PCR-scores met de laagste viral load nogal eens weg met een afkappunt. Dat is in de Tilburg-studie ook gebeurd.

Hoeveel PCR-monsters je weglaat uit de analyse maakt nogal uit voor de prestaties van de antigeentesten. Stel dat de antigeen-sneltest 60 gevallen vindt van de 100 die de PCR-test heeft gevonden, dan scoort de sneltest een gevoeligheid van 60 procent. Als je vervolgens het aantal PCR-gevallen terugbrengt tot 75, in plaats van 100, dan is sensitiviteit van de sneltest met dezelfde 60 gevallen ineens 80 procent. Dat is wat je ziet in de Tilburgse studie. „Dat gebeurt vaker, zonder dat duidelijk is wanneer een bepaalde keuze is gemaakt in de analyse”, zegt Bossuyt: „Welkom in mijn wereld!”

Fout-positieven Verschil tussen geteste groepen Proeven met sneltests worden vaak gedaan onder een specifieke bevolkingsgroep, maar daarna gebruikt bij een andere groep. Dan kan het gebeuren dat relatief veel mensen ten onrechte te horen krijgen dat ze besmet zijn. Zij blijven thuis, terwijl dat niet zou hoeven.

Een rekenvoorbeeld:

Een sneltest voor teststraatbezoekers Stel dat je een sneltest uitvoert onder 10.000 mensen die een teststraat bezoeken, en dus corona-achtige symptomen hebben. 10 procent van de bezoekers heeft het virus, dus 1.000 mensen. Maar de sneltest spoort slechts 80 procent op. Dat is de gevoeligheid.

Je vindt dus: 800 goed-positieven: de test zegt dat ze positief zijn en dat klopt ook

de test zegt dat ze positief zijn en dat klopt ook 200 fout-negatieven: de test zegt dat ze negatief zijn maar dat klopt niet

de test zegt dat ze negatief zijn maar dat klopt niet Bovendien krijgt 1 procent van de geteste mensen ten onrechte te horen dat ze positief zijn (de specificiteit is 99 procent). Van de getesten zijn er 1.000 besmet. Van de resterende 9.000 krijgt 1 procent een onterechte positieve test. Je vindt dus:

90 fout-positieven: de test zegt dat ze positief zijn maar dat klopt niet

de test zegt dat ze positief zijn maar dat klopt niet 8.910 goed-negatieven: de test zegt dat ze negatief zijn en dat klopt ook