Al in 2016 vroegen hoogleraar huisartsgeneeskunde Henk van Weert en zijn collega-hoogleraar Niek de Wit van het UMC Utrecht zich af of huisartsen een bijdrage kunnen leveren aan het nog vroeger opsporen van kanker. En wel met behulp van de patiëntendossiers en kunstmatig intelligente software die de dossiers doorneemt. Uit het AI-DOC project van het Amsterdam UMC blijkt dat dit algoritme drie tot vier maanden eerder long- en dikkedarmkanker kan detecteren dan de huisarts. Maar: het systeem is nog niet waterdicht.
“Huisartsen hebben vaak wel tien jaar of nog veel langer contact met een patiënt, soms ook met hun familie en kinderen”, legt Henk van Weert uit. “In die periode noteren ze van alles in hun patiëntendossiers: de aanleiding voor een consult, diagnoses, onderzoeksuitslagen, medicijnen, sociale informatie, werk. Sommige informatie is gecodeerd, maar veel noteert de huisarts ook in vrije tekst. Zo’n dossier is daarom een rijke bron van gegevens die mogelijk voorbodes bevatten, in welke vorm dan ook, van het soort kanker dat de patiënt heeft gekregen.”
Vrije tekstvelden
De vrije tekst in de patiëntendossiers vormde de basis voor het onderzoeksproject. Van Weert en De Wit wilden met kunstmatige intelligentie de dossiers van een groot aantal kankerpatiënten onderzoeken op bepaalde termen en (delen van) zinnen. Zo hoopten ze overeenkomsten op te sporen. Ze benaderden hoogleraar Ameen Abu-Hanna van de afdeling Klinische Informatiekunde. Die wilde de uitdaging wel aangaan om een algoritme te ontwikkelen dat signaleert of een patiënt mogelijk kanker heeft, nog voordat deze duidelijke symptomen vertoont die daar op kunnen wijzen. “We hadden op voorhand geen idee of die aanwijzingen daadwerkelijk te vinden waren in de dossiers”, zegt Abu-Hanna. Het project werd ‘AI-DOC’ gedoopt: Artificial Intelligence for earlier Detection Of Cancer. Long-, darm-, eierstok- en alvleesklierkanker zijn vormen van kanker waarbij veel winst te behalen is bij vroegere detectie.
1,5 miljoen patiëntendossiers
Voor de analyse was een groot aantal patiëntendossiers nodig. In samenwerking met het UMC Utrecht en UMC Groningen had het Amsterdam UMC via een beveiligd netwerk toegang tot 1,5 miljoen geanonimiseerde patiëntendossiers, door huisartsen beschikbaar gesteld voor onderzoeksdoeleinden. Na een selectie van patiënten boven de veertig jaar bleven er 550.000 dossiers overbleven. Die dossiers werden aangevuld met data uit de Nationale Kanker Registratie, zodat de onderzoekers zeker wisten welke patiënten daadwerkelijk kanker hadden en wanneer hun diagnose definitief was gesteld via weefselonderzoek. De dossiers van patiënten zonder die vorm van kanker dienden als controlegroep.
De eerste uitkomsten van het project zijn inmiddels gepresenteerd op een congres, nog niet in een wetenschappelijk vakblad. Het door het Amsterdam UMC ontwikkelde algoritme bleek bij longkanker en dikkedarmkanker in staat om drie à vier maanden voor verwijzing door de huisarts kanker op te sporen. Een op de zestien patiënten die door het algoritme werden aangewezen, had ook daadwerkelijk kanker. Dat betekent dat het huidige algoritme veel foutpositieven geeft. Ook werd nog één van de drie patiënten gemist.
Toch denken de onderzoekers dat er toekomst zit in deze manier van kanker detecteren. “Deze cijfers betekenen dat het algoritme iets beter lijkt te zijn dan de FIT-test die nu wordt gebruikt in het bevolkingsonderzoek voor dikkedarmkanker”, zegt Van Weert. Bij eierstok- en alvleesklierkanker lukte het onvoldoende om vroege aanwijzingen te vinden in de patiëntendossiers. Van Weert: “Dat kan komen omdat die kankers niet vaak genoeg voorkomen, maar dat weten we niet. We zouden het algoritme op nog grotere hoeveelheden patiëntendata moeten loslaten om daarover uitsluitsel te krijgen.”
Black box
Of AI-DOC verder gaat, hangt af van financiering of subsidies. "Er zijn nog veel stappen te zetten voordat we een softwareprogramma hebben dat bruikbaar is in de huisartspraktijk”, zegt Abu-Hanna. “Het huidige algoritme is een black box. Dat bekent dat we niet weten welke woorden en zinsdelen en combinaties daarvan precies relevant zijn als vroege aanwijzingen voor kanker. Daar gaan we verder onderzoek naar doen.” Volgens Abu-Hanna is die kennis belangrijk voor het vertrouwen dat huisartsen stellen in zo’n softwareprogramma. “Ze willen toch een idee hebben van wat er in de black box gebeurt.”
De zinnen “ Een op de zestien patiënten die door het algoritme werden aangewezen, had ook daadwerkelijk kanker. Dat betekent dat het huidige algoritme veel foutpositieven geeft. Ook werd nog één van de drie patiënten gemist.” zijn veelbetekenend. Dat bekent dat er sprake is van een bijzonder lage specificiteit en sensibiliteit van de zoekmethode met het gebruikte algoritme. Dat wil simpelweg zeggen dat deze AI-methodiek bijzonder ongeschikt is om zo kanker op te sporen.