Voor de nieuwe TrendITion publicatie Big data in de gezondheidszorg duikt Stefan Ottenheijm (Nictiz) in de definities, toepassingen en uitdagingen van big data. “Als je met mensen in de zorgsector over big data praat, doelen ze op toepassingen die ontwikkeld kunnen worden met die data, en niet puur de verzameling van grote hoeveelheden data op zich."
Big data: het is een term die je in veel sectoren en op veel plaatsen terugziet. Maar wat verstaan we er eigenlijk onder? Big data heeft betrekking op meer dan alleen grote hoeveelheden data. De publicatie introduceert een veel gebruikt model van Gartner, dat de dimensies van big data beschrijft met drie ‘V’s’. Het eerste kenmerk is de grote hoeveelheden aan data (volume). Ook de snelheid waarmee data gegenereerd worden, veranderen en zich verspreiden is kenmerkend (velocity). Ook zijn de verschillende vormen van data ook van belang (variety). Aan deze drie V’s wordt in recente literatuur ook nog een belangrijke vierde V toegevoegd: veracity (waarheidsgetrouwheid). Oftewel de betrouwbaarheid of integriteit van al deze data waar analyses op los gelaten worden.
Hype fase
“Je merkt dat big data in de gezondheidszorg nu nog vooral in de hype fase zit: er wordt veel over gesproken, maar de praktijk is nog weerbarstig”, aldus Stefan Ottenheijm, senior onderzoeker bij Nictiz. “Als je met mensen in de zorgsector over big data praat, bedoelen ze vaak de toepassingen die ontwikkeld kunnen worden met die data, en niet de verzameling van grote hoeveelheden data op zich. Big data is een containerbegrip, maar het draait in feite om de kennis en nieuwe inzichten uit data.” Daarom stelt Ottenheijm in de whitepaper de volgende definitie voor: big data refereert naar de mogelijkheid om gebeurtenissen te volgen, verklaren en voorspellen door het slim combineren en analyseren van complexe datasets uit verschillende bronnen.
Monitoren en voorspellen
Data geeft ons de mogelijkheid om te rapporteren en monitoren: wat is er gebeurd, en wat gebeurt er nu? Een niveau hoger ligt het analyseren van data met het doel bepaalde correlaties te ontdekken, ofwel data mining en evalueren. Het meest complexe niveau van dit model betreft het ultieme gebruik van big data: op basis van data kunnen voorspellen wat er in de toekomst mogelijk gaat gebeuren. “In het kunnen voorspellen van uitkomsten wordt de Watson technologie van IBM vaak aangehaald. Dat is big data in ultimo forma, en voor de Nederlandse praktijk vaak nog toekomstmuziek.”
IBM Watson (foto: Wikipedia)
De zorgsector is een van de grootste aanjagers van data-verzamelingen: schattingen lopen uiteen, maar sommige bronnen stellen dat de medische sector verantwoordelijk is voor 30% van alle data. “Medische beeldvorming zoals MRI-, CT- en PET-scans zijn enorme, multidimensionale bestanden. De medische wereld levert een van de grootste bijdragen aan de wereldwijde data-explosie, met ziekenhuizen als grote spelers."
"Op het gebied van procesverbetering en kwaliteitsbewaking wordt er wordt al een hele hoop gedaan met data in ziekenhuizen, maar die analyses bevinden zich in ‘onderste lagen’ van big data toepassingen, die van monitoring en reporting. Complexere toepassingen van big data, waarbij we op basis van data kunnen voorspellen wat er in de toekomst mogelijk gaat gebeuren, zijn nog zeldzamer”, aldus Ottenheijm. Hij beschrijft een aantal Nederlandse conceptuele en in de praktijk toegepaste oplossingen van big data, zoals het gebruik van big data bij chirurgie in het Radboudumc, en het Center for Personalized Cancer Treatment (CPCT).
“De medische wereld levert een van de grootste bijdragen aan de wereldwijde data-explosie"
Naast kansen biedt big data toepassen in de gezondheidszorg ook de nodige uitdagingen. Het kunnen delen van data is een belangrijke component. “Zorgaanbieders registreren en verzamelen informatie op verschillende manieren in veel verschillende systemen. Uitwisseling daartussen is een moeizaam proces. Maar ook de wil om informatie beschikbaar te stellen voor doeleinden van anderen is momenteel nog een hobbel. Zorgorganisaties en ziekenhuizen verzamelen data vaak vanuit het eigenbelang van de organisatie, en willen die gegevens niet delen. Terwijl je je kunt voorstellen dat er een schat aan informatie vrijkomt wanneer data uit publieke sector, ziekenhuizen, de zelf verzamelde data van burgers en die van overheidsinstanties zoals RIVM, GGD en CBS gedeeld en geanalyseerd kan worden.”
Plaats een Reactie
Meepraten?Draag gerust bij!