Datatalenten voorspellen verwachte verblijfsduur van patiënten op de IC

EY VODW Datatalents
29 okt. 2019

Opname op een IC-afdeling is niet alleen duur, maar met het huidige tekort aan zorgpersoneel hebben ziekenhuizen regelmatig moeite te voldoen aan de vraag naar een plek op de Intensive Care (IC). Het probleem is bij tijd en wijle zelfs zo erg dat er afgelopen zomer een zwangere mevrouw uit Purmerend voor spoedopname naar het Belgische Gent werd verwezen[1].

Als we de IC-capaciteit in Nederland niet beter af gaan stemmen op de vraag, zal dit probleem de komende jaren aanhouden. Er is dan ook grote behoefte de beschikbare resources op de IC optimaal in te kunnen zetten. Hiervoor is real time inzicht in de te verwachte beschikbare capaciteit voor de komende uren en dagen nodig op regioniveau.

Ademhalingsfrequentie helpt de duur te voorspellen

Kortom, reden genoeg om onze health en data science experts los te laten op een omvangrijke geanonimiseerde IC-dataset. De uitdaging die we voor onszelf hebben geformuleerd is om zo nauwkeurig mogelijk de verwachte verblijfsduur van patiënten op de IC te bepalen. Voor een eerste voorspelmodel hebben we getoetst in hoeverre de beschikbare data over de eerste 24 uur op de IC een zinvolle voorspelling kan geven over de totale verblijfsduur op de IC.

Gemiddelde foutmarge 20%

We zijn met de geprepareerde data van start gegaan met het trainen van een aantal verschillende regressiemodellen uit de Scikit learn package voor Python, waarbij een gradiënt booster als beste uit de test kwam. Dit leidde tot voorspellingen die er voor korte verblijven (minder dan vijf dagen) gemiddeld zo’n 30 uur naast zaten. Voor langere verblijven schommelde de gemiddelde foutmarge rond de 20%. 

De vier belangrijkste voorspellende parameters blijken de maximale ademhalingsfrequentie, de maximale temperatuur, de minimale ademhalingsfrequentie en de systolische bloeddruk te zijn. Opvallend is dat de severity score (een standaard samengestelde score op basis van de eerste 24 uur) in het gekozen model geen belangrijke voorspeller blijkt voor de ligduur. In een volgende versie kan het model verfijnd worden door met verschillende tijdsintervallen te werken en op meerdere punten in de tijd te gaan voorspellen. In de huidige dataset hebben we nog gewerkt met het geregistreerde moment waarop de patiënt daadwerkelijk de IC verlaten zou hebben en niet met het moment waarop de patiënt gezien zijn conditie de IC zou kunnen verlaten. Ook dit zal bijdragen aan een nog nauwkeuriger voorspelmodel, waarmee we in de toekomst hopelijk kunnen waarborgen dat Purmerendse baby’s gewoon in Nederland geboren kunnen worden.

[1] https://www.ad.nl/binnenland/zwangere-vrouw-moet-voor-spoedopname-260-km-naar-belgie-te-zot-voor-woorden-br~a057e36e/

 


Data Science & Health

De data scientists van EY VODW en de specialisten van EY healthcare hebben hun kennis en ervaring gebundeld en zijn in teams aan de slag gegaan met vier data-challenges die impact maken in de zorgsector.

Vertel mij meer

 

Onze blogs direct in je mailbox?

Interessant? Laat een reactie achter