Hvordan opnår vi succesfuld implementering af kunstig intelligens i sundhedssektoren?
Af lektor Sune Holm, Institut for Fødevare- og Ressourceøkonomi, Københavns Universitet, postdoc Stig Nikolaj Blomberg, forskningsleder Helle Collatz Christensen, Region Sjællands præhospitale forskningsenhed, og lektor Boris Düdder på vegne af Trustworthy AI Lab, Københavns Universitet
(Bragt i Berlingske 12. juni 2023. Læs artiklen med titlen 'Kunstig intelligens i sundhedssektoren kommer ikke nødvendigvis patienter til gode: »Det er et etisk problem«' på berlingske.dk)
Der er meget fokus på at anvende kunstig intelligens i sundhedssektoren. Forventningen er, at det kan føre til bedre beslutninger og mere effektiv brug af medarbejderes tid. Anvendelse af kunstig intelligens i sundhedsvæsenet er modnet mest i billeddiagnostikken. I flere regioner er kunstig intelligens for eksempel allerede implementeret til at understøtte prioritering af billedanalyse, så man sikrer, at radiologer analyserer de vigtigste billeder først. Også på det akutte område er kunstig intelligens taget i brug, og der anvendes i dag kunstig intelligens, som analyserer opkald til 1-1-2 med henblik på at hjælpe personalet til hurtigt at identificere hjertestop. Men får patienter noget ud af disse investeringer?
Hidtil har afprøvning og implementering af kunstig intelligens afveget væsentligt fra måden, medicin bliver vurderet på inden godkendelse. Før en ny medicin bliver godkendt til markedsføring, skal den gennemgå en række grundige tests, så det er dokumenteret, at medicinen ikke er skadelig, samt at medicinen har den påståede effekt. En standardmetode er at foretage et såkaldt randomiseret forsøg. En gruppe af forsøgspersoner modtager medicinen, og en anden gruppe modtager et placebo. På baggrund af forsøget kan man give et kvalificeret bud på, om medicinen faktisk gør en forskel. Det ville i dag være usandsynligt,
at sundhedsvæsenet i stor stil indkøbte og anvendte præparater, hvor der ikke forelå godkendelse og videnskabelig dokumentation for effekten.
Som nævnt har flere regioner investeret i kunstig intelligens til hjælp med genkendelse af hjertestop ved opkald til 1-1-2. Imidlertid er der, så vidt vi ved, ikke nogen studier, der peger på, at implementeringen af kunstig intelligens på alarmcentraler forbedrer resultatet for patienter. I 2018-2019 blev der foretaget et klinisk studie af anvendelsen af den kunstig intelligens-løsning, der var implementeret på alarmcentralen i Region Hovedstaden. Studiet påviste, at der, til trods for at den kunstige intelligens virkede som forventet, ikke var nogen forbedring for patienter, når personalet fik input fra systemet. Givet den tilgængelige videnskabelige evidens ser det altså ud til, at implementeringen af denne kunstig intelligens-løsning ikke per automatik forbedrer chancen for, at opkald om hjertestop bliver identificeret. Implementeringen af en velfungerende algoritme har fejlet.
Eksemplet viser, at implementeringen af kunstig intelligens i sundhedsvæsenet ikke nødvendigvis kommer patienter til gode, blot fordi algoritmen er meget nøjagtig. Det er et etisk problem, fordi det betyder, at vi i så fald anvender ressourcer på noget, der ikke er testet i praksis, og som måske ikke virker i praksis. De ressourcer kunne i så fald anvendes bedre. Vores eksempel viser også, at vi ikke opnår forbedringer i sundhed blot ved at indkøbe imponerende nøjagtige algoritmer. Hvis en kunstig intelligens-løsning skal gøre en positiv forskel for patienter, kræver det en mere omfattende analyse af de forhold, som systemet skal virke under.
Vores centrale pointe med at fremdrage dette eksempel er at illustrere nogle generelle pointer vedrørende implementering af kunstig intelligens som støtte til klinisk beslutningstagning. For det første, at det er vigtigt, at eksempelvis danske regioner og andre institutioner, der ønsker at bruge ressourcer på kunstig intelligens-løsninger, efterspørger grundige studier af systemets effekt på patienter og behandling. For det andet, at der er en generel mangel på studier af den kliniske effekt af kunstig intelligens-løsninger i klinisk praksis. Der er rigtig meget fokus på at vise, at den kunstige intelligens kan opnå meget
nøjagtige forudsigelser på niveau med – nogle gange højere end – menneskelige eksperter. I sammenligning er studier af kunstig intelligens-løsningers kliniske værdi nærmest ikkeeksisterende. For det tredje, at der er mange andre forhold end kvaliteten af den kunstige intelligens, der er relevante at belyse, hvis man vil sikre succesfuld implementering. Eksempelvis vil det være relevant at afdække ikke blot tekniske, men også de sociale og etiske aspekter der er afgørende for at sikre tillid til og anvendelse af systemet.
I en tid hvor sundhedsvæsenet opfattes som “under pres”, kan det være fristende at “gøre noget” ved at implementere kunstig intelligens-systemer. Hvis vi skal sikre deres kliniske effekt, er det vigtigt, at man afdækker den bredere kliniske praksis, de skal indgå i, med input fra såvel tekniske, sociale og humanistiske videnskaber.