- Da jeg startede min ph.d. for fem år siden, kunne vi knap nok skabe sammenhængende sætninger med sprogmodeller, fortæller Valentin Liévin.

Nu er Valentin Liévin, der netop har forsvaret sin ph.d. i maskinlæring, lykkedes med at få en sprogteknologi drevet af kunstig intelligens til at bestå tre medicinske prøver. Det skriver Videnskab.dk.

Herunder den amerikanske embedslægeeksamen - den såkaldte ‘United States Medical Licensing Examination (USMLE)’, som amerikanske læger skal bestå for at få en licens til at arbejde som læger.

- Jeg er overrasket. Jeg havde ikke regnet med, at den ville klare sig så godt, fortæller han.

Navnet på den computerdrevne lægeaspirant er GPT-3.5.

Det er den selvsamme teknologi, der står bag den hypede chatbot ChatGPT, der siden december 2022 har vakt vild opsigt, fordi den kan løse en universitetseksamen og besvare alverdens spørgsmål med et overbevisende sprog.

GPT-sprogmodellen dog langt fra at være en superstuderende.

USMLE-prøven er en multiple-choice prøve med 4 svarmuligheder. Prøven består af et par hundrede spørgsmål.

- Spørgsmålene indeholder en beskrivelse af patienten - deres sygehistorie, blodtype og så videre - efterfulgt af et spørgsmål, der ofte handler om at identificere den mest sandsynlige diagnose, forklarer Valentin Liévin til Videnskab.dk.

60 procent af spørgsmålene i USMLE skal besvares korrekt for at bestå. Sprogrobotten bestod lige akkurat med 60,2 procent. De bedste læger til prøven svarer korrekt på cirka 87 procent af spørgsmålene.

- På en måde klarede vi os lige så godt som de dårligst præsterende læger, konstaterer Valentin Liévin.

I en kort stund havde DTU-forskerne - der lige akkurat bestod og altså præsterede som en dårlig læge - faktisk rekorden for at være det forskerhold, der havde klaret USMLE-prøven bedst.

Men bare fem dage efter, at DTU-forskerne fremlagde deres studie 20. december 2022, præsenterede et forskerhold fra Google et studie, hvor de havde brugt Googles egen sprogmodel ‘PaLM’.

Google-modellen bestod USMLE med 67 procent korrekte svar og er dermed den sprogmodel, der i skrivende stund har klaret den amerikanske embedslægeeksamen bedst.

DTU-forskernes ultimative mål er dog mere ædelt end at hutle sig gennem lægeeksamener.

Det egentlige mål er at finde ud af, hvordan læger kan få hjælp til at stille bedre og hurtigere diagnoser gennem kunstig intelligens, pointerer Valentin Liévin, som startede forskningen under sin praktik i virksomheden FindZebra, der også er involveret i forskningen.

Allerede i dag bruges kunstig intelligens også som hjælperedskab til at give bedre diagnoser. Så det er ikke nyt, påpeger Valentin Liévin.

Forskningen i GPT-sprogmodellen er blot en måde at videreudvikle disse redskaber på. Valentin Liévin forklarer idéen bag projektet på følgende måde:

Hvis du går til lægen med ondt i knæet eller et kløende mærke på ryggen, vil du blive undersøgt på forskellige måder. En stor del af udredningen foregår også ved, at du sætter ord på, hvordan du har det.

Til sidst vil din læge - ud fra en bunke informationer - forsøge at stille en diagnose. Men i nogle tilfælde findes der hundredvis af potentielle diagnoser. I nogle af dem vil diagnosen være så sjælden, at lægen måske aldrig nogensinde har hørt om den.

Her kan kunstig intelligens og sprogrobotter som GPT-3.5 måske hjælpe i fremtiden, forudser DTU-forskeren:

- I løbet af et øjeblik vil AI'en have analyseret millioner af tidligere medicinske sager og finde den mest passende forklaring, som den kan bruge til at anbefale en diagnose, siger han til Videnskab.dk.

Hvis du føler dig skræmt over udsigten til, at din praktiserende læge bliver erstattet af en sprogrobot, kan du glæde dig over, at det sandsynligvis ikke kommer til at ske.

Pointen er, at den kunstige intelligens skal fungere som en ekstra hjælp til lægen, ikke erstatte lægen fuldstændig.

Og selvom kunstige intelligenser nu kan bestå lægeeksamener, »betyder det selvfølgelig ikke, at enhver med en sprogmodel i hånden ville kunne praktisere som læge,« tilføjer overlæge Martin G. Tolsgaard til Videnskab.dk.

- En teoretisk eksamen repræsenterer trods alt kun en lille del af de kompetencer, der skal til for at virke som læge, påpeger han.

Martin G. Tolsgaard mener dog, at sprogteknologien allerede nu »ændrer ved vores forståelse af, hvad det vil sige at være en kompetent læge«:

- Sprogmodeller kan huske ting, som læger bruger utallige år på at lære udenad. Men de begår til gengæld også fejl, som mennesker måske aldrig ville have begået. For eksempel vil en kunstig intelligens ofte gætte en hel del, og den er ikke altid så god til at sige, hvornår den er usikker. Derfor er der brug for en læge, der ved, hvornår den ikke er på rette spor.