Može li ChatGPT-4 zamijeniti farmaceuta u depreskripciji benzodiazepina?
02.12.2024.
Može li jezični model ChatGPT-4 zamijeniti farmaceuta u donošenju odluka vezanih uz depreskripciju benzodiazepina, rad prezentiran na 7. hrvatskom kongresu farmaceuta, 2024.
Negativni utjecaj benzodiazepina na ishode liječenja osoba starije životne dobi dobro je poznat, ali su benzodiazepini i dalje među najčešće propisivanim lijekovima.
Alati kao što su kriteriji za utvrđivanje potencijalno neprikladnih lijekova (Beers criteria, PRISCUS list, START/STOPP criteria, EU-PIM-7 list i dr.) ili smjernice za depreskripciju, zdravstvenim radnicima olakšavaju donošenje kliničkih odluka i odabira mogućeg rješenja za depreskripciju u pojedinog pacijenta. Ideja da umjetna inteligencija (AI) sveobuhvatno kritički procijeni medicinske podatke pacijenta i na temelju svojih saznanja donese kliničku odluku nešto je što intrigira širu akademsku i zdravstvenu zajednicu.
Cilj ovog istraživanja bio je usporediti donošenje odluka za depreskripciju benzodiazepina između magistra farmacije i AI-a, chatbota GPT-4 (ChatGPT-4). Analizirani su podaci pacijenata (n = 154) prikupljeni u okviru projekta EuroAgeism H2020 ESR 7. Ljekarnik je sveobuhvatnom analizom pacijenta procijenio potrebu i razloge za depreskripciju benzodiazepina. ChatGPT-u je postavljen upit u kojem se također traži da procjeni potrebu za depreskripcijom te navede razloge. Pri tom su dane informacije o pacijentu te su navedeni kriteriji za procjenu potrebe za depreskripcijom benzodiazepina. Zadani kriteriji bili su: nepostojanje prikladne indikacije za primjenu benzodiazepina (K1), neprikladno trajanje primjene (K2), neprikladna doza (K3), sigurnosna pitanja (K4) (npr. nuspojave). Dobivene kliničke procjene magistra farmacije i ChatGPT-a uspoređene su stopom slaganja i Cohenovim kappa koeficijentom. Magistar farmacije i ChatGPT-4 identificirali su prikladne pacijente za depreskripciju benzodiazepina (96,1, odnosno 89,6 %), pokazujući stopu slaganja od 95 % (κ = 0,200, p = 0,012). Slaganje u kriterijima za depreskripciju kretalo se od 74,7 % do 91,3 % (K1 κ = 0,352, p < 0,001; K2 κ = 0,088, p = 0,280; K3 κ = 0,264, p = 0,001; K4κ = 0,123, p = 0,006). Iako je bila prisutna visoka stopa slaganja, identificirani su slučajevi u kojima je ChatGPT dao nejasne odgovore, kao i oni koji mogu dovesti do problema sigurnosti za pacijenta. Zaključno, ChatGPT se pokazao kao koristan alat u prepoznavanju potrebe za depreskripcijom benzodiazepina, ali ne može biti zamjena za donošenje odluka od strane magistra farmacije.
I. Bužančić, D. Belec, M. Držaić, I. Kummer, J. Brkić, D. Fialová, M. Ortner Hadžiabdić