S pojavom umjetne inteligencije (AI) era očitavanja mamograma probira od strane dva radiologa vjerojatno se bliži kraju, jer se AI pokazala jednako točnom, zasad u istraživačkom okruženju i za 2D mamografiju.
Izvedba komercijalno dostupnog sustava AI (INSIGHT MMG verzija 1.1.7.1 – Lunit) u biti jednaka performansama više od 500 specijaliziranih radiologa. Rezultati su u skladu s drugim nedavnim istraživanjima AI-a.
Dvostruko očitavanje – mamograme očitavaju dva kliničara kako bi se povećala stopa otkrivanja raka – uobičajeno je u Ujedinjenom Kraljevstvu (UK) i drugdje u Europi. Britanski tim usporedio je učinak 552 specijaliziranih radiologa s Lunitovim AI programom Personal Performance in Mammographic Screening, testu osiguranja kvalitete koji očitavatelji (radiolozi) mamograma u UK-u moraju polagati dva puta godišnje. Radiolozi dodjeljuju ocjenu zloćudnosti za 60 izazovnih slučajeva, mješavinu normalnih dojki i dojki s dobroćudnim i zloćudnim lezijama.
Istraživanje je uključivala dvije testne serije za ukupno 120 pregleda dojke. Pedeset i sedam posto uključenih u studiju bili su certificirani radiolozi, 37 % bili su radiolozi, a 6 % kliničari za dojke. Svaki je očitao najmanje 5 000 mamograma godišnje. Nije bilo razlike u ukupnoj izvedbi između AI programa i ljudskih očitanja (AUC 0,93 prema 0,88, P = 0,15). Komentirajući uvodnik objavljen uz istraživanje, autori su naglasili da rezultati sugeriraju da AI može pouzdano djelovati kao drugi očitavatelj za smanjenje opterećenja.
Što se tiče SAD-a, gdje se općenito ne radi dvostruko očitavanje, istaknula je da su mnogi američki radiolozi koji tumače mamografije nespecijalizirani i ne analiziraju velike količine mamografija. Stoga bi se sustav AI ocijenjen u studiji mogao koristiti kao dodatan alat za pomoć u radu očitavatelja u SAD-u ili drugim zemljama gdje programi probira koriste jedno očitanje.
Također nije bilo razlike u osjetljivosti između AI i ljudskih očitanja (84 % prema 90 %, P = 0,34), ali algoritam AI imao je veću specifičnost (89 % prema 76 %, P = 0,003). Korištenjem rezultata prisjećanja AI koji su odgovarali prosječnoj izvedbi ljudskog očitanja (90 %-tna osjetljivost, 76 % specifičnosti), nije bilo razlike u odnosu na AI s obzirom na osjetljivost (91 %, P = 0.73) ili specifičnost (77 %, P = 0,85). Snaga analize bila je ograničena. Ukupno, dijagnostička izvedba AI bila je usporediva s onom prosječnog ljudskog očitavatelja. Čini se sve vjerojatnijim da će AI na kraju igrati ulogu u tumačenju mamograma probira.
Međutim, postoje neka upozorenja. Kao prvo, sustav je dizajniran za 2D mamografiju, trenutačni standard skrbi u UK-u, dok digitalna tomosinteza dojke (DBT) zamjenjuje 2D mamografiju u SAD-u. U SAD-u su algoritmi AI specifični za DBT nužni i morat će biti pouzdani i ponovljivi da bi ih prihvatili radiolozi. Također, u UK-u probir se provodi u intervalima od tri godine kod žena u dobi od 50 do 70 godina, što znači da je populacija studije ''obogaćena'' starijim ženama s manje gustim dojkama. Probir općenito počinje u ranijoj dobi u SAD-u i uključuje žene u prijemenopauzi s gušćim dojkama.
Nedavno istraživanje iz Koreje, gdje mnoge žene imaju guste dojke, otkrila je da 2D mamografija i dodatan ultrazvuk nadmašuju AI u otkrivanju raka. Ovo naglašava izazove pronalaženja raka u gustim dojkama, što podjednako muči i radiologe i AI te pruža dokaz da je gustoća dojke važan čimbenik koji treba uzeti u obzir pri procjeni učinkovitosti AI.
Goran Augustin