x
x

Google AI bi uskoro mogao koristiti nečiji kašalj za dijagnosticiranje bolesti

  29.03.2024.

Tim predvođen Googleovim znanstvenicima razvio je alat za strojno učenje koji može pomoći u otkrivanju i praćenju zdravstvenih stanja procjenom zvukova kao što su kašalj i disanje. Sustav umjetne inteligencije (AI), obučen na milijunima audio zapisa ljudskih zvukova, jednog bi dana liječnici mogli koristiti za dijagnosticiranje bolesti uključujući COVID-19 i tuberkulozu i za procjenu koliko dobro funkcioniraju nečija pluća.

Google AI bi uskoro mogao koristiti nečiji kašalj za dijagnosticiranje bolesti

Ovo nije prvi put da je istraživačka skupina istraživala korištenje zvuka kao biomarkera bolesti. Koncept je dobio na snazi ​​tijekom pandemije COVID-19, kada su znanstvenici otkrili da je moguće otkriti respiratornu bolest kroz nečiji kašalj.

Ono što je novo u vezi s Googleovim sustavom — nazvanim Health Acoustic Representations (HeAR) — je ogroman skup podataka na kojem se trenirala i činjenica da se može fino podesiti za obavljanje više zadataka.

Većina AI alata koji se razvijaju u ovom prostoru treniraju se na audio snimkama - na primjer, kašljanja - koje su uparene sa zdravstvenim informacijama o osobi koja je proizvela zvukove. Na primjer, isječci mogu biti označeni tako da pokazuju da je osoba imala bronhitis u vrijeme snimanja. Alat dolazi da poveže značajke zvukova s ​​oznakom podataka, u procesu obuke koji se naziva nadzirano učenje.

U medicini tradicionalno koristimo mnogo učenja pod nadzorom, što je sjajno jer imamo kliničku potvrdu. Negativna strana je to što stvarno ograničava skupove podataka koje možemo koristiti, jer postoji nedostatak označenih skupova podataka.

Umjesto toga, Googleovi istraživači koristili su samonadzirano učenje koje se oslanja na neoznačene podatke. Automatiziranim postupkom izvukli su više od 300 milijuna kratkih zvučnih isječaka kašljanja, disanja, pročišćavanja grla i drugih ljudskih zvukova iz javno dostupnih YouTube videa.

Svaki je isječak pretvoren u vizualni prikaz zvuka koji se naziva spektrogram. Zatim su istraživači blokirali segmente spektrograma kako bi pomogli modelu da nauči predvidjeti dijelove koji nedostaju. Ovo je slično načinu na koji je veliki jezični model koji je u osnovi chatbota ChatGPT naučen da predvidi sljedeću riječ u rečenici nakon što je treniran na bezbrojnim primjerima ljudskog teksta. Koristeći ovu metodu, istraživači su stvorili ono što nazivaju temeljnim modelom, za koji kažu da se može prilagoditi mnogim zadacima.

Učinkovit učenik

U slučaju HeAR-a, Googleov tim ga je prilagodio za otkrivanje COVID-19, tuberkuloze i karakteristika kao što je pušenje. Budući da je model treniran na tako širokom rasponu ljudskih zvukova, da bi ga fino ugodili, istraživači su mu morali dati samo vrlo ograničene skupove podataka označene ovim bolestima i karakteristikama.

Na ljestvici gdje 0,5 predstavlja model koji nije bolji od nasumičnog predviđanja, a 1 predstavlja model koji svaki put daje točno predviđanje, HeAR je postigao 0,645 i 0,710 za otkrivanje COVID-19, ovisno o skupu podataka na kojem je testiran — bolju izvedbu od postojećih modela obučenih na govornim podacima ili općem zvuku. Za tuberkulozu je rezultat bio 0,739.

Činjenica da su izvorni podaci o treningu bili toliko raznoliki - s različitom kvalitetom zvuka i ljudskim izvorima - također znači da se rezultati mogu generalizirati.

Ali Imran, inženjer sa Sveučilišta Oklahoma u Tulsi, kaže da sama količina podataka koje koristi Google daje značaj istraživanju.

Imran vodi razvoj aplikacije pod nazivom AI4COVID-19, koja je obećavala u razlikovanju kašlja izazvanog COVID-19 od drugih vrsta kašlja. Njegov tim planira podnijeti zahtjev za odobrenje američke Uprave za hranu i lijekove (FDA) kako bi se aplikacija na kraju mogla plasirati na tržište. Do sada nijedan alat odobren od strane FDA ne pruža dijagnozu putem zvukova.

Područje zdravstvene akustike, ili 'audiomike', obećava. Akustička znanost postoji desetljećima. Ono što je drugačije jest da sada, s umjetnom inteligencijom i strojnim učenjem, imamo sredstva za prikupljanje i analizu velikog broja podataka u isto vrijeme. Postoji golem potencijal ne samo za dijagnozu, već i za probir i praćenje. Ne možemo ponavljati snimke ili biopsije svaki tjedan. Zato glas postaje stvarno važan biomarker za praćenje bolesti. Nije invazivan i ima malo resursa.