Upoznajte Evo, AI obučenu DNK koja stvara genome od nule
24.11.2024.
U novoj studiji objavljene u časopisu Science, istraživači opisuju AI model, školovan na milijardama linija genetskih sekvenci, koji može zaključiti kako bakterijski i virusni genomi funkcioniraju i koristiti te informacije za dizajn novih proteina, pa čak i cijelih mikrobnih genoma.
Model, poznat kao Evo, mogao bi pomoći znanstvenicima u ispitivanju evolucije, istraživanju bolesti, razvoju novih tretmana i potencijalno odgovoriti na niz drugih biomedicinskih pitanja. Evo je zamisao računalnog biologa Briana Hiea sa Sveučilišta Stanford i njegovih kolega.
Nakon što su istraživači izgradili Evo, dali su mu 4 tjedna obuke, tijekom kojih se model educirao na 80.000 genoma mikroba, kao i na milijunima sekvenci virusa koji ciljaju bakterije i polu-neovisnih petlji DNK poznatih kao plazmidi. U teoriji, zlonamjerni korisnici mogli bi iskoristiti model kao što je Evo za dizajniranje biološkog oružja, pa su istraživači izbacili iz AI-ovog seta za obuku sekvence svih virusa koji napadaju ljude ili druge eukariote, organizme čije stanice imaju jezgre. Sveukupno, Evo je učio iz 300 milijardi nukleotida informacija o sekvencama.
Kako bi testirali AI, istraživači su ga zamolili da predvidi utjecaj mutacija na performanse proteina. Ovo znanje je važno za razumijevanje kako greške u DNK dovode do bolesti i za dizajniranje novih lijekova. Tim je provjerio Evo-va predviđanja uspoređujući ih s objavljenim eksperimentima u kojima su drugi znanstvenici inducirali iste mutacije u bakterijskim stanicama. Evo je nadmašio prethodne modele umjetne inteligencije koji zaključuju o učincima mutacije iz podataka sekvenci DNK; funkcionirao je jednako dobro kao i drugi modeli umjetne inteligencije koji se oslanjaju na proteinske sekvence.
Hie i njegovi kolege rekli su Evu da dizajnira nove verzije uređivača genoma CRISPR. Ovaj zadatak je izazovan jer CRISPR uključuje dvije vrste komponenti koje moraju raditi zajedno: Cas proteine koji režu DNK i molekule RNK koje uvode enzime na lokacije genoma koje treba urediti.
Evo je pronašao više od 70.000 bakterijskih DNK sekvenci koje su kodirale Cas proteine i njihove partnerske RNA. Zatim je model osmislio milijune potencijalnih verzija molekula. Istraživači su odabrali 11 najperspektivnijih varijanti Cas9, radne verzije Casa u biotehnologiji, i sintetizirali proteine u laboratoriju.
U eksperimentima s epruvetama, najbolji od Evo dizajniranih Cas9 enzima bio je jednako dobar u rezanju DNK kao i komercijalna verzija proteina.
U dijelu studije, istraživači su tražili od Eva da generira DNK sekvence koje su dovoljno dugačke da služe kao genomi za bakterije. Otkrili su da ti lažni genomi nose mnoge gene potrebne stanicama, ali su im nedostajali drugi koji su potrebni. Ipak, Hie vjeruje da bi rezultati mogli biti korak prema sintetskim genomima koje je dizajnirala umjetna inteligencija.