x
x

Koji su najbolji AI alati za istraživanje?

  23.02.2025.

Novi i naizgled impresivniji alat za umjetnu inteligenciju (AI) izlaze gotovo svaki tjedan, a istraživači hrle kako bi ih isprobali. Bilo da žele uređivati rukopise, pisati kod ili generirati hipoteze, istraživači imaju više generativnih AI alata za odabir nego ikad prije.

Koji su najbolji AI alati za istraživanje?

Svaki veliki jezični model (LLM) prikladan je za različite zadatke. Neki su dostupni putem besplatnih chatbota, dok drugi koriste plaćeno sučelje za programiranje aplikacija (API) što znači da se mogu integrirati s drugim softverom. Nekoliko ih se također može preuzeti, omogućujući istraživačima da izgrade vlastite prilagođene modele.

Iako LLM-ovi proizvode odgovore slične ljudskim, svi su i dalje previše skloni pogreškama da bi se sami koristili.

Dakle, koji je LLM najbolji za koji zadatak?

o3-mini (reasoner)

OpenAI, sa sjedištem u San Franciscu, Kalifornija, predstavio je svijetu LLM 2022. sa svojim besplatnim ChatGPT botom. Znanstvenici su uglavnom koristili bot za traženje informacija ili kao pomoćnika pri pisanju, na primjer za pisanje sažetaka, ali noviji modeli proširuju potencijalne upotrebe tehnologije. Prošlog rujna, u najvećem napretku tvrtke od tada, OpenAI je oduševio znanstvenike svojim o1 'modelom rasuđivanja', koji je slijedio s naprednijim o3 u prosincu. Oba modela rezoniranja rade sporije od samog LLM-a jer su obučeni odgovarati na upite korak po korak. Ovaj proces 'lanca misli', usmjeren na simulaciju ljudskog razmišljanja, pomogao im je da sruše teška mjerila u znanosti i matematici. Također ih je učinio dobrima u tehničkim zadacima, poput rješavanja problema kodiranja i ponovnog formatiranja podataka.

DeepSeek (the all-rounder)

DeepSeek-R1, lansiran prošli mjesec, ima mogućnosti jednake onima o1, ali je dostupan putem API-ja po nižoj cijeni. Također se razlikuje od OpenAI-jevih modela jer je otvorene težine, što znači da iako njegovi podaci o obuci nisu objavljeni, svatko može preuzeti temeljni model i prilagoditi ga svom specifičnom istraživačkom projektu.

DeepSeek-R1 ima neke nedostatke. Čini se da model ima posebno dug proces 'razmišljanja', što ga usporava i čini manje korisnim za traženje informacija ili razmišljanje. Zabrinutost oko sigurnosti unosa podataka u njegov API i chatbot navela je nekoliko vlada da radnicima u nacionalnim agencijama zabrane korištenje chatbota. Također se čini da je DeepSeek poduzeo manje mjera za ublažavanje svojih modela koji generiraju štetne rezultate nego njegovi komercijalni konkurenti.

Llama (the workhorse)

Llama je dugo bila popularna doktorska studija za istraživačku zajednicu. Mogućnost pokretanja LLM-a na osobnim ili institucionalnim poslužiteljima ključna je pri radu s vlasničkim ili zaštićenim podacima, kako bi se izbjeglo vraćanje osjetljivih informacija drugim korisnicima ili programerima.

Istraživači su izgradili Llamine modele za izradu LLM-ova koji predviđaju kristalnu strukturu materijala, kao i za simulaciju izlaza kvantnog računala.

Claude (the coder)

Izrađen od strane AI tvrtke Anthropic sa sjedištem u San Franciscu, Claude 3.5 Sonnet također može interpretirati vizualne informacije, kao što su karte i grafikoni, uz tekst. Osim toga, ima način rada koji mu omogućuje daljinsko upravljanje korisničkim računalom, što mu potencijalno omogućuje kontrolu drugog softvera.

Olmo (the really open one)

Modeli otvorenog koda, a ne samo oni otvorenog tipa, dolaze s podacima za obuku algoritma, kao i kodom koji se koristi za obuku i procjenu modela.

Proučavanje takvih modela omogućuje istraživačima da uđu u trag izvorima pristranosti u LLM-u do podataka o obuci, kao i da poboljšaju učinkovitost boljim razumijevanjem načina na koji algoritam dolazi do svojih rezultata. Trenutačno je glavna mana bilo kojeg otvorenog modela to što istraživači obično trebaju određenu stručnost da bi ih pokrenuli.