Search
Close this search box.

Veštačka inteligencija ne razmišlja kao čovek – i to je ozbiljan problem

SciTech 07. apr 202518:30

chainarong06/Shutterastock

U poslednjih nekoliko godina, veštačka inteligencija (AI) više nije samo tehnički alat u rukama inženjera – ona je sve prisutnija u procesima odlučivanja koji direktno utiču na ljudske živote. Od medicinskih dijagnoza, preko pravosudnih presuda, do ocenjivanja učenika i selekcije kandidata za posao – AI donosi odluke koje mogu da budu za nekoga presudne. Ali, koliko je zapravo pouzdana?

Nova studija objavljena u februaru 2025. u uglednom časopisu Transactions on Machine Learning Research donosi hladan tuš za one koji se nadaju da će veštačka inteligencija uskoro dostići (ili čak prevazići) ljudsku sposobnost prosuđivanja.

Istraživači su otkrili da AI, iako izuzetno uspešna u prepoznavanju obrazaca, ima ozbiljan problem sa razumevanjem apstraktnih pravila, prepoznavanjem analogija i generalizacijom – sposobnostima koje su ljudima prirodne, prenosi Index.

AI vidi obrazac, čovek vidi smisao

Autori studije objašnjavaju da su veliki jezički modeli, poput GPT-a, pokazali dobre rezultate na brojnim testovima zaključivanja, uključujući i one koji ispituju razmišljanje u analogijama. Međutim, postavlja se pitanje – da li oni zaista razumeju ono što rade ili samo uspešno „imitiraju” logiku na osnovu ogromne količine prethodno naučenih podataka?

Drugim rečima – dok ljudi razumeju pravilo koje stoji iza nekog problema, AI modeli često samo prepoznaju sličnosti sa situacijama iz svoje baze podataka. I to je, kako piše MIT Technology Review, suštinska razlika između čoveka i mašine.

Testiranje u tri domena: slova, brojevi i priče

Da bi proverili kako se veštačka inteligencija snalazi u apstraktnom razmišljanju, istraživači su testirali GPT modele u tri različite oblasti:

Analogije sa nizovima slova

Numeričke matrice (brojčani obrasci)

Narativne analogije (kontekstualne priče)

Zadatke su rešavali i ljudi i AI, ali je u svakom slučaju napravljen korak dalje: pored standardnih testova, korišćene su i njihove modifikovane verzije, koje su bile dovoljno različite da zahtevaju apstraktnije zaključivanje. Ideja je bila jasna – ako AI zaista razume principe, trebalo bi da se snađe i u varijacijama zadataka koje ne liče na one na kojima je trenirana.

Rezultati su, međutim, bili poražavajući za AI.

U zadacima sa nizovima slova (npr. abcd → abce, pa se pita šta sledi za ijkl), većina ljudi je bez problema prepoznala obrazac i odgovorila „ijkm”.

GPT modeli su tu, takođe, bili uspešni.

Kod nešto složenijih primera – recimo, abbcd → abcd, pa se pita šta bi sledilo iz ijkkl – ljudi su prepoznali logiku uklanjanja dupliranog slova i rekli „ijkl”. GPT modeli su tu, međutim, počeli da greše.

Kako je zadatak postajao kompleksniji, i ljudi su imali više teškoća, ali njihova sposobnost da se snađu u nepoznatom i dalje je bila značajno veća od one koju su pokazali AI modeli.

Slično je bilo i u testovima brojčanih matrica – AI se dobro snalazio dok je obrazac bio poznat, ali je bio daleko manje uspešan kada je trebalo prepoznati logiku u varijacijama zadatka.

Najveće razlike su uočene u narativnim analogijama – situacijama u kojima je potrebno prepoznati suštinsku povezanost između priča, likova i njihovih odnosa. Tu je veštačka inteligencija pokazala slabosti: bila je osetljiva na redosled odgovora (što ne pogađa ljude) i imala je tendenciju parafraziranja umesto davanja jasnog odgovora.

AI pada gde ljudi briljiraju

U stvarnim životnim situacijama, sposobnost apstraktnog zaključivanja je najvažnija. Sudija, na primer, ne donosi odluku samo na osnovu presedana – on mora da prepozna da li se pravilo iz prethodnog slučaja može primeniti na novu situaciju. Lekar mora da razume da isti simptom može da ukazuje na potpuno različite bolesti, u zavisnosti od konteksta.

AI tu zakazuje. Studija je pokazala da modeli poput GPT-a imaju nizak kapacitet za tzv. zero-shot učenje – sposobnost da iznesu tačan zaključak bez prethodnog primera iz iste kategorije. Drugim rečima, ako veštačka inteligencija nije nešto slično već videla, velika je verovatnoća da će pogrešiti.

U domenu zdravstva, to može da znači pogrešnu dijagnozu ili terapiju. U pravosuđu – pogrešnu presudu. U obrazovanju – nepoštenu ocenu.

Problem nije u znanju – već u načinu razmišljanja, kako ističe jedna od autorki studije, dr Lora Luis.

„Problem nije u količini podataka, već u načinu na koji se oni koriste. Ljudi znaju kada pravilo važi, a kada ne – modeli to ne znaju”, kaže dr Luis.

AI sistemi danas briljiraju u prepoznavanju obrazaca – što više podataka, to su bolji, stoji dalje u studiji. Generalizacija, sposobnost da se iz specifičnih slučajeva izvuku opšta pravila i primene u novim situacijama, međutim, ostaje njihova najveća slabost.

Ključna poruka studije jeste da AI ne treba ocenjivati samo prema tačnosti odgovora, već i prema robusnosti i stabilnosti logike koju koristi. Ako se odgovor menja u zavisnosti od redosleda pitanja, načina na koji je formulisano ili konteksta u kojem se daje – to nije pouzdan sistem za donošenje ozbiljnih odluka.

Zato oni koji koriste veštačku inteligenciju moraju da razumeju ne samo šta AI može, već i gde su joj granice.

„Moramo prestati da očekujemo da AI razmišlja kao čovek. Umesto toga, moramo naučiti kako ona zaključuje i gde prestaje njena moć razumevanja”, zaključuje dr Luis.

Bez ljudskog nadzora, AI možda izgleda kao da zna šta radi – ali, suštinski, može da donosi pogrešne odluke.

n1info.rs

 

 

 

 

 

 

NOVOSTI

Povezane vijesti vijesti

Reklamni Prostor Prostor