Ponedjeljak, 29 Aprila, 2024
Rubrika:

Firme koje razvijaju vještačku inteligenciju uskoro bi se mogle suočiti s neobičnim problemom

Šta kad podaci ''presuše''?

Većina firmi koje razvijaju vještačku inteligenciju koristi isti princip za “učenje” svojih sistema. “Hrane” ih prvo podacima iz vlastitih baza podataka, a onda i podacima s interneta.

Ali, šta kad ti podaci “presuše”? Upravo se s takvim problemom pomalo susreću najveće firme koje su razvile i najpoznatije AI alate. Prema nekim procjenama podaci za obuku mogli bi presušiti već u sljedećih nekoliko godina. Kako piše Wall Street Journal, neke firme već traže alternativne izvore podataka poput javno dostupnih video transkripata, a čak se i okreću “sintetičkim podacima” koje generiše druga umjetna inteligencija.

Međutim, nije problem u tome što te firme traže alternativne izvore podataka, već što se sve češće koriste pomalo kontroverznim sredstvima za njihovo stvaranje.

Prema izvorima WSJ, OpeAI je planirao koristiti transkripte javnih videa s YouTubea za obučavanje svog alata GPT-5. Jesu li ih i upotrijebili, za sad nije poznato.

“Sintetički podaci” našli su se u centru opsežne rasprave posljednjih mjeseci, nakon što su istraživači prošle godine otkrili da bi obučavanje AI alata podacima koje je generirao AI, doveli do kolapsa cijelog modela. Firme poput OpenAI pokušavaju napraviti kvalitetnije “sintetičke podatke”, ali ne otkrivaju šta bi to tačno značilo, prenosi Zimo.

S druge strane, postoji još jedno rješenje – da se tvrtke fokusiraju na ispravljanje grešaka koje njihove umjetne inteligencije čine i samo pričekaju da se stvore novi podaci. Uostalom, svake se minute na interentu stvaraju novi podaci koje je moguće upotrijebiti za poboljšavanje vještačke inteligencije.

Najnovije

Najčitanije

Povezano

Komentari

Subscribe
Notify of

0 Komentara
Inline Feedbacks
Pregedaj sve