Četvrtak, 25 Aprila, 2024
Rubrika:

Google USM jezički model za cilj ima razumijevanje čak 1000 jezika

Google je podijelio više detalja o svom Universal Speech Model (USM), sistemu koji kompanija opisuje kao ''kritičan korak'' u ostvarenju svojih ciljeva

Google USM AI jezički model ima za cilj da podrži čak 1000 različitih jezika i bude u stanju da ih prepoznaje i prevodi u realnom vremenu.

Dok se Microsoft i Google takmiče čiji AI chatbot je bolji, ta funkcija je samo jedan dio mogućnosti koje su u stanju da pruže mašinsko učenje i jezički modeli. Uz glasine o predstavljanju više od 20 proizvoda koji se oslanjaju na vieštačku inteligenciju tokom godišnje I/O konferencije koja će se održati 10. maja, kompanija nastavlja i sa planom da njihov Google USM AI jezički model podrži čak 1000 različitih jezika.

Kako prenosi The Verge, u postu koji je objavljen u ponedjeljak, Google je podijelio više detalja o svom Universal Speech Model (USM), sistemu koji kompanija opisuje kao “kritičan korak” u ostvarenju svojih ciljeva.

Prošlog novembra, Google je prilikom predstavljanja USM najavio planove da kreira jezički model koji podržava 1000 najčešće govorenih svjetskih jezika. Kompanija USM opisuje kao “porodicu najnaprednijih jezičkih modela”, sa dvije milijarde parametara treniranih na 12 miliona sati govora i 28 milijardi rečenica na preko 300 jezika.

USM, koji Youtube već koristi kako bi generisao titlove, takođe podržava i automatsko prepoznavanje govora (automatic speech recognition, ASR). Ova funkcija automatski detektuje i prevodi jezike poput engleskog, mandarinskog, amharic, cebuano, asameskog i dr.

Google tvrdi da u ovom trenutku USM podržava preko 100 jezika, što će služiti kao temelj za nadgradnju znatno šireg sistema. Meta takođe radi na razvoju sličnog alata za prevođenje putem vještačke inteligencije, ali je on još uvijek u ranoj fazi razvoja.

Jedna od oblasti primene ove tehnologije bi mogle biti i naočare za proširenu stvarnost (AR), poput koncepta koji je Google prikazao tokom svoje I/O konferencije prošle godine. Takve naočare bi bile u stanju da detektuju govor i jezik i pruže prevod u relanom vremenu koji bi vam bio prikazan pred očima, poput onoga što je TCL prikazao na MWC sajmu.

Iako je ovakva tehnologija koja savršeno funkcioniše još uvijek daleko, zvuči kao nešto realno dostižno i pored gafova kakav je bio arapski prevod na tabli iza govornika prilikom Google Translate prezentacije.

Najnovije

Najčitanije

Povezano

Komentari

Subscribe
Notify of

0 Komentara
Inline Feedbacks
Pregedaj sve