Google USM AI jezički model ima za cilj da podrži čak 1000 različitih jezika i bude u stanju da ih prepoznaje i prevodi u realnom vremenu.
Dok se Microsoft i Google takmiče čiji AI chatbot je bolji, ta funkcija je samo jedan dio mogućnosti koje su u stanju da pruže mašinsko učenje i jezički modeli. Uz glasine o predstavljanju više od 20 proizvoda koji se oslanjaju na vieštačku inteligenciju tokom godišnje I/O konferencije koja će se održati 10. maja, kompanija nastavlja i sa planom da njihov Google USM AI jezički model podrži čak 1000 različitih jezika.
Kako prenosi The Verge, u postu koji je objavljen u ponedjeljak, Google je podijelio više detalja o svom Universal Speech Model (USM), sistemu koji kompanija opisuje kao “kritičan korak” u ostvarenju svojih ciljeva.
Prošlog novembra, Google je prilikom predstavljanja USM najavio planove da kreira jezički model koji podržava 1000 najčešće govorenih svjetskih jezika. Kompanija USM opisuje kao “porodicu najnaprednijih jezičkih modela”, sa dvije milijarde parametara treniranih na 12 miliona sati govora i 28 milijardi rečenica na preko 300 jezika.
Congrats to @Google for getting Arabic script backwards & disconnected during @sundarpichai‘s presentation on *Google Translate*, because small independent startups like Google can't afford to hire anyone with a 4 year olds’ elementary school level knowledge of Arabic writing. pic.twitter.com/pSEvHTFORv
— Rami Ismail (رامي) (@tha_rami) May 11, 2022
USM, koji Youtube već koristi kako bi generisao titlove, takođe podržava i automatsko prepoznavanje govora (automatic speech recognition, ASR). Ova funkcija automatski detektuje i prevodi jezike poput engleskog, mandarinskog, amharic, cebuano, asameskog i dr.
Google tvrdi da u ovom trenutku USM podržava preko 100 jezika, što će služiti kao temelj za nadgradnju znatno šireg sistema. Meta takođe radi na razvoju sličnog alata za prevođenje putem vještačke inteligencije, ali je on još uvijek u ranoj fazi razvoja.
Jedna od oblasti primene ove tehnologije bi mogle biti i naočare za proširenu stvarnost (AR), poput koncepta koji je Google prikazao tokom svoje I/O konferencije prošle godine. Takve naočare bi bile u stanju da detektuju govor i jezik i pruže prevod u relanom vremenu koji bi vam bio prikazan pred očima, poput onoga što je TCL prikazao na MWC sajmu.
Iako je ovakva tehnologija koja savršeno funkcioniše još uvijek daleko, zvuči kao nešto realno dostižno i pored gafova kakav je bio arapski prevod na tabli iza govornika prilikom Google Translate prezentacije.