Vještačka inteligencija izrađuje portrete na osnovu ljudskog glasa?

Neuronsku mrežu Speech2Face, računari koje misli na način sličan ljudskom mozgu, obučavali su naučnici na milionima edukativnih videozapisa u kojima je prikazano više od 100.000 ljudi dok govore.

Iz tog skupa podataka Speech2Face je naučio povezivati glasove s određenim fizičkim osobinama ljudskog lica, napisali su istraživači u studiji. Vještačka inteligencija je zatim upotrijebila audiozapis kako bi modelisao fotorealistično lice koje odgovara glasu. Nerecenzovani nalazi objavljeni su krajem prošlog mjeseca u online izdanju magazina arXiv.

Stvar još nije savršena, ali…

Srećom, još se ne zna kako tačno izgleda određeni pojedinac na osnovu samog glasa. Neuronska mreža prepoznala je određene znakove u govoru koji su upućivali na pol, dob i etničku pripadnost, osobinekoje dijele mnogi ljudi, izvijestili su autori studije.

‘Kao takav, model će proizvoditi samo lica prosječnog izgleda’, zapisali su naaučnici. ‘To neće proizvesti slike stvarnih ljudi.’

Lica koja je generisao Speech2Face – sva okrenuta naprijed i s neutralnim izrazima – nijesu tačno odgovarala ljudima iza glasova. Međutim, slike su obuhvatale tačne starosne grupe, nacionalnosti i polove pojedinaca, navodi se u studiji.

Međutim, interpretacije algoritma nijesu bile savršene. Na primjer, kada je vještačka inteligencija slušala audiozapis Azijca koji govori kineski, program je stvorio sliku azijskog lica. Međutim, kada je isti čovjek govorio na engleskom jeziku, vještačka inteligencija je stvorila lice bijelog čovjeka, izvijestili su naučnici.

Polno pristrani program

Algoritam je takođe pokazao polnu pristranost, povezujući niske glasove s muškim licima i visoke glasove sa ženskim licima. A budući da su podaci prikupljani s obrazovnih zapisa s YouTubea, oni ne predstavljaju cijelu svjetsku populaciju, napisali su istraživači.

Problem je nastao i kad je Nick Sullivan, šef kriptografskog odjeljenja firme za internet bezbjednost sigurnost Cloudflare, otkrio da se njegovo lice pojavilo kao jedan od primjera u programu Speech2Face. Sullivan nije dao svoj pristanak za pojavljivanje u studiji, ali smatra se da su videozapisi s YouTubea dostupni istraživačima bez dodatnih odobrenja.

Vještačka inteligencija izrađuje portrete na osnovu ljudskog glasa?

Stvar još nije savršena, ali…

Polno pristrani program

Najnovije

Everton u luci spasa Liverpul se oprostio od titule

U četvrtak promjenljivo, do 18 stepeni

Građani u Turskoj bojkotuju restorane, kafiće i pekare zbog previsokih cijena

Gdje u petak neće biti struje

Google mora da plati 62 miliona: Pratio lokaciju korisnika čak i kada su to...

Najčitanije

Povezano

U januaru studija održivosti Kotora kao turističke destinacije

Begić podijelio rezultate važnog istraživanja: Otkrivena povezanost autizma kod dječaka sa konzumacijom vještačkog zaslađivača

Završena izrada dokumenta Procjena sposobnosti upravljanja rizicima od katastrofa Crne Gore

Šta najdublje polarizuje Evropljane?

Komentari