Četvrtak, 25 Aprila, 2024
Rubrika:

Vještačka inteligencija izrađuje portrete na osnovu ljudskog glasa?

Speech2Face još nije bezgrešan, ali prilično dobro raspoznaje rasu, pol i starosnu dob govornika

Neuronsku mrežu Speech2Face, računari koje misli na način sličan ljudskom mozgu, obučavali su naučnici na milionima edukativnih videozapisa u kojima je prikazano više od 100.000 ljudi dok govore.

Iz tog skupa podataka Speech2Face je naučio povezivati glasove s određenim fizičkim osobinama ljudskog lica, napisali su istraživači u studiji. Vještačka inteligencija je zatim upotrijebila audiozapis kako bi modelisao fotorealistično lice koje odgovara glasu. Nerecenzovani nalazi objavljeni su krajem prošlog mjeseca u online izdanju magazina arXiv.

Stvar još nije savršena, ali…

Srećom, još se ne zna kako tačno izgleda određeni pojedinac na osnovu samog glasa. Neuronska mreža prepoznala je određene znakove u govoru koji su upućivali na pol, dob i etničku pripadnost, osobinekoje dijele mnogi ljudi, izvijestili su autori studije.

‘Kao takav, model će proizvoditi samo lica prosječnog izgleda’, zapisali su naaučnici. ‘To neće proizvesti slike stvarnih ljudi.’

Lica koja je generisao Speech2Face – sva okrenuta naprijed i s neutralnim izrazima – nijesu tačno odgovarala ljudima iza glasova. Međutim, slike su obuhvatale tačne starosne grupe, nacionalnosti i polove pojedinaca, navodi se u studiji.

Međutim, interpretacije algoritma nijesu bile savršene. Na primjer, kada je vještačka inteligencija slušala audiozapis Azijca koji govori kineski, program je stvorio sliku azijskog lica. Međutim, kada je isti čovjek govorio na engleskom jeziku, vještačka inteligencija je stvorila lice bijelog čovjeka, izvijestili su naučnici.

Polno pristrani program

Algoritam je takođe pokazao polnu pristranost, povezujući niske glasove s muškim licima i visoke glasove sa ženskim licima. A budući da su podaci prikupljani s obrazovnih zapisa s YouTubea, oni ne predstavljaju cijelu svjetsku populaciju, napisali su istraživači.

Problem je nastao i kad je Nick Sullivan, šef kriptografskog odjeljenja firme za internet bezbjednost sigurnost Cloudflare, otkrio da se njegovo lice pojavilo kao jedan od primjera u programu Speech2Face. Sullivan nije dao svoj pristanak za pojavljivanje u studiji, ali smatra se da su videozapisi s YouTubea dostupni istraživačima bez dodatnih odobrenja.

Najnovije

Najčitanije

Povezano

Komentari

Subscribe
Notify of

0 Komentara
Inline Feedbacks
Pregedaj sve