Petak, 26 Aprila, 2024
Rubrika:

DeepMind: Kad AI samostalno savladava komplikovane igre

Neuralna AI mreža je proučavala igru preko procesa koji su slični onome kako funkcioniše ljudski mozak, budući da neuralne mreže prilično podsjećaju na neurone

Još se 2018. godine pisalo o tome da bi profesionalni šahisti, ali i oni koji šah igraju iz zabave, mogli da dobiju novog rivala, budući da se u to vrijeme pojavila AI platforma AlphaZero koju su opisali kao šahovskog majstora budućnosti. Kompanija je prije toga objavila i AlphaGo koji je mogao da igra igru Go, a svi sistemi su unaprijed znali pravila igra za koje su napravljeni. Sada se pojavio i MuZero, koji ne mora da zna pravila da bi se upustio u igranje šaha, igara Go i Shogi, te izabrane Atari kolekcije.

Nalik ljudskom mozgu

AlphaZero iz 2018. je proizvod kompanije DeepMind Technologies, a pored šaha igra i shogi i Go – još dvije igre koje u podjednako teške, ako ne i teže od šahovskih partija. Platforma je došla nakon nekoliko godina istraživanja, kao naslednik AlphaGo Zero iz 2017. godine. Od svog prethodnika se razlikuje po tome što joj nije bila potrebna ljudska pomoć u učenju igre, te je proces od temelja savladala potpuno samostalno.

Naime, neuralna AI mreža je proučavala igru preko procesa koji su slični onome kako funkcioniše ljudski mozak, budući da neuralne mreže prilično podsjećaju na neurone. Tako je AlphaZero šah trenirala devet sati, shogi 12 sati, i Go 13 dana, i iznova ponavljala iste poteze, što je na kraju dovelo do toga da savlada sve tri igre. Procesi su bili osnaženi i jakim hardverom, kojeg stručnjaci opisuju kao ”Mac Pro na steroidima”, a koji ima pet hiljada TPU-a koji služe samo za treniranje.

Novi MuZero se zasniva na algoritmima koji mogu da se prilagode situaciji u kojoj ne znaju pravila igre. U procesu je korišćen pristup ”lookahead search”, u okviru kojeg algoritam može da ”razmotri buduća stanja i u skladu sa tim planira sljedeći potez”. Sistem tako funkcioniše slično poput ljudskih igrača, te u razmatranje uzima i poteze protivnika. Može da planira nekoliko poteza unaprijed, te prednost daje onima za koje smatra da bi mogli da ga odvedu do pobjede.

Najnovije

Najčitanije

Povezano

Komentari

Subscribe
Notify of

0 Komentara
Inline Feedbacks
Pregedaj sve