8.6 C
София

ИИ MuZero побеждава в игри, правилата на които никога не е виждал и не е изучавал

Най-четени

Даниел Десподовhttps://www.kaldata.com/
Ежедневен автор на новини. Увличам се от съвременни технологии, оръжие, информационна безопасност, спорт, наука и концепцията Internet of Things.

Създателите на DeepMind направиха още една стъпка към реализирането на мечтата за създаването на машина, която се уча самостоятелно, подобно на малко дете. За създаването на новия изкуствен интелект бе съобщено още през месец ноември тази година, но сега стана ясно, че компанията търси варианти за практическото използване на своите нови алгоритми.

DeepMind стана изключително известна през 2016 година, когато невронната мрежа с обратна връзка AlphaGo след изучаването на милиони партии, победи най-добрите майстори на играта Го. През 2018 година компанията представи ИИ AlphaZero, който самостоятелно се научи да играе шах, Го и други игри, без каквато и да било чужда помощ. А сега се появи новият изкуствен интелект MuZero, който дори не трябва предварително да знае правилата на съответната игра.

Новият ИИ прави един ход, след това още един, изучава границите на позволените действия и си отбелязва каква е главната цел – при шаха да бъде поставен в шах и мат, при Pac-Man да се изяде жълтата точка и т.н. След това той хвърля всичките си сили за да постигне тази цел – тоест, новият изкуствен интелект самостоятелно се самоусъвършенства. Подобно самообучение чрез наблюдаване на различните процеси и на собствените действия е идеално за ИИ, на който се налага да решава проблеми, които не са съвсем точно определени. В нашия свят тези задачи са предостатъчно.

Създателите на новия ИИ вече обмислят възможността за използването на MuZero за компресия на видео, предвиждат създаването на още един отдел на Alphabet, кой ще се занимава с използването на този изкуствен интелект в системите за автономно управление на транспортните средства, както и неговото използване върху допълнителното изучаване на дизайна на протеините.

С едновременното изучаване на правилата, околната среда и собственото поведение, което означава че може да се усъвършенства, MuZero значително превъзхожда другите изкуствени интелекти на DeepMind от гледна точка икономичност на използване на данните. В играта Ms. Pac-Man, новият ИИ е бил ограничен само до шест или седем симулации, което е твърде малко, за да се обхванат всички възможни действия – но той отново постига по-добри резултати от другите невронни мрежи.

Дори по време на своето самообучение новият ИИ не изисква толкова много ресурси. За да се науча да играя всички игри на Atari са достатъчни две или три седмици на компютърна система с един графичен процесор. Вече обученият по този начин ИИ, може да работи дори и в смартфоните. Причината за това е, че MuZero моделира само тези аспекти на околната среда, които са важни при процеса за вземане на решение.

Абонирай се
Извести ме за
guest
0 Коментара
Отзиви
Всички коментари

Нови ревюта

Подобни новини