Невронната мрежа AlphaStar победи професионалистите на StarCraft II с резултат 10:1

11
3102

DeepMind, дъщерната компания на Alphabet, специализирана в развитието на изкуствения интелект, направи нов пробив в тази област: за първи път ИИ успя категорично да победи човека в стратегията StarCraft II. През месец декември 2018 година конволюционната невронна мрежа AlphaStar буквално е размазала професионалните геймъри TLO (Дарио Вюнш от Германия) и MaNa (Гжегош Коминц от Полша), като ги победи десет пъти подред. Компанията обяви това събитие вчера и показа геймплея в YouTube и Twitch.

Както хората, така и програмата с елементи на изкуствен интелект играят като протоси. TLO не е специализиран в тази раса, но MaNa оказва сериозно съпротивление и дори печели една игра.

За StarCraft отдавна се разработват ботове и дори има състезания между подобни програми, но досега алгоритмите не можеха да победят човека. Въпреки че невронната мрежа AlphaGo победи шампионите на играта Го, която се считаше твърде сложна за машините, със стратегиите в реално време всичко е съвсем различно. Игрите от типа на StarCraft II са игри с непълна информация, в които геймърите не могат да видят действията на своя противник. В тези игри на практика няма оптимална стратегия. Изисква се време, за да се разберат действията на противника. DeepMind каза само, че е използвана нова специализирана архитектура за невронни мрежи, която показва зачатъци на стратегическо мислене.

Компанията DeepMind официално демонстрира, че тяхната нова програма с елементи на изкуствен интелект AlphaStar може да победи професионалните геймъри. При създаването на AlphaStar е използван метод за дълбоко машинно обучение с обратна връзка. Използвани са предоставените от Blizzard анонимни записи на игри на реални геймъри. Обучената с помощта на тези записи невронна мрежа се е научила да побеждава алгоритмите на StarCraft II, настроени на най-висока сложност, в 95% от игрите. След това специалистите на DeepMind са накарали програмата да играе сама със себе си. AlphaStar се е обучавала да играе като протос в среда с име AlphaStar League. Интересно е, че обучението в средата AlphaStar League е продължило 14 дни, което е еквивалентно на 200 години реална игра StarCraft II.

Невронната мрежа първоначално печели пет последователни мача срещу TLO, а след това друга версия на същата невронна мрежа побеждава пет пъти подред MaNa. И двамата професионалисти са включени в топ-100 на най-силните в света професионални играчи на StarCraft II. Любопитно е, че APM (средният брой действия в минута) на невронната мрежа е значително по-малък от този на нейните противници.

DeepMind показа видео, демонстриращо какво вижда ИИ и какво – MaNa.

В първата гейм сесия TLO играе срещу пет различни версии на AlphaStar. Професионалният геймър се оплака, че не може да се адаптира към играта на противника. Резултатът е 5:0 за AlphaStar.

След една седмица, след оптимизация на настройките, започват мачовете с MaNa. Програмата отново печели пет игри поред, но професионалният геймър я побеждава в последния 6-ти мач и има с какво да се гордее.

Първата част на StarCraft също е сложна задача за методите на дълбокото машинно обучение. През месец октомври 2017 година Facebook показа свой бот за тази игра, но той се оказа дори по-слаб от програмите на любителите програмисти. Но AlphaStar е нещо съвсем друго и действа на съвсем ново ниво.

За да разбере принципите на стратегическото планиране, AlphaStar е трябвало да усвои нова логика на мисленето. Методите, разработени за тази игра могат да се окажат полезни и в практиката – в търговията и във военното планиране.

Ограничеността от обучението чрез игри

DeepMind е известна със своя софтуер с елементи на изкуствен интелект, който победи всички шампиони по шах и Го. Видеоигрите са един отличен начин да се измери прогреса в областта на изкуствения интелект. Но това е една много тясна област – както и всички предишнi програми от този тип, AlphaGo може да изпълнява само една задача, макар и невероятно добре.

Редица експерти в тази област са на мнение, че тясноспециализираното използване на ИИ нямат нищо общо с един силен изкуствен интелект. „Програмите, които могат майсторски и нечовешки добре да играят конкретна видеоигра или настолна игра, изцяло се сриват и при най-малка промяна на условията – например, промяна на фона на екрана“ – каза професор Мелъни Мичъл от университета в Портланд. „Тези грешки могат да бъдат както смешни и безвредни, така и катастрофални„.

Мичъл счита, че надпреварата в комерсиализацията на на ИИ сa оказали огромен натиск върху специалистите по изкуствен интелект, които създават системи работещи „достатъчно добре“ в тясноспециализирани задачи. Но създаването на надежден ИИ изисква по-задълбочено познаване на нашите собствени способности и ново разбиране на когнитивните механизми.

Нашето собствено схващане и разбиране на всяка една конкретна ситуация, с която се сблъскваме, се базира на нашите човешки интуитивни общи понятия на това, как е устроен сетът, на разбирането на целите, мотивите и вероятното поведение на другите живи същества, особено другите хора. Освен това, нашето разбиране на света се базира на нашите основни способности да обобщаваме това, което знаем, да формираме абстрактни концепции и правим аналогии – тоест, гъвкаво да адаптираме нашите концепции към новите ситуации. В продължение на десетилетия учените експериментират с обучаването на ИИ на на здрав смисъл и устойчиви способности към обобщаване. Но засега прогресът в това отношение е нищожен„.

Невронната мрежа AlphaStar засега умее да играе само като протос. Но разработчиците обявиха плановете си съвсем скоро да я обучат да играе и за другите раси.

0 0 глас
Оценете статията
Абонирай се
Извести ме за
guest
11 Коментара
стари
нови оценка
Отзиви
Всички коментари