Невронната мрежа AlphaStar победи професионалистите на StarCraft II с резултат 10:1

11
2751

DeepMind, дъщерната компания на Alphabet, специализирана в развитието на изкуствения интелект, направи нов пробив в тази област: за първи път ИИ успя категорично да победи човека в стратегията StarCraft II. През месец декември 2018 година конволюционната невронна мрежа AlphaStar буквално е размазала професионалните геймъри TLO (Дарио Вюнш от Германия) и MaNa (Гжегош Коминц от Полша), като ги победи десет пъти подред. Компанията обяви това събитие вчера и показа геймплея в YouTube и Twitch.

Както хората, така и програмата с елементи на изкуствен интелект играят като протоси. TLO не е специализиран в тази раса, но MaNa оказва сериозно съпротивление и дори печели една игра.

За StarCraft отдавна се разработват ботове и дори има състезания между подобни програми, но досега алгоритмите не можеха да победят човека. Въпреки че невронната мрежа AlphaGo победи шампионите на играта Го, която се считаше твърде сложна за машините, със стратегиите в реално време всичко е съвсем различно. Игрите от типа на StarCraft II са игри с непълна информация, в които геймърите не могат да видят действията на своя противник. В тези игри на практика няма оптимална стратегия. Изисква се време, за да се разберат действията на противника. DeepMind каза само, че е използвана нова специализирана архитектура за невронни мрежи, която показва зачатъци на стратегическо мислене.

Компанията DeepMind официално демонстрира, че тяхната нова програма с елементи на изкуствен интелект AlphaStar може да победи професионалните геймъри. При създаването на AlphaStar е използван метод за дълбоко машинно обучение с обратна връзка. Използвани са предоставените от Blizzard анонимни записи на игри на реални геймъри. Обучената с помощта на тези записи невронна мрежа се е научила да побеждава алгоритмите на StarCraft II, настроени на най-висока сложност, в 95% от игрите. След това специалистите на DeepMind са накарали програмата да играе сама със себе си. AlphaStar се е обучавала да играе като протос в среда с име AlphaStar League. Интересно е, че обучението в средата AlphaStar League е продължило 14 дни, което е еквивалентно на 200 години реална игра StarCraft II.

Невронната мрежа първоначално печели пет последователни мача срещу TLO, а след това друга версия на същата невронна мрежа побеждава пет пъти подред MaNa. И двамата професионалисти са включени в топ-100 на най-силните в света професионални играчи на StarCraft II. Любопитно е, че APM (средният брой действия в минута) на невронната мрежа е значително по-малък от този на нейните противници.

DeepMind показа видео, демонстриращо какво вижда ИИ и какво – MaNa.

В първата гейм сесия TLO играе срещу пет различни версии на AlphaStar. Професионалният геймър се оплака, че не може да се адаптира към играта на противника. Резултатът е 5:0 за AlphaStar.

След една седмица, след оптимизация на настройките, започват мачовете с MaNa. Програмата отново печели пет игри поред, но професионалният геймър я побеждава в последния 6-ти мач и има с какво да се гордее.

Първата част на StarCraft също е сложна задача за методите на дълбокото машинно обучение. През месец октомври 2017 година Facebook показа свой бот за тази игра, но той се оказа дори по-слаб от програмите на любителите програмисти. Но AlphaStar е нещо съвсем друго и действа на съвсем ново ниво.

За да разбере принципите на стратегическото планиране, AlphaStar е трябвало да усвои нова логика на мисленето. Методите, разработени за тази игра могат да се окажат полезни и в практиката – в търговията и във военното планиране.

Ограничеността от обучението чрез игри

DeepMind е известна със своя софтуер с елементи на изкуствен интелект, който победи всички шампиони по шах и Го. Видеоигрите са един отличен начин да се измери прогреса в областта на изкуствения интелект. Но това е една много тясна област – както и всички предишнi програми от този тип, AlphaGo може да изпълнява само една задача, макар и невероятно добре.

Редица експерти в тази област са на мнение, че тясноспециализираното използване на ИИ нямат нищо общо с един силен изкуствен интелект. „Програмите, които могат майсторски и нечовешки добре да играят конкретна видеоигра или настолна игра, изцяло се сриват и при най-малка промяна на условията – например, промяна на фона на екрана“ – каза професор Мелъни Мичъл от университета в Портланд. „Тези грешки могат да бъдат както смешни и безвредни, така и катастрофални„.

Мичъл счита, че надпреварата в комерсиализацията на на ИИ сa оказали огромен натиск върху специалистите по изкуствен интелект, които създават системи работещи „достатъчно добре“ в тясноспециализирани задачи. Но създаването на надежден ИИ изисква по-задълбочено познаване на нашите собствени способности и ново разбиране на когнитивните механизми.

Нашето собствено схващане и разбиране на всяка една конкретна ситуация, с която се сблъскваме, се базира на нашите човешки интуитивни общи понятия на това, как е устроен сетът, на разбирането на целите, мотивите и вероятното поведение на другите живи същества, особено другите хора. Освен това, нашето разбиране на света се базира на нашите основни способности да обобщаваме това, което знаем, да формираме абстрактни концепции и правим аналогии – тоест, гъвкаво да адаптираме нашите концепции към новите ситуации. В продължение на десетилетия учените експериментират с обучаването на ИИ на на здрав смисъл и устойчиви способности към обобщаване. Но засега прогресът в това отношение е нищожен„.

Невронната мрежа AlphaStar засега умее да играе само като протос. Но разработчиците обявиха плановете си съвсем скоро да я обучат да играе и за другите раси.

11
ДОБАВИ КОМЕНТАР

avatar
5 Коментари
6 Отговори на коментарите
10 Последователи
 
Коментарът с най-много реакции
Най-горещият коментар
10 Автори на коментарите
дфсдфassaИван З.РадоСатошо Накомото Автори на последните коментари
  Абонирай се  
нови стари оценка
Извести ме за
Кольо
Кольо

Компютрите станаха по-умни от хората. За щастие, все още не обикновените домашни ПЦ-та, а бая по-големи машини. Желязото на компанията е с над 1000 централни процесора и над 170 графични ускорителя на изчисленията.

Denu
Denu

Щ. стига глупости. Компота немой да е па умен от кофа за боклук.
Програмата бие в SC2 понеже гради 3 армии едновремено а мозъка на човек е невъзможно да е на 3 места едновремено.

Накрая програмистите осакатиха alphastar за да не разберът хората че вече са загубили бъдещита битката с skynet.

дфсдф
дфсдф

Не бих казал, че са го осакатили. Mana откри слабост в алгоритъма което е и най големия проблем на ИИ има ли глич в логиката спукана му е работата…

хаха
хаха

Тези хюманета се надяват да кликат и реагират по-бързо от компютъра? Още от едно време зная, че единственият начин да победиш тетриса е да изключиш турбото на компутера

Радо
Радо

Глупости на таркалета. Превъртал съм оригиналния тетрис много пъти!

Калин
Калин

Въпрос на време е да победи и корейците. Това, което се вижда е, че ИИ може по-добре да се приспособи към непознатия за него стил на игра на човеците, отколкото обратно.А топ корейците са известни точно с това – не играят играта, а играят срещу навиците и начина на мислене на съперника.

gotqn
gotqn

Разбира се, че не си прав. Даже се появи ии, който победи топ корейците – серал. Вярно, че пропусна дългоочаквания мач с мару, но първото място си е първо.

Калин
Калин

Както знаем, една птичка пролет не прави. Серал е номер едно, корейците все още си остават мащаба на играта 🙂

Сатошо Накомото
Сатошо Накомото

Скоро окончателно ще мине времето на сблъсъка на човек срещу машина. Изхода му е ясен. Идва времето на сблъсъка машината на човека срещу машината на другия човек.

Иван З.
Иван З.

„…победи всички шампиони по шах и Го“? На Го донякъде победи хора шампиони, но на шах досега не е играла с човек. Изглежда никой няма да се навие… ще бъде голям резил. Макар че не би трябвало да се схваща така.

assa
assa

Много оддавна компютрите победиха човека в шаха. Няма смисъл да се прави отново.