Звеното в Alphabet, занимаващо се с разработки в областта на изкуствен интелект DeepMind са успели да създадат AI система, която играе успешно Stratego, настолна игра, която се счита за далеч по-сложна от Go – древната китайска игра, с която беше обучавана досега изкуственият интелект.

DeepNash, каквото име са дали DeepMind на системата, е успяла да постигне успех в 84% от мачовете си с човешки противници, които са експерти в Stratego. Става дума за настолна игра за двама човека, която има сходства с шаха. Всеки играч получава определен брой игрови пулове, които мести по дъската по определени правила до победа. За разлика от шахматната игра обаче, играещият Stratego има ограничено знание за ходовете на противника си, привеждат SiliconAngle. Играещият може да знае къде другият е поставил на дъската определен пул, но не знае какъв конкретна фигура е това. Тази и друга особености правят играта на Stratego далеч по-трудна от Go.

Друга разлика в сравнение с шахмата е, че в Stratego има далеч по-много вероятни ходове. Така например, ако броя на потенциалните тактики, които играч може да използва в една настолна игра се отбелязва, като число на сложност на игровото дърво. При шахмата то се изчислява на 10 на степен 123, докато при Stratego е 10 на степен 535. DeepMind споделят, че традиционните методи за обучението на една AI система за игра не могат да се приложат към Stratego. За тази цел те създават метод, наречен R-NaD, която е основана на математическото поле от игровите теории. DeepNash използва план за успех в Stratego чрез симулация на т.нар. „Равновесие на Наш“ (по името на американския математик Джон Наш) – положение, при което всеки играч на Stratego използва стратегия, която има най-висок шанс за победа над стратегията на другия играч. По този начин противниците правят оптималния брой ходове, допустими в мач.

За да изпитат разработената от тях версия, те я пуснали да играе в началото с по-стари AI системи, пригодени да играят Stratego. Процентът на успеваемост на DeepNash срещу тях бил почти пълен – 97%. След това я изправии в онлайн версия на играта с реални играчи, където DeepNash постигнал успех от 84%. Системата успяла да разработи напълно неразгадаеми за противниците си стратегии, като началното разположение на пуловете винаги било дотолкова различно, че другият играч не можел да открие модел в поведението на изкуствения интелект в серията от рундове, играни помежду им.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

Абонирай се
Извести ме за
guest

0 Коментара
Отзиви
Всички коментари