Когато Deep Blue победи световния шампион по шах Гари Каспаров през 1997, много хора си помислиха, че изкуственият интелект е вече сред нас. До тогава никой не си и мислеше, че компютър ще победи един от най-добрите шахматисти в историята. Оказаха се в грешка.

Deep Blue бе старателно програмиран на всички нива да играе шах. Истината обаче е, че това отнема много време и усилия. Изцяло зависимо е от ясни правила и попада в предварително ясни граници. Това значи, че той не може да бъде приложен за нещо по-сложно, особено в реалния живот.

Следващата революция се случва след десетилетие и половина, когато имаме повече изчислителна мощ и вече развито машинно обучение на база набор от информация.

Като концепция това е стара идея, но отнема доста време, за да се материализира

В днешно време, машинното самообучение вече е част от ежедневието. Чрез различни алгоритми за дълбоко самообучение се постигат нови и нови върхове. Символичният изкуствен интелект от породата на Deep Blue вече е в историята.

Ключовото в настоящия момент е, че алгоритмите могат да се самонаписват. Взимаш база данни с информация, правиш програмиране на високо ниво и получаваш алгоритъм, който се учи от собствения си опит. Тук вече няма програмиране на всяко възможно събитие.

Пример за успешен такъв AI е DeepMind на Alphabet, компанията майка на Google. Организацията иска да подобри автоматизацията, като разработи алгоритми за дълбоко самообучение, които сами да се справят с програмирането. До този момент, това е работата на най-добрите от най-добрите компютърни учени. Понякога отнема години.

В доклад, публикуван наскоро на сървъра arXib, база с научни трудове, които все още чакат проверка, екипът зад DeepMind описва нов алгоритъм за дълбоко самообучение с утвърждаване.

Този алгоритъм е успял да открие собствената си “value” функция, и то от нулата. Тази функция представлява критично правило за програмиране в областта на дълбокото самообучение, предават от SingularityHub. Накратко, алгоритъмът оценява всички варианти на следващата стъпка от работата си с числова стойност, което му помага да реши как да продължи.

Алгоритъмът продължава да бъде ефективен извън средата, в която е трениран

Продължава с игра на Atari игри, друга сложна задача. Нивото на уменията на алгоритъма на моменти е конкурентно на създадени от човешка ръка алгоритми. Успява да постигне свръхчовешко ниво в 14 различни игри.

DeepMind смята, че подходът може да ускори разработката на алгоритми за самообучение с утвърждаване. Може дори да промени фокуса на учените, които вместо да прекарват години в писането на алгоритми, да работят върху подобряването на средата, в която алгоритмите сами се тренират. Ако тази среда става все по-добра и по-добра, алгоритмите сами ще могат да вършат работата си по-добре и дори да се стига до положителни резултати, които не сме очаквали в началото.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

Абонирай се
Извести ме за
guest

0 Коментара
Отзиви
Всички коментари