Специалистите от лабораторията на армията на САЩ и Тексаския университет в Остин създадоха алгоритъм, който учи роботите да изпълняват задачи, взаимодействайки с инструктор-човек. Алгоритъмът се нарича Deep TAMER.

Алгоритъмът Deep TAMER с помощта на дълбоко машинно обучение дава възможност на робота да тренира своите задачи чрез гледане на ускорено видео под наблюдението на човек-треньор. Човекът наблюдава действията на робота и подава обратна връзка от типа „това беше добре“ или „слаба работа“ – подобно на начина по който се дресират кучетата.

Новият тип обучение е истински пробив в скоростта на приспособимост на роботите, които виждат света единствено чрез компютърни изображения. Това може да се окаже първата стъпка в създаването на пълноценни автономни устройства, които са в състояние да изпълняват сложни задачи в реалния свят.

Съвременните методи на обучение изискват много дълго време на взаимодействие на роботите с околната среда, за да се научат на оптималното изпълнение на дадено задание. През това време роботът може да извърши не само неправилни, но и катастрофални действия – например, да падне от някоя скала. Помощта на хората рязко ускорява обучението и помага да се избегнат подобни капани.

0 0 глас
Оценете статията
Абонирай се
Извести ме за
guest
1 Коментар
стари
нови оценка
Отзиви
Всички коментари