Когато разглеждат снимки, хората с лекота си представят заснетите триизмерни обекти. Дори и ако част от тях е скрита, съвсем не е сложно да се предположи как точно изглежда.

За изкуствения интелект това е твърде сложно. Но специалистите на проекта DeepMind не само научиха ИИ да върши всичко това, но и да преобразува 2D изображенията в триизмерни обекти.

Новата система се нарича Generative Query Network — GQN. За да обучат ИИ да анализира двумерните сцени, учените са му показвали изображенията на една и съща сцена под различни ъгли на виждане. Тази верига от изображения е използвана от ИИ за да разбере принципите на промяна на обектите при смяната на ракурса. Чрез този подход невронната мрежа е в състояние да прогнозира, как точно ще изглежда сцената с обектите от друг ъгъл на виждане. Системата отчита не само разположението на обектите в пространството, но и тяхното осветяване.

Али Елзами, един от създателите на проекта каза: „Алгоритъмът се обучава съвсем като хората. След като многократно разгледа даден обект, ИИ анализира неговите характеристики. Запомня ги и след това използва тези характеристики и разликите между тях при обработката на други обекти. Към днешен ден изкуственият интелект само от две-три снимки може да пресъздаде цял лабиринт, независимо колко е сложен„.

ДОБАВИ КОМЕНТАР

avatar
  Абонирай се  
Извести ме за