В интернет има редица стартъпи, които могат да възстановяват 3D структурата на лицето по снимки. След създаването на триизмерния модел се появява възможност, например да се смени прическата, да се пробват слънчеви очила, да се пусне брада и т.н.

Но сега бизнесът с подобни услуги е под заплаха, понеже тяхната работа с лекота върши новата невронна мрежа VRN (Volumetric Regression Network), която бе публикувана с отворен код в GitHub. Директно в сайта можете да качите своята или чужда снимка и да направите 3D преобразуването онлайн, само за няколко секунди.

3D реконструкцията от 2D снимки се счита за един от фундаменталните проблеми на машинното зрение. Повечето днешни компютърни системи от подобен род изискват множество фотографии, заснети от различни ъгли. Според авторите на новата научна работа, съществуващите досега модели използват сложен и неефективен конвейер за обработка на данните, за построяването на модела и за подобряване на крайния резултат. Сега се оказа, че конволюционната невронна мрежа извършва същата работа по-просто и по-ефективно от разработените от човека модели и алгоритми.

На изображенията по-долу се вижда, че невронната мрежа VRN без проблеми преобразува различните изражения на лицето по отношение обектива на фотоапарата и може да създава 3D изображения само от една единствена снимка.

Авторите на тази разработка под ръководството на Аарон Джексън (Aaron Jackson) от университета в Нотингам, Великобритания, са използвали съвсем опростен подход към вокселизацията на изображението.

Новата мрежа VRN започва успешно да генерира 3D модели от снимките след обучение чрез база данни, съдържаща фотографии и техните 3D модели. Конкретно в този случай са използвани 60 000 двумерни снимки на лица и техните 3D модели, генерирани от сравнително бавната 3DMM.

Изясни се, че новата VRN невронна мрежа започна да показва много добър резултат, без да използва моделите на 3DMM и точно и бързо извършва преобразуването на човешките лица от 2D към 3D.

Мрежата бе оставена за свободно ползване онлайн и доказа, че успешно извършва преобразуването на много голям брой снимки, качвани от потребителите. Към днешен ден невронната мрежа е обработила над 400 000 различи фотографии.

За разлика от много други проекти, тази невронна мрежа може да бъде стартирана локално на собствения персонален компютър. Целият сорс код е публикуван в GitHub. За нейната работа е необходимо инсталирането на фреймуърка за научни изчисления Torch7, сравнително бърз, но не най-нов графичен процесор на Nvidia с поддръжката на CUDA. Програмата е тествана в ОС Linux и няма версии за Windows. Необходими са още MATLAB, bash, ImageMagick, GNU awk, Python 2.7 (+ visvis, imageio, numpy).

Научната работа е публикувана на 22 март 2017 година, а алгоритъмът е изграден този месец.

0 0 глас
Оценете статията
Абонирай се
Извести ме за
guest
0 Коментара
Отзиви
Всички коментари