Baidu излиза на сцената на компютърното зрение

0
38


Китайският технологичен гигант Baidu излиза на сцената на машинното обучение със собствена технология за разпознаване на изображения от компютър, навлизайки в борба с Google в тази сфера. Според Baidu, разработената от тях технология е по-съвършена от всяка подобна технология за изкуствен интелект, която е създадена досега.

За да успее на попрището на машинното визуално разпознаване, създателят на най-голямата китайска търсачка използва собствен супер компютър. Той представлява обединен клъстър от 36 Линукс сървъра, всеки от тях подпомаган два шест-ядрени процесора Intel Xeon E5-2620 с работна честота от 2.5Ghz. В основата на суперкомпютъра и възможността му за сканиране на изображения стоят четири графични процесора Nvidia Tesla K40m, интегрирани във всяка система, което дава като резултат възможността за извършването на 617 трилиона операции с плаваща точка в секунда.

Това е с 20% по-голяма изчислителна мощ от тази, от която се възползват специалистите на Националното управление на океанските и атмосферни изследвания на САЩ (US National Oceanic and Atmospheric Administration, NOAA). Андрю Нг, главен учен към Baidu и бивш служител на Google, обяснява, че крайната цел на инвестицията в областта на дълбочинното обучение (deep learning) постигането на по-добри резултати в качеството на обработваните изображения за целите на изследването и тестовете. Всъщност суперкомпютърът на Baidu е изграден единствено за целите на тестване на модела, обястява той пред Bloomberg. В изследването на Baidu (pdf) се обяснява, че използването на изображения с резолюция 256х256 пиксела, който най-често се използва за тестване на модели в областта на компютърното зрение (computer vision), често води до ситуация, в която по-малките обекти губят твърде много от резолюцията си при обработка на изображенията. Увеличаване на нивото на детайлност запазва по-голяма част от информацията и по този начин по-голям успех във вярното разпознаване на обектите.

От Baidu споделят, че използването на изображения с по-висока резолюция е способствало за достигането на нива за грешка от 5.98% в теста на ImageNet, което поставя технологията на китайците 0.7% под рекорда на Google или още по-близко от нивото за грешка при разпознаването на обект, което допуска човешкото око – 5.1%.

0 0 гласа
Оценете статията
Абонирай се
Извести ме за
guest
0 Коментара
Отзиви
Всички коментари