fbpx
-4.2 C
София

Разрушаване на границите на мащабиране при аналоговите изчисления

Най-четени

Нова техника може да намали грешките, които пречат на работата на супер бързите аналогови оптични невронни мрежи.

Тъй като моделите за машинно обучение стават по-големи и по-сложни, те изискват по-бърз и по-енергийно ефективен хардуер за извършване на изчисления. Конвенционалните цифрови компютри се борят да се справят.

Аналоговата оптична невронна мрежа може да изпълнява същите задачи като цифровата, като класифициране на изображения или разпознаване на реч, но тъй като изчисленията се извършват с помощта на светлина, вместо електрически сигнали, оптичните невронни мрежи могат да работят многократно по-бързо, като същевременно консумират по-малко енергия.

Тези аналогови устройства обаче са склонни към хардуерни грешки, които могат да направят изчисленията по-малко прецизни. Микроскопичните несъвършенства в хардуерните компоненти са една от причините за тези грешки. В оптична невронна мрежа, която има много свързани компоненти, грешките могат бързо да се натрупат.

Дори и с техниките за коригиране на грешки, поради фундаменталните свойства на устройствата, които изграждат оптична невронна мрежа, известно количество грешки е неизбежно. Мрежа, която е достатъчно голяма, за да бъде внедрена в реалния свят, би била твърде неточна, за да бъде ефективна.

Изследователи от MIT са преодолели това препятствие и са намерили начин за ефективно мащабиране на оптична невронна мрежа. Чрез добавяне на малък хардуерен компонент към оптичните превключватели, които формират архитектурата на мрежата, те могат да намалят дори некоригируемите грешки, които иначе биха се натрупали в устройството.

Тяхната работа може да даде възможност за супер бърза, енергийно ефективна аналогова невронна мрежа, която може да функционира със същата точност като цифровата. С тази техника, когато една оптична верига става по-голяма, размерът на грешките в нейните изчисления всъщност намалява. 

„Това е забележително, тъй като противоречи на логиката на аналоговите системи, където се предполага, че по-големите вериги имат по-високи грешки, така че те да определят граница на скалируемостта. Тази настояща статия ни позволява да отговорим на въпроса за мащабируемостта на тези системи с недвусмислено „да“,

казва водещият автор Райън Хамерли, гостуващ учен в Изследователската лаборатория за електроника на MIT (RLE) и Лабораторията за квантова фотоника, и старши учен в NTT Research .

Умножаване със светлина

Оптичната невронна мрежа е съставена от много свързани компоненти, които функционират като препрограмируеми, регулируеми огледала (MZI, Mach-Zehnder Inferometer). Данните от тях се кодират в светлина, която се изстрелва в оптичната невронна мрежа от лазер.

Типичен MZI съдържа две огледала и два разделителя на лъча. Светлината навлиза в горната част на MZI, където се разделя на две части, които си взаимодействат, преди да бъдат рекомбинирани от втория разделител на лъча и след това да се отрази от дъното към следващия MZI в масива. Изследователите могат да използват интерференцията на тези оптични сигнали, за да извършват сложни линейни алгебрични операции, известни като умножение на матрици, което е начинът, по който невронните мрежи обработват данни.

Но грешките, които могат да възникнат във всеки MZI, бързо се натрупват, докато светлината се движи от едно устройство към друго. Човек може да избегне някои грешки, като ги идентифицира предварително и настрои MZI, така че по-ранните да бъдат отменени от по-късните устройства в масива.

„Това е много прост алгоритъм, ако знаете какви са грешките. Но тези са изключително трудни за установяване, защото имате достъп само до входовете и изходите на чипа. Това ни мотивира да разгледаме дали е възможно да създадем корекция на грешки без калибриране.“

казва Хамърли.

Поради фундаменталното естество на MZI, има случаи, при които е невъзможно да се настрои устройство, така че цялата светлина да изтича през долния порт към следващия MZI. Ако устройството губи част от светлината на всяка стъпка и масивът е много голям, до края ще остане само малка част от мощността.

„Дори с коригиране на грешки, има фундаментално ограничение за това колко добър може да бъде един чип. MZI са физически неспособни да реализират определени настройки, за които трябва да бъдат конфигурирани“

казва той.

И така, екипът разработи нов тип MZI. Изследователите добавиха допълнителен разделител на лъча към края на устройството, наричайки го 3-MZI, защото има три разделителя на лъча вместо два. Поради начина, по който този допълнителен разделител на лъчи смесва светлината, става много по-лесно да се достигне настройката, от която се нуждае, за да изпрати цялата светлина отвън през долния порт.

Важно е, че допълнителният разделител на лъчи е с размер само няколко микрометра и е пасивен компонент, така че не изисква допълнително окабеляване. Добавянето на допълнителни разделители на лъчи не променя значително размера на чипа.

По-голям чип, по-малко грешки

Когато изследователите проведоха симулации, за да тестват своята архитектура, те откриха, че тя може да елиминира голяма част от некоригируемите грешки, които възпрепятстват точността. И тъй като оптичната невронна мрежа става по-голяма, количеството грешки в устройството всъщност намалява – обратното на това, което се случва в устройство със стандартни MZI.

Използвайки 3-MZI, те потенциално биха могли да създадат устройство, достатъчно голямо за комерсиална употреба с грешка, която е намалена с коефициент 20, казва Хамерли.

Сега, след като са демонстрирали тези техники с помощта на симулации, Хамърли и неговите сътрудници планират да тестват тези подходи върху физически хардуер и да продължат да вървят към оптична невронна мрежа, която могат ефективно да разположат и в реалния свят.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

Абонирай се
Извести ме за
guest

0 Коментара
Отзиви
Всички коментари

Нови ревюта

Подобни новини