Моделът с изкуствен интелект се обучава да разпознава крави в изображения, вместо да анализира формата на изобразените обекти, което може да бъде ограничено от наличието на зелена трева. Това явление се нарича избор на пряк път в машинното обучение и очевидно може да доведе до нежелани резултати.
В нова статия, публикувана на сървъра arXiv.org, изследователи от Масачузетския технологичен институт (MIT) предложиха решение на този проблем. Той се крие във факта, че AI моделът е принуден да използва повече данни при вземане на решения, премахвайки най-простите характеристики.
Изследванията на MIT са фокусирани върху контрастното обучение, което е мощна форма на машинно обучение без наставник. За моделите на контрастно обучение, алгоритъмът на енкодера е обучен да прави разлика между двойки идентични и разнородни входни данни.
Подобни енкодери, както се оказа в хода на изследването, също са склонни да избират кратките пътища и от всички характеристики на анализираното изображение, когато вземат решение, предпочитат да се ръководят само от най-простите.
Постепенно усложнявайки задачата за разграничаване на сходните и несходни елементи, учените установиха, че по този начин системата е принудена да изучава по-смислената информация в данните, тъй като без нея не може да реши проблема.
Въпреки това, само увеличаването на сложността кара алгоритъма да забрави по-простите функции. За да избегнат това, изследователите са заставили енкодера да прави разлика между отделни двойки по два начина: първо, използвайки по-прости функции, а след това, използвайки по-сложните функции, които той вече се е научил да разпознава.
Този така наречен метод за неявна модификация на признаците, адаптивно променя моделите, за да премахне по-простите функции, които енкодерът използва за разграничаване на двойка обекти. Той не разчита на подправяне на начина за човешкото обучение, което е важно, тъй като базите от данни в реалния свят могат да имат стотици различни признаци, които се комбинират в по сложни образи.
Авторите планират да продължат усъвършенстването на своите методи, включително и във връзка с други видове обучение без наставник.
Презентацията на това изследване трябва да се състои на петата ежегодна Конференция по невронни системи за обработка на информацията (NeurIPS 2021), която стартира във виртуален режим на 6 декември.