ИИ трениран на стари научни статии прави открития, които хората са пропуснали

1
2388

Само чрез използването на информация от милиони стари проучвания, алгоритъм с машинно обучение успя да направи напълно нови научни открития.

В проучване публикувано в Nature на 3 юли, учени от Националната лаборатория Лорънс Бъркли използвали алгоритъм наречен Word2Vec, за да прерови научни документи за връзки, които хората са пропуснали. След това алгоритъмът представил предсказания за възможни термоелектрични материали, които превръщат топлината в електричество и се използват в много отопляващи и охлаждащи механизми.

Интересното обаче е, че алгоритъмът не е знаел дефиницията на „термоелектричен“. Той не е бил обучаван предварително в материалознание. Използвайки само на асоциации на думи, алгоритъмът успял да предложи кандидати за термоелектрични материали, някои от които могат да са по-добри от тези, които използваме днес.

“Той може да прочете всеки документ по материалознание и да открие връзки, които никой учен не би могъл.“ каза ученият Анубав Жаин. „Понякога той прави това, което всеки учен би направил; други пъти прави връзки между различни научни дисциплини.“.

За да тренират алгоритъма, учените използвали 3.3 милиона откъса свързани с материалознание, като по този начин получили речников запас от около 500 000 думи. След това дали откъсите на Word2Vec, който използвал машинно обучение, за да анализира връзките между думите.

“Начинът по който този Word2Vec алгоритъм работи е следният: Тренираш модела на невронна мрежа да премахне всяка дума и след това той предсказва какви биха били следващите думи“ каза Жаин. „Като тренираш невронната мрежа на дума, получаваш в отговор други думи, които могат да предадат знание.“.

Като използва думите от научните откъси, алгоритъмът успял да разбере концепции като периодичната таблица и химическата структура на молекулите. Алгоритъмът свързал думи, които се намирали една до друга, и по този начин създал вектори от свързани думи, с помощта на които се дефинират понятия. В някои случаи, думи са били свързвани с термоелектрични идеи, въпреки че никога не са били използвани в такъв контекст в изучаваните откъси. Тази дупка в познанието е трудна да се улови с човешко око, но е лесна за забелязване от алгоритъм.

След като показал възможността си да предсказва бъдещи материали, учените премахнали скорошните открития и тествали алгоритъма върху стара информация, за да видят дали ще може да предскаже научни открития преди те да станат. Алгоритъмът сработил отново.

В един експеримент, учените анализирали само проучвания публикувани преди 2009 и успели да предскажат един от най-добрите съвременни термоелектрични материали четири години преди да бъде открит през 2012.

Това ново приложение на машинното обучение не се отнася само за материалознанието. Понеже не е трениран върху специфичен набор информация, алгоритъмът може лесно да се използва за други дисциплини. Нужно е само да се тренира наново върху литература на темата, която искате. Вае Цитоян, главният автор на проучването, казва че други учени вече са се свързали с него, защото искат да научат повече.

„Този алгоритъм не е наблюдаван и създава свои собствени връзки.“ каза Цитоян. „Можете да го използвате за неща като медицински изследвания или откриване на лекарства. Информацията я има. Но ние все още не сме открили връзките, защото не можеш да прочетеш всяка статия.“

1
ДОБАВИ КОМЕНТАР

avatar
1 Коментари
0 Отговори на коментарите
1 Последователи
 
Коментарът с най-много реакции
Най-горещият коментар
  Абонирай се  
нови стари оценка
Извести ме за
Emilyano Calabrese
Emilyano Calabrese

Само чрез използването на информация от милиони стари проучвания, алгоритъм с машинно обучение успя да направи напълно нови научни открития.–ТЕЯ “ОТКРИТИЯ“ СА БИЛИ НАПРАВЕНИ ОЩЕ В НАЧАЛОТО НО ГОСПОДАРИТЕ НИ НЕ СА ИСКАЛИ ДА ЗНАЕМ ЗА ТЯХ ТОГАВА…