DeepSeek е открила как да подобри ефективността на ИИ-моделите с помощта на самообучение

Китайският стартъп DeepSeek се прочу по-рано тази година със своя ИИ-модел R1, способен да „разсъждава“, който успя да се конкурира с тези на американските технологични гиганти въпреки скромния си бюджет. Сега DeepSeek публикува статия в сътрудничество с изследователи от Университета Цинхуа, в която подробно се описва нов подход за обучение на ИИ-модели с подсилване, позволяващ значително да се подобри тяхната ефективност. Това бе съобщено от ресурса SCMP.

Според публикацията новият метод има за цел да помогне на ИИ-моделите да отговарят по-добре на човешките предпочитания, като използват механизма на наградите за по-точни и разбираеми отговори.

Обучението с подсилване е доказало своята ефективност при ускоряването на задачите на ИИ в ограничени области и приложения. Използването му за по-общи задачи обаче не е толкова ефективно. Екипът на DeepSeek се опитва да реши този проблем, като комбинира генеративно моделиране на възнагражденията (GRM) и т.нар. самокритично настройване, основано на принципи. Както се твърди в статията, новият подход за подобряване на способностите за разсъждаване на големи езикови модели (LLM) превъзхожда съществуващите методи, което се потвърждава от валидирането на моделите в различни тестове, и дава най-висока производителност за общи заявки, като същевременно използва по-малко изчислителни ресурси.

Новите ИИ-модели са наречени DeepSeek-GRM, което е акроним на Generalist Reward Modelling (универсално моделиране на възнагражденията). Компанията заяви, че те ще бъдат с отворен код, но все още не е обявена дата на пускане. Миналия месец Ройтерс съобщи, позовавайки се на информирани източници, че през април компанията ще пусне и R2, наследник на R1.

Други водещи разработчици на изкуствен интелект, сред които китайската Alibaba Group и базираната в Сан Франциско OpenAI също работят по подобряване на възможностите за разсъждаване и самоусъвършенстване на ИИ-моделите, отбелязва Bloomberg.

Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!

DeepSeek е открила как да подобри ефективността на ИИ-моделите с помощта на самообучение

Най-четени

Netflix променя курса: българските субтитри вече се завръщат при новите филми и сериали

ГДБОП разби инвестиционна измамна схема от колцентър в София, петима са задържани

Кои професии винаги ще са необходими: тук изкуственият интелект е безсилен

Нови ревюта

Huawei Watch Fit 5 Pro: часовникът, който тежи едва 30 грама, но прави изненадващо много

Xiaomi 17T: Телефонът, който намери точния баланс между цена и възможности

Lenovo Yoga Slim 7 Aura Edition: лаптопът под килограм, който може да ви накара да забравите за MacBook Air

Saros доказва, че Housemarque вече са сред най-добрите студиа в света

Подобни новини

За първи път: напълно автономни AI дронове ликвидираха руски войници на фронта в Украйна

Държавен монопол? Шефът на Palantir очаква до 2 години пълна национализация на ИИ компаниите в САЩ

Реалността срещу хайпа: Barclays прогнозира поне 10 години до масовото внедряване на хуманоидни роботи

Изкуственият интелект може да ускори търсенето на нова физика, но има един неочакван нюанс

Връзка с нас

Приложения

Следвайте ни

Абонирайте се!

DeepSeek е открила как да подобри ефективността на ИИ-моделите с помощта на самообучение

Най-четени

Всичко важно от света на технологиите, директно в пощата ти.

Нови ревюта

Подобни новини

Връзка с нас

Приложения

Следвайте ни

Абонирайте се!