DeepSeek пусна актуализация на своя голям езиков модел V3, означена като V3-0324, за която се съобщава, че предоставя по-добри възможности за програмиране, като същевременно поставя нови стандарти за точност и ефективност, пише Bloomberg. Актуализацията е публикувана в платформата Hugging Face без официално съобщение.
ИИ-моделът V3 беше представен в края на миналата година. Той е изграден на базата на архитектура Mixture of Experts (MoE) с общо 671 милиарда параметри.
Тогава компанията съобщи че, обучението на V3 е струвало 5,5 млн. долара, което е доста под разходите на други технологични компании, като OpenAI, за обучение на подобни ИИ-модели. Няколко седмици по-късно DeepSeek пусна R1 – ИИ-модел, способен да разсъждава, който въпреки скромния бюджет за разработка надмина o1 на OpenAI в някои сравнителни тестове по редица ключови показатели.
През януари приложението на DeepSeek надмина чатбота с изкуствен интелект ChatGPT и стана номер едно по популярност сред безплатните приложения в App Store на Apple в САЩ. Постиженията на китайския стартъп повдигнаха въпроси сред инвеститорите относно основателността на огромните разходи на американските компании за разработване на технологии с ИИ, което доведе до срив на пазара на ИИ, в резултат на което акциите на компаниите значително спаднаха. По-специално, пазарният лидер Nvidia загуби 593 млрд. долара от пазарната си стойност за един ден, което беше най-големият еднодневен спад в историята на фондовия пазар.
Всичко важно от света на технологиите, директно в пощата ти.
С абонирането приемате нашите Условия и Политика за поверителност. Може да се отпишете с един клик по всяко време.
Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!