Meta представи новите си ИИ-модели Llama 4 и ги вгради в WhatsApp, Меssenger и Instagram

Най-четени

Емил Василев
Емил Василевhttps://www.kaldata.com/
Емил Василев редовно превежда сложни научни теми на достъпен език — от въпроси като „Какво е имало преди Големия взрив?" до практическото приложение на биотехнологиите в лечението на болести. Тази комбинация от технологична и научна журналистика го прави един от най-разностранните автори в екипа на Kaldata.

Meta обяви пускането на серията големи езикови модели с отворен код Llama 4. Тя включва моделите Llama 4 Scout, Maverick и Behemoth, които предоставят възможности за мултимодално взаимодействие, т.е. могат да отговарят не само на текстови заявки, но и да обработват изображения, видеоклипове и други материали. ИИ-моделите са обучени върху големи количества немаркирани текстови, графични и видео данни, за да осигурят широко визуално разбиране.

Успехът на ИИ-моделите на китайската компания DeepSeek, които се справят наравно или по-добре от предишните поколения на водещите ИИ-модели на Llama подтикна Meta да ускори процеса на разработване в тази посока. Според източника служителите на компанията полагат много усилия, за да разберат как DeepSeek е успяла да намали разходите за разработването и пускането на ИИ-моделите си R1 и V3.

Llama 4 Scout има 17 милиарда активни и общо 109 милиарда параметри. Според Meta той превъзхожда Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 в обработката на различни видове задачи. Една от основните характеристики на ИИ-модела е поддръжката на контекстен прозорец от 10 милиона токена.

Llama 4 Maverick има 17 милиарда активни и общо 400 милиарда параметри. Според разработчиците той превъзхожда GPT-4o и Gemini 2.0 Flash при тестване в различни бенчмаркове, а също така показва сравними резултати с V3 на DeepSeek при разсъждения и писане на програмен код. Scout може да работи с един графичен ускорител Nvidia H100, докато Maverick изисква система Nvidia H100 DGX или еквивалентна.

ИИ-моделът Llama 4 Behemoth има 288 милиарда активни и общо около 2 трилиона параметри и превъзхожда ИИ-моделите GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в различни бенчмаркове.

Той все още се обучава, така че все още не е публично достъпен. Междувременно ИИ-моделите Scout и Maverick са достъпни на Llama.com и на Hugging Face. Освен това патентованият от компанията асистент Meta AI, наличен в приложенията на компанията като WhatsApp, Messenger и Instagram е пригоден за работа с Llama 4 в 40 държави. Възможността за обработка на мултимодални заявки засега е ограничена до английски език и е налична само в САЩ.

Компанията твърди, че Llama 4 е първата група модели с изкуствен интелект, която използва „Mix of Experts“ (MoE) архитектура, която е по-ефективна при ученето и правенето на изводи. Архитектурата MoE позволява на даден алгоритъм да разбива задачите на подзадачи и след това да делегира обработката им на по-малки и по-специализирани „експертни“ модели.

Трябва да се отбележи, че нито един от моделите на Llama 4 не е истински „разсъждаващ“, като например GPT-o1 или GPT-o3-mini на OpenAI. Разсъждаващите модели проверяват отговорите си за валидност и отговорите им обикновено са по-надеждни, но получаването им отнема повече време, отколкото при взаимодействие с традиционните „неразсъждаващи“ ИИ-модели.

Всичко важно от света на технологиите, директно в пощата ти.

С абонирането приемате нашите Условия и Политика за поверителност. Може да се отпишете с един клик по всяко време.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!

Нови ревюта

Подобни новини