Meta обяви пускането на серията големи езикови модели с отворен код Llama 4. Тя включва моделите Llama 4 Scout, Maverick и Behemoth, които предоставят възможности за мултимодално взаимодействие, т.е. могат да отговарят не само на текстови заявки, но и да обработват изображения, видеоклипове и други материали. ИИ-моделите са обучени върху големи количества немаркирани текстови, графични и видео данни, за да осигурят широко визуално разбиране.
Успехът на ИИ-моделите на китайската компания DeepSeek, които се справят наравно или по-добре от предишните поколения на водещите ИИ-модели на Llama подтикна Meta да ускори процеса на разработване в тази посока. Според източника служителите на компанията полагат много усилия, за да разберат как DeepSeek е успяла да намали разходите за разработването и пускането на ИИ-моделите си R1 и V3.
Llama 4 Scout има 17 милиарда активни и общо 109 милиарда параметри. Според Meta той превъзхожда Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 в обработката на различни видове задачи. Една от основните характеристики на ИИ-модела е поддръжката на контекстен прозорец от 10 милиона токена.
Llama 4 Maverick има 17 милиарда активни и общо 400 милиарда параметри. Според разработчиците той превъзхожда GPT-4o и Gemini 2.0 Flash при тестване в различни бенчмаркове, а също така показва сравними резултати с V3 на DeepSeek при разсъждения и писане на програмен код. Scout може да работи с един графичен ускорител Nvidia H100, докато Maverick изисква система Nvidia H100 DGX или еквивалентна.
ИИ-моделът Llama 4 Behemoth има 288 милиарда активни и общо около 2 трилиона параметри и превъзхожда ИИ-моделите GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в различни бенчмаркове.
Той все още се обучава, така че все още не е публично достъпен. Междувременно ИИ-моделите Scout и Maverick са достъпни на Llama.com и на Hugging Face. Освен това патентованият от компанията асистент Meta AI, наличен в приложенията на компанията като WhatsApp, Messenger и Instagram е пригоден за работа с Llama 4 в 40 държави. Възможността за обработка на мултимодални заявки засега е ограничена до английски език и е налична само в САЩ.

Компанията твърди, че Llama 4 е първата група модели с изкуствен интелект, която използва „Mix of Experts“ (MoE) архитектура, която е по-ефективна при ученето и правенето на изводи. Архитектурата MoE позволява на даден алгоритъм да разбива задачите на подзадачи и след това да делегира обработката им на по-малки и по-специализирани „експертни“ модели.
Трябва да се отбележи, че нито един от моделите на Llama 4 не е истински „разсъждаващ“, като например GPT-o1 или GPT-o3-mini на OpenAI. Разсъждаващите модели проверяват отговорите си за валидност и отговорите им обикновено са по-надеждни, но получаването им отнема повече време, отколкото при взаимодействие с традиционните „неразсъждаващи“ ИИ-модели.
Всичко важно от света на технологиите, директно в пощата ти.
С абонирането приемате нашите Условия и Политика за поверителност. Може да се отпишете с един клик по всяко време.
Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!