Meta изненадващо пусна в събота нова серия от AI модели от семейството Llama, наречена Llama 4.

Колекцията включва четири нови модела: Llama 4 Scout, Llama 4 Maverick и Llama 4 Behemoth. Всички те са обучени върху "големи количества неетикетирани текстове, изображения и видеа", за да получат "широко визуално разбиране", според Meta.

Според източници, успехът на китайската AI лаборатория DeepSeek, чиито отворени модели се представят наравно или по-добре от предишните Llama версии, е тласнал Meta към ускорено развитие на Llama 4.

В компанията дори били сформирани "военни щабове", за да разберат как DeepSeek е успяла да намали цената на изпълнение и внедряване на модели като R1 и V3.

Scout и Maverick вече са публично достъпни на Llama.com и чрез партньори като Hugging Face. Behemoth все още е в процес на обучение.

AI асистентът Meta AI, който се използва в WhatsApp, Messenger и Instagram, е вече обновен с Llama 4 в 40 държави, макар че мултимодалните функции (работа с текст, изображения и видео едновременно) са засега налични само в САЩ и само на английски език.

Ограничения в лиценза

Някои разработчици може да се сблъскат с ограничения в лиценза.

Потребители и компании, регистрирани в ЕС, нямат право да използват или разпространяват моделите (вероятно поради изискванията на европейското законодателство за AI и лични данни).

Компании с над 700 милиона активни потребители месечно трябва да получат специално разрешение от Meta, което компанията може да даде или откаже по собствена преценка.

Архитектура и възможности

Llama 4 е първата генерация на Meta, базирана на "mixture of experts" (MoE) архитектура - по-ефективен метод, при който задачи се разделят на подсистеми, обработвани от "експертни" подмодели.

Llama 4 Maverick:

400 милиарда общи параметъра, но само 17 милиарда активни.

Подходящ за асистенти и чат, творческо писане, кодиране, дълги контексти и мултиезикови задачи.

Според Meta се представя по-добре от GPT-4o и Gemini 2.0, но не и от по-новите Gemini 2.5 Pro, Claude 3.7 Sonnet и GPT-4.5.

Llama 4 Scout:

109 милиарда общи параметъра, 17 милиарда активни, 16 "експерта".

Отличен за обобщение на документи и анализ на големи кодови бази.

Има огромен контекстен прозорец от 10 милиона токена, позволяващ обработка на изключително дълги текстове и изображения.

Може да работи дори на една Nvidia H100 GPU.

Llama 4 Behemoth (в разработка):

288 милиарда активни параметъра, близо 2 трилиона общи.

Според Meta изпреварва GPT-4.5 и Gemini 2.0 Pro в STEM задачи (математика и наука), но не надминава Gemini 2.5 Pro.

Поведение и политически теми

Интересен аспект на Llama 4 е, че Meta умишлено го е настроила да отказва по-малко често да отговаря на "спорни" въпроси. Новите модели дават отговори на политически и социални теми, които предишните версии игнорираха.

Meta твърди, че Llama 4 е "значително по-балансиран" в това какви въпроси отказва да обсъжда и не взима страна във възгледи.

"Можете да разчитате, че Llama 4 ще предоставя полезни и фактологични отговори без преценка," казва говорител на Meta пред TechCrunch.

Спорно изпробване

Моделът Maverick е на второ място в класацията LM Arena, в която хора сравняват отговорите на AI модели. Но се оказва, че тестваната версия е специално оптимизирана за чат, различна от тази, която разработчиците могат реално да изтеглят.

Изследователи в X отбелязват, че версията в LM Arena използва повече емоджита и по-дълги отговори — което поражда критики, че Meta е "нагласила" резултатите, за да изглеждат по-добре от реалността.

 

ИЗБРАНО