Meta пусна Llama 4 – ново поколение водещи AI модели
Достъпът до тях е с някои ограничения в ЕС
Meta изненадващо пусна в събота нова серия от AI модели от семейството Llama, наречена Llama 4.
Колекцията включва четири нови модела: Llama 4 Scout, Llama 4 Maverick и Llama 4 Behemoth. Всички те са обучени върху "големи количества неетикетирани текстове, изображения и видеа", за да получат "широко визуално разбиране", според Meta.
Според източници, успехът на китайската AI лаборатория DeepSeek, чиито отворени модели се представят наравно или по-добре от предишните Llama версии, е тласнал Meta към ускорено развитие на Llama 4.
В компанията дори били сформирани "военни щабове", за да разберат как DeepSeek е успяла да намали цената на изпълнение и внедряване на модели като R1 и V3.
Scout и Maverick вече са публично достъпни на Llama.com и чрез партньори като Hugging Face. Behemoth все още е в процес на обучение.
AI асистентът Meta AI, който се използва в WhatsApp, Messenger и Instagram, е вече обновен с Llama 4 в 40 държави, макар че мултимодалните функции (работа с текст, изображения и видео едновременно) са засега налични само в САЩ и само на английски език.
Ограничения в лиценза
Някои разработчици може да се сблъскат с ограничения в лиценза.
Потребители и компании, регистрирани в ЕС, нямат право да използват или разпространяват моделите (вероятно поради изискванията на европейското законодателство за AI и лични данни).
Компании с над 700 милиона активни потребители месечно трябва да получат специално разрешение от Meta, което компанията може да даде или откаже по собствена преценка.
Архитектура и възможности
Llama 4 е първата генерация на Meta, базирана на "mixture of experts" (MoE) архитектура - по-ефективен метод, при който задачи се разделят на подсистеми, обработвани от "експертни" подмодели.
Llama 4 Maverick:
400 милиарда общи параметъра, но само 17 милиарда активни.
Подходящ за асистенти и чат, творческо писане, кодиране, дълги контексти и мултиезикови задачи.
Според Meta се представя по-добре от GPT-4o и Gemini 2.0, но не и от по-новите Gemini 2.5 Pro, Claude 3.7 Sonnet и GPT-4.5.
Llama 4 Scout:
109 милиарда общи параметъра, 17 милиарда активни, 16 "експерта".
Отличен за обобщение на документи и анализ на големи кодови бази.
Има огромен контекстен прозорец от 10 милиона токена, позволяващ обработка на изключително дълги текстове и изображения.
Може да работи дори на една Nvidia H100 GPU.
Llama 4 Behemoth (в разработка):
288 милиарда активни параметъра, близо 2 трилиона общи.
Според Meta изпреварва GPT-4.5 и Gemini 2.0 Pro в STEM задачи (математика и наука), но не надминава Gemini 2.5 Pro.
Поведение и политически теми
Интересен аспект на Llama 4 е, че Meta умишлено го е настроила да отказва по-малко често да отговаря на "спорни" въпроси. Новите модели дават отговори на политически и социални теми, които предишните версии игнорираха.
Meta твърди, че Llama 4 е "значително по-балансиран" в това какви въпроси отказва да обсъжда и не взима страна във възгледи.
"Можете да разчитате, че Llama 4 ще предоставя полезни и фактологични отговори без преценка," казва говорител на Meta пред TechCrunch.
Спорно изпробване
Моделът Maverick е на второ място в класацията LM Arena, в която хора сравняват отговорите на AI модели. Но се оказва, че тестваната версия е специално оптимизирана за чат, различна от тази, която разработчиците могат реално да изтеглят.
Изследователи в X отбелязват, че версията в LM Arena използва повече емоджита и по-дълги отговори — което поражда критики, че Meta е "нагласила" резултатите, за да изглеждат по-добре от реалността.