Китайската AI компания иска да отнеме титлата на OpenAI
MiniMax пуска нови модели, за които твърди, че са конкурентни на най-добрите в индустрията
Китайските компании продължават да представят AI модели, които съперничат по способности на системи, разработени от OpenAI и други базирани в САЩ технологични гиганти, като Meta и Google.
Тази седмица MiniMax, стартираща компания, подкрепена от Alibaba и Tencent, която е набрала около 850 милиона долара венчърно финансиране и е оценена на над 2,5 милиарда долара, представи три нови модела: MiniMax-Text-01, MiniMax-VL-01 и T2A-01-HD.
MiniMax-Text-01 е модел, предназначен само за текст, докато MiniMax-VL-01 може да разбира както изображения, така и текст. Междувременно T2A-01-HD генерира аудио — конкретно реч.
MiniMax твърди, че MiniMax-Text-01, който е с размер от 456 милиарда параметри, се представя по-добре от Gemini 2.0 Flash на Google в бенчмаркове като MMLU и SimpleQA, които измерват способността на моделите да решават математически задачи и да отговарят на въпроси, базирани на факти.
Параметрите приблизително съответстват на уменията за решаване на проблеми на модела, като моделите с повече параметри обикновено се представят по-добре от тези с по-малко.
Що се отнася до MiniMax-VL-01, MiniMax заявява, че моделът съперничи на Claude 3.5 Sonnet на Anthropic при оценки, изискващи мултимодално разбиране, като ChartQA, който изисква модели да отговарят на въпроси, свързани с графики и диаграми (напр. "Каква е максималната стойност на оранжевата линия в тази графика?").
Все пак MiniMax-VL-01 не надминава Gemini 2.0 Flash в много от тези тестове. GPT-4o на OpenAI и отворен модел, наречен InternVL2.5, го изпреварват в някои от тях.
Забележително е, че MiniMax-Text-01 има изключително голям контекстен прозорец. Контекстният прозорец на модела се отнася до входните данни (например текст), които моделът разглежда преди да генерира изход (допълнителен текст). С контекстен прозорец от 4 милиона токена MiniMax-Text-01 може да анализира около 3 милиона думи наведнъж — или малко повече от пет копия на "Война и мир".
За сравнение, контекстният прозорец на MiniMax-Text-01 е около 31 пъти по-голям от този на GPT-4o и Llama 3.1.
Последният от моделите на MiniMax, представени тази седмица, T2A-01-HD, е генератор на аудио, оптимизиран за реч. T2A-01-HD може да генерира синтетичен глас с регулируема интонация, тон и тембър на около 17 различни езика, включително английски и китайски, и да клонира глас само от 10 секунди аудиозапис.
MiniMax не публикува бенчмарк резултати, сравняващи T2A-01-HD с други модели за генериране на аудио. Но според автора на статията, изходните данни на T2A-01-HD звучат на ниво с тези на модели от Meta и стартъпи като PlayAI.
С изключение на T2A-01-HD, който е достъпен само чрез API на MiniMax и платформата Hailuo AI, новите модели на MiniMax могат да бъдат изтеглени от GitHub и платформата за разработка Hugging Face.
Въпреки че моделите са "открито" достъпни, това не означава, че нямат ограничения.
MiniMax-Text-01 и MiniMax-VL-01 не са напълно с отворен код, тъй като MiniMax не е публикувал компонентите (напр. обучителни данни), нужни за създаването им от нулата. Освен това те са под ограничителен лиценз на MiniMax, който забранява на разработчиците да използват моделите за подобряване на конкурентни AI модели и изисква платформите с повече от 100 милиона месечни активни потребители да получат специален лиценз от MiniMax.
MiniMax е основана през 2021 г. от бивши служители на SenseTime, една от най-големите AI компании в Китай. Проектите на компанията включват приложения като Talkie — AI-платформа за ролеви игри, подобна на Character AI, и текст-към-видео модели, които MiniMax е представила в Hailuo.
Някои от продуктите на MiniMax станаха обект на леки противоречия.
Talkie, което беше премахнато от App Store на Apple през декември поради неопределени "технически" причини, включва AI аватари на обществени фигури, като Доналд Тръмп, Тейлър Суифт, Илон Мъск и Леброн Джеймс, без тяхно явно съгласие.
През декември списание Broadcast съобщи, че видео генераторите на MiniMax могат да възпроизвеждат лога на британски телевизионни канали, което предполага, че моделите на MiniMax са обучени върху съдържание от тези канали. Освен това MiniMax е обект на съдебен иск от iQiyi, китайска стрийминг услуга, която твърди, че MiniMax незаконно е използвала тяхно защитено с авторски права съдържание за обучение.
Новите модели на MiniMax излизат няколко дни след като администрацията на Байдън предложи по-строги правила за износ и ограничения върху AI технологиите за китайски компании. Вече беше забранено на китайските компании да купуват усъвършенствани AI чипове, но ако новите правила влязат в сила, те ще наложат по-строги ограничения върху полупроводниковите технологии и моделите, нужни за разработването на сложни AI системи.
В сряда администрацията на Байдън обяви допълнителни мерки, насочени към ограничаване на достъпа на Китай до усъвършенствани чипове. Заводи за чипове и компании за тяхното производство, които искат да изнасят определени чипове, ще бъдат подложени на по-широки лицензионни изисквания, освен ако не упражнят по-голям контрол, за да предотвратят достигането на техните продукти до китайски клиенти.