OpenAI пуска нов модел за изображения на фона на битката с Google
Компанията на Сам Алтман все още е в "код червено"
OpenAI продължава агресивната си стратегия срещу Google, като обяви нов модел за генериране на изображения в ChatGPT. Компанията започва поетапно внедряване на GPT Image 1.5, който обещава значително по-добро следване на инструкции, по-прецизно редактиране и до четири пъти по-бързо създаване на изображения.
Новият модел ще бъде достъпен за всички потребители на ChatGPT, както и чрез API, считано от вторник. Ходът идва на фона на засилващата се конкуренция с Google, след като изпълнителният директор на OpenAI Сам Алтман обяви вътрешен "код червено" - сигнал за спешни мерки с цел възстановяване на лидерската позиция на компанията в сферата на изкуствения интелект.
Причината е възходът на Google Gemini, включително Gemini 3 и новия генератор на изображения Nano Banana Pro, които оглавиха класациите на LMArena по редица бенчмаркове. Въпреки че OpenAI наскоро представи GPT-5.2 като най-усъвършенствания си модел досега, Google продължава да запазва преднината си.
GPT Image 1.5 е първият нов модел за изображения на OpenAI от април насам и идва по-рано от първоначално планираното. Според компанията, новата версия предлага по-добри инструменти за последваща обработка, включително фино управление на детайли като лицеви черти, осветление, композиция и цветови тон - ключов проблем при досегашните AI генератори, които често променят цялото изображение при минимални редакции.
"Повечето генеративни инструменти за изображения са слаби при итерации. GPT Image 1.5 прави сериозна крачка напред в поддържането на визуална последователност", коментират от OpenAI.
Паралелно с новия модел, изображенията в ChatGPT вече ще имат и собствено специализирано меню в страничната лента, което ще функционира като своеобразно "творческо студио". По думите на Фиджи Симо, главен изпълнителен директор на OpenAI Applications, новият интерфейс улеснява създаването и редактирането на изображения, както и черпенето на идеи от популярни шаблони и филтри.
Компанията планира и по-широка интеграция на визуални елементи в ChatGPT - включително при търсене, проверки на спортни резултати или конвертиране на мерни единици, като информацията ще бъде представяна с ясни източници.
"Когато визуалното разказва история по-добре от думите, ChatGPT трябва да го използва. Целта ни е да скъсим разстоянието между идеята в съзнанието на потребителя и реализацията ѝ", посочва Симо.
С новия модел OpenAI ясно показва, че конкуренцията в генеративния AI навлиза в още по-интензивна фаза, в която скоростта, качеството и удобството за потребителя ще бъдат решаващи.