Преди празниците Microsoft обяви, че надгражда модела за изкуствен интелект зад Bing Image Creator — инструментът за редактиране на изображения с AI, вграден в търсачката Bing. Компанията обеща, че новият модел — последната версия на DALL-E 3 на OpenAI, с кодово име PR16 — ще позволи на потребителите да създават изображения "два пъти по-бързо от преди" и с "по-високо качество".

Но това не се случи. Недоволството бързо заля платформите X и Reddit.

"DALL-E, който обичахме, вече го няма завинаги," написа един потребител в Reddit. "Сега използвам ChatGPT, защото Bing вече не ми върши работа," добави друг.

Отзвукът беше толкова силен, че Microsoft обяви, че ще върне предишния модел в Bing Image Creator, докато не реши проблемите.

"Успяхме да [възпроизведем] някои от докладваните проблеми и планираме да се върнем към [DALL-E 3] PR13, докато ги оправим," написа Джорди Рибас, ръководител на търсенето в Microsoft, в пост в X във вторник вечерта. "Процесът на внедряване е много бавен, за съжаление. Започна преди повече от седмица и ще отнеме още 2-3 седмици, за да достигнем 100%."

Какво се обърка?

Трудно е да се сравняват резултатите на модела въз основа на публичните данни, особено когато подадените заявки (промптове) не са стандартизирани. Но много потребители споделиха, че PR16 има склонност да прави изображенията по-малко реалистични.

Маянк Пармар, пишейки за Windows Latest, отбеляза, че изображенията, генерирани от PR16, са без детайлност и финиш, и изглеждат странно карикатурни и "безжизнени."

Това не е първият случай, в който модел за изображения, който вероятно е преминал вътрешни проверки, не е добре приет от публиката. През февруари Google беше принуден да спре функцията на чатбота Gemini за създаване на изображения на хора, след като потребителите се оплакаха от исторически неточности и "политическа хиперкоректност".

Тези грешки илюстрират колко предизвикателно може да бъде измерването на подобренията на моделите в реалния свят. Според Рибас вътрешните тестове на Microsoft са показали, че качеството на PR16 е "малко по-добро средно" в сравнение с предишния модел на Bing Image Creator.

Каквато и да е била вътрешната метрика, използвана от компанията, изглежда ясно, че тя не се е припокрила с предпочитанията на повечето хора.