Генераторът за изображения на Stable Diffusion се проваля в създаването на хора

Снимка: Stability AI

Генераторът за изображения на Stable Diffusion се проваля в създаването на хора

Те приличат на чудовища от филмите на Дейвид Кронънбърг

10:44 | 14 юни 2024 | Редактор : Стоян Гогов 0 367 Снимка: Stability AI

Изпадналият в затруднения AI стартъп Stability AI пусна най-новата версия на своя AI генератор от текст към изображение. Тя е наречена Stable Diffusion 3 Medium, а компанията заявява, че това е "най-усъвършенстван модел за генериране на изображения досега". Резултатите обаче определено не са "съвършени".

So @StabilityAI released their latest Stable Diffusion model 3 today.

Prompt:
Woman lying on grass.

Photographers and designers, your jobs are safe. pic.twitter.com/7thSbutiCq

— W3nzel.eth (@thisiswenzel) June 13, 2024

Както съобщава Ars Technica, разочарованите потребители на Stable Diffusion се обърнаха към Reddit, за да се оплачат, че новият модел често отказва да генерира снимка на човек, а друг път създава обезобразени подобия на хора без ръце, с множество крака и липсващи лица.

"Не успях да генерирам нито едно прилично изображение извън примерните подкани", написа един раздразнен потребител в subreddit r/StableDiffusion.

The ‘Compact’ Version of Stable Diffusion 3 Is Here. And It’s Generating Monstrous Human Bodies https://t.co/hsHRLTCamO pic.twitter.com/9MbU43TJBb

— Xataka On (@xatakaon) June 13, 2024

"Опитвах много описателни подсказки, но без успех. Дори абсолютно елементарни подкани, като "снимка на човек, който дреме в хола", води до чудовища в стил Кроненбърг."

Една от причината за затрудненията е свързана с решението на стартъпа да ограничи фундаментално възможността за генериране на разголени или порнографски сцени.

Taking a look at people testing out Stable Diffusion 3 and tbh this goes hard. pic.twitter.com/Ii7bHqmX9Y

— Max Woolf (@minimaxir) June 12, 2024

В духа на безопасността - и вероятно да не бъде съден - Stability избра да изключи изричното съдържание от процеса на обучение. В резултат генерирането на хора, и особено на женски образи, е силно затруднено.

Stable Diffusion 3 обаче се справя доста добре в създаването на хора в аниме стил или други сцени. Това показва, че проблемите могат да се отстранят бързо.

ИЗБРАНО