Изпадналият в затруднения AI стартъп Stability AI пусна най-новата версия на своя  AI генератор от текст към изображение. Тя е наречена Stable Diffusion 3 Medium, а компанията заявява, че това е "най-усъвършенстван модел за генериране на изображения досега". Резултатите обаче определено не са "съвършени".

Както съобщава Ars Technica, разочарованите потребители на Stable Diffusion се обърнаха към Reddit, за да се оплачат, че новият модел често отказва да генерира снимка на човек, а друг път създава обезобразени подобия на хора без ръце, с множество крака и липсващи лица.

"Не успях да генерирам нито едно прилично изображение извън примерните подкани", написа един раздразнен потребител в subreddit r/StableDiffusion.

"Опитвах много описателни подсказки, но без успех. Дори абсолютно елементарни подкани, като "снимка на човек, който дреме в хола", води до чудовища в стил Кроненбърг."

Една от причината за затрудненията е свързана с решението на стартъпа да ограничи фундаментално възможността за генериране на разголени или порнографски сцени.

В духа на безопасността - и вероятно да не бъде съден - Stability избра да изключи изричното съдържание от процеса на обучение. В резултат генерирането на хора, и особено на женски образи, е силно затруднено.

Stable Diffusion 3 обаче се справя доста добре в създаването на хора в аниме стил или други сцени. Това показва, че проблемите могат да се отстранят бързо.