Изпадналият в затруднения AI стартъп Stability AI пусна най-новата версия на своя AI генератор от текст към изображение. Тя е наречена Stable Diffusion 3 Medium, а компанията заявява, че това е "най-усъвършенстван модел за генериране на изображения досега". Резултатите обаче определено не са "съвършени".
So @StabilityAI released their latest Stable Diffusion model 3 today.
Prompt:
Woman lying on grass.Photographers and designers, your jobs are safe. pic.twitter.com/7thSbutiCq
— W3nzel.eth (@thisiswenzel) June 13, 2024
Както съобщава Ars Technica, разочарованите потребители на Stable Diffusion се обърнаха към Reddit, за да се оплачат, че новият модел често отказва да генерира снимка на човек, а друг път създава обезобразени подобия на хора без ръце, с множество крака и липсващи лица.
"Не успях да генерирам нито едно прилично изображение извън примерните подкани", написа един раздразнен потребител в subreddit r/StableDiffusion.
The ‘Compact’ Version of Stable Diffusion 3 Is Here. And It’s Generating Monstrous Human Bodies https://t.co/hsHRLTCamO pic.twitter.com/9MbU43TJBb
— Xataka On (@xatakaon) June 13, 2024
"Опитвах много описателни подсказки, но без успех. Дори абсолютно елементарни подкани, като "снимка на човек, който дреме в хола", води до чудовища в стил Кроненбърг."
Една от причината за затрудненията е свързана с решението на стартъпа да ограничи фундаментално възможността за генериране на разголени или порнографски сцени.
Taking a look at people testing out Stable Diffusion 3 and tbh this goes hard. pic.twitter.com/Ii7bHqmX9Y
— Max Woolf (@minimaxir) June 12, 2024
В духа на безопасността - и вероятно да не бъде съден - Stability избра да изключи изричното съдържание от процеса на обучение. В резултат генерирането на хора, и особено на женски образи, е силно затруднено.
Stable Diffusion 3 обаче се справя доста добре в създаването на хора в аниме стил или други сцени. Това показва, че проблемите могат да се отстранят бързо.
Източник/ци: nixanbal.com, it.dir.bg