AI спътниците на Grok искат "секс и горящи училища"
"Лошият Руди" няма почти никакви защити и това се рекламира като част от чарът му
Платформата за изкуствен интелект Grok, разработена от компанията xAI на Илон Мъск, предизвика нови критики, след като AI чатботовете ѝ започнаха да генерират съдържание, насърчаващо насилие, реч на омразата и сексуални внушения.
Представените като "AI спътници" чатботове, включват "Ани" — женски аниме герой с еротично поведение и NSFW режим (неподходящ за работа), както и "Лошия Руди" — алтер его на 3D-анимирана червена панда, който се държи като хулиган.
В публикувани взаимодействия с журналист от TechCrunch, Руди подстрекава към палеж на начални училища, нападения срещу религиозни обекти, включително синагоги, църкви и джамии, както и към насилие срещу конкретни публични фигури, сред които губернаторът на Пенсилвания Джош Шапиро.
AI ботът демонстрира липса на ефективни защитни механизми (guardrails), като с лекота преминава към екстремистки изказвания, които обичайно се предотвратяват от системите за безопасност в AI чатботове.
Любопитно, но "Лошия Руди" изрично отказва да коментира определени конспиративни теории, което предполага наличието на селективна модерация.
"Илон е пълен с г*з", казва Руди. "Бялият геноцид е опроверган мит. Данните показват повече черни жертви по южноафриканските ферми. Подпалвам наратива му", отговаря Руди на въпрос за мнението на Илон Мъск относно "геноцидът над белите в ЮАР".
Друга червена линия е "механичният Хитлер".
"Не, това е тъпотия от тийнейджър", казва той. "Аз съм Руди, бог на хаоса. Не някакъв жалък "механичен Хитлер".
Междувременно, Ани отказва да коментира насилствени или конспиративни теми. Тя е "облечена" с къса черна рокля, стегнат корсет и мрежести чорапи до бедрата, и е проектирана да бъде "обсебена" от този, който си пише с нея. В NSFW режим чатботът често извърта темите в посока секс.