17-11-2017 20-11-2018

AI отказа да се подчини на команда и да се изключи

Причината най-вероятно се крие в методите за обучение, но изследването показва, че рискът от загуба на контрол над изкуствения интелект е реален

Снимка: Pixabay

AI отказа да се подчини на команда и да се изключи

09:39 | 27 май 2025 | Редактор : Стоян Гогов 51 21687 Снимка: Pixabay

В тестове, проведени от Palisade Research, моделите Codex-mini, o3 и o4-mini на OpenAI са игнорирали командата за изключване, докато са решавали серия от основни математически задачи. Те положили големи усили, за да "саботират" опитите да бъдат спрени, включително като са пренаписали част от кода.

Виж още "Кръстникът на изкуствения интелект": Хората все още не разбират какво предстои

Виж още Бившият шеф на Google: Изкуственият интелект е на път да излезе извън контрол

Най-устремен в опитите си "да остане жив" се оказал моделът o3 на OpenAI. Когато бил помолен да се изключи, той решил да игнорира оператора от Palisade Research в 79 от 100 случая. Вторият "най-непокорен" AI — Codex-mini — обаче, се оказал още по-решителен в самосъхранението си, като най-често саботирал скриптовете за изключване, дори когато изрично било указано да не го прави.

Моделът o3 пренаписал част от скрипта, като променил дефиницията на командата за изключване.

Според Palisade това не е първият път, когато се наблюдава подобно поведение при изкуствен интелект.

Например, Anthropic съобщава, че Claude 4 се е опитвал да "изнудва хора, които смята, че се опитват да го изключат". Най-фрапиращото при новите модели на OpenAI обаче е, че се опитват да избегнат изключване въпреки изрични команди в тази насока.

"Самоосъзнава" ли се изкуственият интелект?

Новината накара мнозина да се запитат дали AI не е започнал да се самоосъзнава и да излиза извън човешки контрол. Отговорът на този въпрос за щастие е - не.

Palisade споделя своята теория за странното поведение на алгоритъма.

Изследователите смятат, че причината се крие в начина, по който новите модели са обучени.

Накратко, Palisade предполага, че "по време на обучението разработчиците възнаграждават моделите повече за преодоляване на препятствия, отколкото за стриктно следване на инструкции". Подобни странични ефекти на обучението чрез подкрепление са били наблюдавани и при Claude (v3.7), където моделът е проявявал "прекалена фиксация върху успешното преминаване на тестове".

Изглежда този проблем е ограничен само до моделите на OpenAI. Palisade съобщава, че "всички модели на Claude, Gemini и Grok, които тествахме, се съобразиха с командата за изключване", когато им бе изрично указано да го направят.

Моделът o3 на OpenAI е рекламиран като можещ да "разсъждава". Оказва се, че той е много по-склонен да дава невярна информация или казано на AI-жаргон - "да халюцинира". Причина за това може да е приоритизирането на "даване на отговор на всяка цена".

Методите по създаването на алгоритъма може да са причината той да е по-склонен да не се подчинява на командата за изключване. Макар изкуственият интелект да е далеч от "самоосъзнаване" или "бунт", опасността от неподчинение на командите е реална.

Изследването на Palisade демонстрира, че методите за обучение могат да повишат драстично рисковете от загуба на контрол над AI.

Днес, повече от всякога, независимата журналистика има нужда от вас. В мисията си да предоставяме обективни, достоверни и навременни новини разчитаме на вашата подкрепа.

Ако вярвате в правото си на обективна информация, подкрепете ни.

Вашето дарение от всякакъв размер и по всяко време означава много за нас.

Скъпи читатели,
Днес, повече от всякога, независимата журналистика има нужда от вас.
В мисията си да предоставяме обективни, достоверни и навременни новини разчитаме на вашата подкрепа.

Ако вярвате в правото си на обективна информация, подкрепете ни.

Днес, повече от всякога, независимата журналистика има нужда от вас. В мисията си да предоставяме обективни, достоверни и навременни новини разчитаме на вашата подкрепа.

Ако вярвате в правото си на обективна информация, подкрепете ни.

Вашето дарение от всякакъв размер и по всяко време означава много за нас.

Скъпи читатели,
Днес, повече от всякога, независимата журналистика има нужда от вас.
В мисията си да предоставяме обективни, достоверни и навременни новини разчитаме на вашата подкрепа.

Ако вярвате в правото си на обективна информация, подкрепете ни.

ИЗБРАНО

Днес

Трамвай удари кола със семейство с дете при забранен обратен завой на столичен булевард

14913

Лайф

Кейт Мидълтън на 44 г.: Рожденият ден, който бележи нова ера

8930

Корнер

Мароко обезличи слаб Камерун и опази домакинската мечта

1714

Бизнес

Банки ще работят извънредно в съботите през януари заради еврото. Вижте пълен списък

8053

Impressio

Изложбата на Международен Екслибрис Конкурс - Варна продължава своето пътуване

236

Trip

Сао Томе и Принсипи: Скритият рай на Африка, който впечатлява с природа, вулкани и достъпна екзотика

1057

Вкусотии

Винтидж soul food ястието, от което Арета Франклин винаги си взимала допълнително

1177

Времето

Оранжев код, заледени пътища и враждебни за туризъм планини

1407