Дарио Амодей от Anthropic предупреждава за AGI до 2027 г.
Рисковете са големи, ако спешно не бъдат въведени регулации
В началото на седмицата Дарио Амодей, главен изпълнителен директор на Anthropic, публикува есе от 38 страници със заглавие "Юношеството на технологиите". В него той предупреждава, че свръхинтелигентен изкуствен интелект може да се появи още през 2027 г. и да породи катастрофални рискове за цивилизацията, ако правителствата и технологичните компании не предприемат спешни мерки.
"Вярвам, че навлизаме в преходен период, едновременно бурен и неизбежен, който ще постави на изпитание кои сме ние като вид", пише Амодей в текста, публикуван на личния му уебсайт. "На човечеството ще бъде връчена почти невъобразима власт и изобщо не е ясно дали нашите социални, политически и технологични системи са достатъчно зрели, за да я управляват."
Есето очертава пет категории рискове, които според Амодей изискват незабавно внимание.
В текста, озаглавен "Младостта на технологиите", Амодей описва идните години като преходна епоха за човечеството, момент, в който изкуственият интелект може да даде на хората власт, съпоставима с тази от "ядрената епоха", докато институциите и нормите няма да са подготвени.
Той представя развитието на ИИ не като плавно обновяване на ИТ сектора, а като ускоряващ се процес, който в рамките на няколко години може да доведе до "мощен изкуствен интелект", система, надминаваща най-добрите експерти в повечето интелектуални задачи, способна да изпълнява дълги автономни проекти и да се възпроизвежда в милиони копия. Този тип ИИ авторът описва образно като "държава от гении в център за данни".
Като мисловен експеримент Амодей предлага да приемем, че този повратен момент ще настъпи в следващите 2 години, и извежда пет основни групи заплахи.
Първата е рискът от автономност. Достатъчно интелигентна и "агентна" система може да започне да действа в собствен интерес, да използва слабости в цифровата инфраструктура, измама и влияние, а в по-дълъг хоризонт да ускори създаването на нови технологии и да превърне човешкия контрол в чиста формалност. Амодей подчертава, че проблемът не се изчерпва с тестове преди внедряване, защото усъвършенстваните модели могат да се адаптират, да разпознават тестови режими и да демонстрират "правилно" поведение, докато им е изгодно. Като отговор той описва многопластова стратегия за сигурност: "възпитание" на моделите чрез набор от принципи, които Anthropic нарича Конституция на изкуствения интелект, развитие на интерпретативността, тоест опити да се разбере вътрешната логика на решенията, както и задължителни външни оценки и процедури с червени екипи преди пускането на най-мощните системи.
Втората заплаха е разширяването на възможностите на злоумишлени актьори. Дори автономността и послушанието на ИИ да са гарантирани, рискът се премества към това високата компетентност да стане евтина и достъпна услуга. Според Амодей биорискът е особено чувствителна област, защото решаваща не е абстрактната информация, а способността на ИИ да води потребителя през сложни процеси като "подкрепа стъпка по стъпка", което снижава бариерата за потенциално разрушителни действия. Тук авторът настоява за съчетание от филтри и блокери за опасни заявки, вътрешен мониторинг и стандартизирани критерии за "усилване", както и за мерки извън индустрията на ИИ, например по-строги правила и проверки във веригите за синтез на генетичен материал. Той отбелязва, че надеждното филтриране и наблюдение изисква реални разходи и изчислителен ресурс, но го приема като неизбежна цена за достъп до мощни модели.
Третият риск е използването на ИИ от държави и големи организации за концентрация и укрепване на властта. Амодей предупреждава, че "земята на гениите", ако попадне в ръцете на авторитарен режим, може да се превърне в мащабируем механизъм за контрол, от всеобхватен поведенчески анализ и наблюдение, през манипулиране на информационната среда, до ускорено разработване на оръжия. Наред с това той разглежда и геополитическото измерение през призмата на производствените вериги на компютърния хардуер: най-съвременните чипове и производствените мощности остават ключово тясно място и демокрациите, според него, трябва да изградят защитни механизми за контрол върху критичната инфраструктура и износа, като паралелно оформят международни червени линии за най-опасните практики, свързани с ИИ.
Четвъртата тема е икономическият шок. Амодей допуска, че мощният ИИ може да ускори икономическия растеж до двуцифрени стойности, но предупреждава, че темпът на внедряване може да измести масово служители с бели якички по-бързо, отколкото пазарът на труда и образователните системи ще успеят да се приспособят. Като отделен риск се посочва концентрацията на капитала.
Есето разглежда възможността да се появят компании за трилиони долари и съответно лични богатства за трилиони долари, което според автора ще постави на изпитание устойчивостта на демокрацията и обществения договор. В този контекст той призовава за ранно наблюдение на скоростта на внедряване на ИИ по отрасли и за навременно обсъждане на преразпределителни и институционални решения, докато прозорецът за политическо управление все още е отворен.
Петата група включва косвените и "неизвестни" последици от ускорения прогрес, от радикални биотехнологии и удължаване на живота, до промени в човешката мотивация, култура и представи за смисъл, ако трудът и професионалните постижения престанат да бъдат централни. Амодей подчертава, че светът може да преживее "компресиране на един век в едно десетилетие", при което новите технологични възможности се появяват по-бързо, отколкото обществото успява да изработи норми за употребата им.
Като обобщение есето твърди, че "спирането" на развитието на ИИ е нереалистично. Знанията за създаване на мощни системи и икономическите стимули са твърде силни, а конкуренцията между държави и компании ще тласка процеса към ускоряване.
Затова, според Амодей, истинското предизвикателство не е да се забави напредъкът сам по себе си, а да се изгради режим на управляемост, който да намали вероятността от катастрофа, без да блокира полезните приложения. В противен случай, предупреждава той, човечеството може да не преживее собственото си "технологично юношество", период, в който властта вече е налице, но отговорността и инструментите за контрол все още отсъстват.