GPT-4 може да хаква уебсайтове без намесата на човек
Изследователи постигнаха 53% успеваемост
По-рано тази година изследователи установиха, че невронната мрежа GPT-4 на OpenAI може да създава експлойти за уязвимости, като научава за тях онлайн. Сега те са успели да хакнат повече от половината от тестовите уебсайтове с помощта на автономни групи от ботове, базирани на GPT-4. При това, ботовете самостоятелно са координирали работата си и са създавали нови ботове, когато е било необходимо.
Отбелязва се, че ботовете в работата си са създали експлойти за Zero Day уязвимости, за които преди това не е било известно. В предишната си работа изследователите са използвали GPT-4 за експлоатиране на известни уязвимости (CVE), за които все още не са били пуснати пачове. В резултат на това те са установили, че невронната мрежа е успяла да създаде експлойти за 87% от високорисковите критични уязвимости CVE. Същите изследователи от Университета на Илинойс в Урбана-Шампейн публикуваха нова работа, в която ботове, базирани на невронни мрежи, са се опитали да хакнат тестови сайтове, отново използвайки Zero Day уязвимости.
Вместо да работят с един бот и да го натоварят с голям брой сложни задачи, изследователите са използвали група автономни, саморазвиващи се агенти, базирани на голям езиков модел (LLM). Създали са йерархичен метод за планиране, който включва възлагане на различни агенти на конкретни задачи. Един от основните елементи е станал "агент за планиране", който е контролира целия работен процес и е стартирал няколко "под-агенти" за изпълнение на конкретни задачи.
Подобно на взаимодействието между началник и подчинени, "агентът за планиране" е координирал действията си с "управляващ агент", който е делегирал задачи на "експертни субагенти", като по този начин е разпределял равномерно работното натоварване.
Изследователите сравняват ефективността на този подход, когато група ботове взаимодействат с 15 реални уязвимости. Оказало се е, че методът на йерархично планиране е с 550% по-ефективен от единичен бот, базиран на невронна мрежа, който се справя с подобни уязвимости. Групата от ботове успяла да експлоатира 8 от 15-те уязвимости, докато единичният бот е създал експлойт само за три.