Anthropic, компания, подкрепена от Amazon, пусна нова версия на своя AI модел Claude 3.5 Sonnet, която може да поеме контрола над компютър, изпълнявайки основни задачи като въвеждане на клавиши и кликвания с мишката. Това ѝ позволява да използва всяко приложение, инсталирано на устройството.

"Мисля, че навлизаме в нова ера, в която моделите ще могат да използват всички инструменти, които вие като човек използвате за изпълнение на задачи", заяви Джаред Каплан, главен научен директор на Anthropic, пред Wired.

Тази актуализация е част от усилията на компанията да превърне AI моделите в т.нар. "AI агенти", способни да изпълняват широк спектър от компютърни задачи, не само да взаимодействат чрез чат.

AI агенти и техните предизвикателства

Терминът "AI агенти" се използва за описване на модели, които са създадени да използват софтуер и да извършват компютърни задачи, подобно на хората. Някои, като Devin на Cognition AI, са насочени към програмиране, докато моделът на Anthropic е рекламиран като универсален. Той може да изпълнява технически задачи като програмиране или по-прости, като планиране на пътуване.

В демонстрация, описана от Wired, Claude е използван, за да планира пътуване до моста "Голдън Гейт" в Сан Франциско по изгрев слънце.

Изкуственият интелект сам отваря браузър, търси информация и добавя събитието в календара на потребителя, но пропуска важни подробности като маршрут до моста.

В друга демонстрация Claude създава уебсайт, използвайки Visual Studio Code, като дори стартира локален сървър за тестване. Въпреки малка грешка в кода, AI коригира проблема, когато му е обърнато внимание.

Предизвикателства и рискове

Въпреки обещаващите технологии, AI моделите все още имат проблеми с надеждността, особено при писане на код. Claude 3.5 Sonnet не е изключение. Според TechCrunch моделът успешно изпълнява по-малко от половината задачи в тест за резервиране и промяна на полети.

Освен това, подобни AI агенти представляват очевиден риск за сигурността. Бихте ли искали експериментална и непредсказуема технология да има достъп до файловете на компютъра ви или да използва вашия уеб браузър?

Anthropic обяснява, че пускането на подобни модели ще помогне за подобряване на безопасността, като позволява наблюдение и управление на потенциални проблеми в реално време.