OpenAI пуска AI, което може да управлява компютъра ви
Някои експерти виждат в технологията висок риск за безопасността на потребителите. Компаниите обаче я считат за следващия голям напредък в изкуствения интелект
Тибор Блахо, софтуерен инженер с репутация за точно изтичане на информация за предстоящи AI продукти, твърди, че е открил доказателства за дълго обсъждания инструмент Operator на OpenAI.
Според публикации на Bloomberg, Operator представлява "агентна" система, способна автономно да изпълнява задачи като писане на код и резервация на пътувания. Тя може да управлява и работи с програми на вашия компютър.
Според изданието The Information, OpenAI планира да пусне Operator през януари. Код, открит от Блахо през този уикенд, потвърждава тази информация.
Клиентът на OpenAI ChatGPT за macOS вече има скрити опции за създаване на преки пътища за "Превключване на Operator" и "Принудително спиране на Operator", според Блахо.
Освен това, OpenAI е добавил препратки към Operator на уебсайта си, въпреки че тези препратки все още не са публично видими.
Блахо твърди, че уебсайтът на OpenAI включва и непублични таблици, които сравняват производителността на Operator с други AI системи за управление на компютър. Таблиците може да са временни, но ако числата са точни, те показват, че Operator не е 100% надежден в зависимост от задачата.
На OSWorld, бенчмарк, който имитира реална компютърна среда, "OpenAI Computer Use Agent (CUA)" — вероятно AI моделът зад Operator — постига резултат от 38.1%, което е по-добре от модела на Anthropic за управление на компютър, но далеч под резултата на хората от 72.4%.
OpenAI CUA надминава хората в WebVoyager, който оценява способността на AI да навигира и взаимодейства с уебсайтове, но изостава от човешкото ниво на друг бенчмарк, WebArena.
Operator среща трудности с задачи, които хората изпълняват лесно. Например, при тест за регистрация в облачен доставчик и стартиране на виртуална машина, Operator е успешен в 60% от случаите. При създаването на Bitcoin портфейл успеваемостта му е едва 10%.
Очакваното навлизане на OpenAI в пространството на AI агентите идва в момент, когато конкуренти като Anthropic, Google и други също разработват подобни технологии.
Въпреки че AI агентите са рискови и спекулативни, технологичните гиганти вече ги представят като следващата голяма иновация в сферата на изкуствения интелект.
Според аналитичната компания Markets and Markets, пазарът за ИИ агенти може да достигне стойност от 47.1 милиарда долара до 2030 г.
Днешните агенти са сравнително примитивни, но някои експерти изразяват опасения относно тяхната безопасност, ако технологията се развие бързо.
Една от изтеклите диаграми показва, че Operator се представя добре на определени тестове за безопасност, включително проверки за склоняване на системата към "незаконни дейности" и търсене на "чувствителна лична информация".
Според съобщенията, безопасността е една от причините за дългия период на разработка на Operator. В скорошен пост в X (бивш Twitter), съоснователят на OpenAI Войчех Заремба критикува Anthropic за пускане на агент, за който твърди, че липсват мерки за безопасност.
"Мога само да си представя негативните реакции, ако OpenAI направи подобно издание," написа Заремба.
Заслужава да се отбележи, че OpenAI е критикуван от AI изследователи, включително бивши служители, за това, че уж пренебрегва работата по безопасността в полза на бързото комерсиализиране на технологиите си.