AI агентите се провалят при елементарни задачи
Въпреки инвестиционния бум, резултатите продължават да са неубедителни
Обратно в новинатаКоментари - AI агентите се провалят при елементарни задачи | IT.dir.bg
Коментари
И то много яко. Напънаха се да убеждават хората и корпорациите, че ще бъдат заменени с тия тъпи текстови калкулатори и никой не се сети да пита дали може да се махне халюцинацията от моделите? Отговорът технически е невъзможно. Те са резултат от архитектурата на трансформър логиката и реинфорсмънт лърнинг процеса. От там хитреците опитаха за един период да излъжат, като приложиха лууп в който ЛЛМ ите уж се коригират, но пак няма обещаната производителност. Тези играчки си имат място в работният процес. Могат да правят съкратени версии на текст, да генерират лайняни картинки за секретарките, да пълнят нета с боклук и да помагат за писане на програмен код на малки стъпки и то внимателно. Всичко това не изключва наличие на професионалист даже напротив. Майкрософт смело уволниха 9000 човека от гейм дивижъна на Ексбокса с идеята, че няма да им трябват повече. Ще стане като с великите Кларна, които си уволниха персонала, омазаха се с ИИ то и сега връщат всички, които още искат да работят за тях.
Наскоро Линус Торвалдс каза, че в момента ИИ е 90% маркетинг. И е прав. През 2024 г. рисковите инвестиции в ИИ са 131.5 млрд. долара. Резултатът - четете статията. Написаното не е само за ИИ агентите. Наскоро хванаха стартъп, чийто ИИ се оказаха 1000 индийци. В нещо подобно уличиха и Амазон. Всички ИИ в момента ползват хора, а самата технология е някаква безумна кочина, която бълва нечленоразделни глупости. Гледам и Джемини в търсачката на Гугъл. Търсиш нещо, тоя то излиза като резултат най-отгоре, четеш, а то някакви блудкави щуротии без нищо по същество а това, за което си питал. ИИ балонът скоро ще се спука както имотният балон преди време по същите причини - бесни инвестиции с висок риск, съмнителен резултат и харчене на пари нахалос.
Пробвал съм го в офиса и е гола вода. Трябва да го учиш като малко дете, което нито имам времето, нито намерението да правя. За кодиране може и да е върха, но за изпълнение на офис задачки не го бива особено. Дано така да си остане :)
То поне за кодене да ставаше, ама и за това не става. Дадох му задача, като му казах точно на кой ред от кода, какво се случва, защо трябва да се промени и какво трябва да се промени. Казах му какво да не пипа. Познай как се справи... Тръгна да пипа точно където му казах да не пипа. Махнах с ръка и си промених сам логиката. След това написах два юнит теста и пак на същия му казах, какви тестове съм написал и какви искам той да напише... Ами след 15тата минута чакане го спрях, защото за толкова време си ги написах сам.
Не знам ама последната програмистка задача на работа я дадох да я свърши Агента на Амазон и се справи доста прилично...
Вайб коднал си некво лайно, което нямаш идея как работи. Да ти обясня, ако му дадеш задачка, която логично е компресирана в дейта сета, ще ти издриска вариация. Ще работи, въпросът е как и дали ти знаеш какво правиш с него. 90 процента от турбо фенчетата на ИИ генериране с код са некадърници, които така или иначе щяха да ходят по стаковърфлоу да търсят други некадърници как са решили дадена задача. Да, полечно е за някой неща. Ма само в ръцете на някой, който знае какво прави и дебне да не си го набие до сливиците.