Gemini 2: Какво може новият генеративен AI на Google
Планът на ИТ гигантът е да използва Gemini 2.0 навсякъде
След известно забавяне Google иска да навлезе във високо конкурентната среда на генеративния изкуствен интелект. Компанията се сблъска с проблеми с първата версия, която даваше твърде голямо количество неверни данни. Но какво всъщност е новият Gemini?
Google пусна Gemini 2.0 в сряда, около 10 месеца след старта на версия 1.5. Моделът все още е в т.нар. "експериментална фаза". За сега е достъпна само една версия — по-малкият, по-базов 2.0 Flash.
"На практика," казва Демис Хасабис, изпълнителният директор на Google DeepMind, "той е толкова добър, колкото текущият Pro модел. Можете да го възприемете като едно цяло ниво по-добър модел, със същата ефективност на разходите, производителност и скорост. Много сме доволни от това."
И не само, че е по-добър в изпълнението на старите задачи на Gemini, но също така може да изпълнява нови.
Gemini 2.0 вече може естествено да генерира аудио и изображения и предлага нови мултимодални възможности, които, според Хасабис, са основата за следващия голям напредък в AI - настъпването на тъй наречените AI агенти.
AI агентите са ботове, които могат да изпълняват задачи вместо вас.
Google демонстрира един такъв, наречен Project Astra, още от пролетта — това е визуална система, която може да разпознава обекти, да ви помага да се ориентирате и дори да ви каже къде сте оставили очилата си. Gemini 2.0 представлява огромно подобрение за Astra, казва Хасабис.
Google също така пуска Project Mariner — експериментално разширение за Chrome, което буквално може да използва вашия браузър вместо вас. Освен това има Jules, агент, специално разработен да помага на програмистите да откриват и поправят грешки в кода, както и нов агент, базиран на Gemini 2.0, който може да анализира екрана ви и да ви помага да играете по-добре видео игри.
Хасабис нарича гейминг агента "великденско яйце," но го посочва и като пример за това, което може да направи един истински мултимодален, вграден модел.
"Ние виждаме 2025 година като истинския старт на ерата на агентите," казва Хасабис, "и Gemini 2.0 е основата на това."
Въпреки дискусиите за забавяне в подобренията на моделите в индустрията, Google все още вижда напредък при обучението на нови модели.
Хасабис вижда подобренията в ефективността и скоростта на Gemini 2.0.
Това едва ли ще ви изненада, но планът на Google за Gemini 2.0 е да го интегрира навсякъде. Той ще задвижва AI Overviews в Google Search, които според компанията вече достигат до 1 милиард потребители и сега ще бъдат по-нюансирани и сложни благодарение на Gemini 2.0.
Разбира се, той ще бъде част от бота и приложението Gemini и в крайна сметка ще задвижва AI функциите в Workspace и други продукти на Google.