Microsoft търси по-евтини и по-прости алтернативи на езиковите модели на OpenAI
Подразделението на компанията използва около 2 хил. ускорителя NVIDIA, повечето от които днес се използват за обучение на по-ефективни модели
Въпреки че Microsoft притежава 49% от OpenAI, която разработва популярни и производителни езикови модели като GPT-4, интересите на компаниите не винаги съвпадат. Както съобщава Silicon Angle, Bing Chat Enterprise на първата и ChatGPT Enterprise на втората по същество се конкурират за една и съща целева аудитория. Освен това Microsoft, която се стреми да внедри изкуствен интелект в почти всички свои софтуерни продукти, подготвя нови, по-прости и по-малко ресурсоемки модели от GPT-4.
Според различни източници от OpenAI, Microsoft е загрижена за високите разходи за управление на усъвършенствани модели на ИИ. Компанията се опитва да вгради ИИ в много продукти, включително в базирания на GPT-4 Copilot за Windows. С повече от 1 милиард потребители на Windows по света компанията се опасява, че широкото разпространение на инструментите за ИИ ще доведе до неконтролируемо увеличение на разходите.
Съобщава се, че компанията вече е възложила на някои от своите 1500 служители в отдела за ИИ да работят върху по-рентабилни алтернативи - дори и да не са толкова "умни". Въпреки че изпълнението на съответните проекти все още е в начален етап, вече бе съобщено, че компанията е започнала вътрешни тестове на модели по собствена разработка.
По-специално, "творческият" и "прецизният" режим на Bing Chat разчитат на GPT-4, докато "балансираният" използва новите модели Prometheus и Turing. Последният може да отговаря само на прости въпроси, а по-сложните трябва да предаде за обработка на OpenAI.
За програмистите Microsoft разполага с модела Phi-1 с 1,3 млрд. параметъра, който може ефективно да генерира код, но иначе изостава от GPT-4. Друга алтернатива е моделът Orca на Microsoft, базиран на Meta Llama-2, който е собственост на Meta. Според някои доклади Orca е близък по възможности до моделите на OpenAI, но е по-компактен и изисква значително по-малко ресурси.
Смята се, че подразделението на Microsoft използва около 2 хил. ускорителя NVIDIA, повечето от които днес се използват за обучение на по-ефективни модели, които имат тясна специализация за разлика от мултидисциплинарния GPT-4. Докато преди конкуренцията на пазара беше за създаване на ИИ с най-големи възможности, сега един от най-важните фактори е цената за разработване и поддържане на такива инструменти.