Meta пусна нов AI модел за превод
Системата е с отворен код, което изследователите се надяват да насърчи други да надградят върху текущите ѝ възможности
Meta пусна нов AI модел, който може да превежда реч от 101 различни езика. Това представлява стъпка към превод в реално време, при който думите се превеждат веднага щом бъдат изговорени.
Обикновено моделите за превод на реч използват многоетапен подход. Първо, те превеждат речта в текст. След това превеждат текста на друг език. Накрая, преведеният текст се преобразува обратно в реч на новия език. Този метод може да бъде неефективен, а на всяка стъпка могат да възникнат грешки и неправилни преводи.
Новият модел на Meta, наречен SeamlessM4T, позволява по-директен превод от реч на един език към реч на друг. Моделът е описан в статия, публикувана днес в Nature.
Seamless може да превежда текст с 23% по-голяма точност в сравнение с най-добрите съществуващи модели. И макар друг модел, AudioPaLM на Google, технически да може да превежда повече езици — 113 срещу 101 за Seamless — той може да ги превежда само на английски. SeamlessM4T може да превежда на 36 други езика.
Успехът на Meta се дължи на процес, наречен паралелно извличане на данни. При него се намират случаи, когато звук във видео или аудио съвпада със субтитри на друг език, извлечени от уеб съдържание. Моделът се е научил да свързва тези звуци на един език с подходящите части от текста на друг. Това е открило нови примери за преводи, които са били използвани за обучение на модела.
"Meta свърши отлична работа, като подкрепи толкова различни технологии, като преобразуване от текст към реч, реч към текст, дори автоматично разпознаване на реч," казва Четан Джайсвал, професор по компютърни науки в Quinnipiac University, който не е участвал в изследването. "Самият брой езици, които те поддържат, е огромно постижение."
Човешките преводачи все още са важна част от процеса на превод, отбелязват изследователите в статията, защото те могат да се справят с разнообразни културни контексти и да гарантират, че смисълът се предава правилно от един език на друг. Това е важно, казва Лин Боукър от Университета на Отава, която не е работила по Seamless. "Езиците са отражение на културите, а културите имат свои начини за разбиране на нещата," добавя тя.
Когато става въпрос за приложения като медицина или право, машинните преводи трябва внимателно да бъдат проверявани от човек, допълва тя. В противен случай могат да се получат недоразумения.
Например, когато Google Translate беше използван за превод на информация за ваксината срещу Covid-19 от Здравния департамент на Вирджиния през януари 2021 г., алгоритъмът преведе "не е задължително" от английски на испански като "не е необходимо", което промени цялото значение на съобщението.
AI моделите имат значително повече примери за обучение на някои езици в сравнение с други. Това означава, че текущите модели за превод на реч могат да превеждат от гръцки на английски, където има много примери, но не могат да превеждат от суахили на гръцки. Екипът зад Seamless се е опитал да реши този проблем, като е обучил модела върху милиони часове аудио на различни езици. Това предварително обучение му позволява да разпознава общи модели в езиците, което улеснява обработката на по-редки езици, защото вече има базови познания за това как звучат различните езици.
Системата е с отворен код, което изследователите се надяват да насърчи други да надградят върху текущите ѝ възможности. Но някои се съмняват в нейната полезност в сравнение с наличните алтернативи. "Моделът за превод на Google не е толкова с отворен код като Seamless, но е много по-отзивчив и бърз и не струва нищо за академици," казва Джайсвал.