Учени от Великобритания и САЩ са създали последно поколение изкуствен интелект, който може да чете много точно по устните - по-добре от всеки професионалист и два пъти по-добре от предишната подобна програма.
Четенето по устните е трудна задача, а хората, включително и програмите често правят грешки. Чрез използване на невронни мрежи, нови алгоритми за изчисления и машинно обучение е бил постигнат изключителен напредък.
Изследователите, работещи в базираната в Лондон компания DeepMind, са захранили изкуствения интелект с 140 000 часа видео от YouTube. Те са създали програма, способна да отдели всеки звук при изричането му от човешката уста. Софтуерът е филтрирал видеата на чужди езици, тези с хора, които не говорят или клиповете с лошо качество. В крайна сметка изкуственият интелект се е научил да разпознава над 127 000 думи на английски.
След като завършили обучението учените решили да дадат на изкуствения си интелект видео, което AI-то не било гледало. Бил избран клип с дължина от 37 минути, а изкуственият интелект разпознал грешно 41% от изречените думи.
На пръв поглед това не е много добър резултат, но предходната програма за четене по устни е сбъркала в 77% от случаите. Човек, който професионално чете по устните пък бърка в цели 93% от случаите.
Учените продължават работата си, като целта им е да намалят процента на грешното разчитане.
"Видеата с лошо качество и позицията на говорещото лице все още ни затрудняват", ризнава Хелън Беър от Университета Куйн Мери в Лондон.
Според анализаторите е възможно до средата на века да съществуват програми с изкуствен интелект за смартфон, които да четат по устните, като това би било от голяма полза за глухонемите.
По-големият проблем обаче са шпионите и разузнавателните агенции - в много градове е пълно с камери, като Лондон е лидер в класацията, а благодарение на изкуствения интелект дори и да прошепнете нещо - то няма да остава тайна за властите.
Докладът за постиженията на изкуствения интелект, четящ по устни, е публикуван в arXiv.