Невронна мрежа пресъздава лицето на човек по гласа му | IT.dir.bg

17-11-2017 20-11-2018
Невронна мрежа пресъздава лицето на човек по гласа му
Снимка: Shutterstock

Невронна мрежа пресъздава лицето на човек по гласа му

Пълен и точен портрет от малък звуков запис все още не е възможен

| Редактор: Стоян Гогов 4 854

Изследователи от Лабораторията по изкуствен интелект на Масачузетския технологичен институт съобщават за интересен експеримент. Те са обучили невронна мрежа да пресъздаде облика на лицето на човек от малък звуков запис на речта му, става ясно от публикация в arxiv.org.

Полът на човека се определя лесно от гласа му. По-трудно, но все пак възможно е определянето на възрастта по гласа. Акцент в говора пък свидетелства за националността, предава technews.bg.

Останалите параметри в анализа не дават точни съответствия и синтезираният "портрет" в крайна сметка ще бъде доста условен.

Целта на изследователите е била да проверят колко информация за външния вид на човек може да се получи от характеристиките на речта му. За да направят това, те създали невронна мрежа за синтезиране на лицето от малък аудио запис. За обучение са използвани видеоклипове на хора, които говорят в YouTube и други уеб ресурси.

Оказва се в края на краищата, че компютърът все още не е в състояние да създаде точен портрет на човек по гласа му. Системата правилно познава пола, но възрастта рядко се определя по-точно от десет години. Системата познава и етническата принадлежност, но с голяма доза условност.

Невронна мрежа пресъздава лицето на човек по гласа му

Невронна мрежа пресъздава лицето на човек по гласа му

Пълен и точен портрет от малък звуков запис все още не е възможен

| Редактор : Стоян Гогов 4 854 Снимка: Shutterstock

Изследователи от Лабораторията по изкуствен интелект на Масачузетския технологичен институт съобщават за интересен експеримент. Те са обучили невронна мрежа да пресъздаде облика на лицето на човек от малък звуков запис на речта му, става ясно от публикация в arxiv.org.

Полът на човека се определя лесно от гласа му. По-трудно, но все пак възможно е определянето на възрастта по гласа. Акцент в говора пък свидетелства за националността, предава technews.bg.

Останалите параметри в анализа не дават точни съответствия и синтезираният "портрет" в крайна сметка ще бъде доста условен.

Целта на изследователите е била да проверят колко информация за външния вид на човек може да се получи от характеристиките на речта му. За да направят това, те създали невронна мрежа за синтезиране на лицето от малък аудио запис. За обучение са използвани видеоклипове на хора, които говорят в YouTube и други уеб ресурси.

Оказва се в края на краищата, че компютърът все още не е в състояние да създаде точен портрет на човек по гласа му. Системата правилно познава пола, но възрастта рядко се определя по-точно от десет години. Системата познава и етническата принадлежност, но с голяма доза условност.