Нейросеть научили воссоздавать лицо по голосу

Исследователи из Массачусетского технологического университета разработали алгоритм, способный воссоздать лицо человека по звуковым волнам. Об этом пишет arXiv.org.


Спектограмма голоса позволяет с точностью определить три параметра: пол, возраст и расу. Ученые проанализировали данные миллиона аудиофайлов и видеотрывков, загрузив результаты в нейросеть. Первая часть системы воссоздавала лицо человека на основе видеофайла, а вторая анализировала полученные данные о голосе, также формируя изображение.


Как заявили авторы проекта, нейросети удавалось с точностью определять пол и представителей европеоидной, азиатской рас. Расхождение с реальными данными о возрасте больше десяти лет.

загрузка...


© 2015-2024 Сетевое издание «Фактом». Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Реестровая запись ЭЛ No ФС 77 - 67652 от 10.11.2016.