Стартап Lyrebird создал реалистичный синтезатор человеческого голоса
Lyrebird — канадский стартап, который создал синтезатор речи на базе нейронной сети. Программе достаточно изучить десятисекундный фрагмент аудиозаписи, чтобы компьютерный голос в точности повторил тембр и другие особенности человеческого голоса.
Участник проекта Хосе Сотело (Jose Sotelo) рассказал, что для обучения нейронной сети были использованы записи голосов тысяч людей. Собранная информация сжимается до степени некого «голосового ДНК». Синтезатор способен воспроизвести даже слова, отсутствовавшие в обучающих аудиофрагментах.
Для копирования голоса человека нейронный алгоритм улавливает особенности речи и использует их для синтеза.
Команда выложила аудиозаписи со скопированными голосами политических деятелей на SoundCloud. Результаты пока не идеальные: слышны цифровые артефакты, а некоторые слова трудны для понимания. Если Lyrebird поработает над улучшением, он создаст лучший голосовой синтезатор современности.
Реалистичный синтезатор речи может быть использован для обмана, поэтому разработчики советуют уже сейчас перестать верить достоверность голосовых записей.
Источник: Geek.com