Google удалось синтезировать речь, неотличимую от человеческой
В компании утверждают, что Tacotron 2 использует контекст, чтобы произносить безусловно идентичные слова.
Первая преобразует текст в спектрограмму, а 2-ая — метод под названием WaveNet — озвучивает ее, генерируя соответствующие звуковые субъекты.
Компания Google создала новейшую технологию Tacotron 2, обладающую реалистичным синтезом человеческой речи.
Tacotron 2 основывается на нейронных сетях.
Система способна обрабатывать сложные слова и имена, а еще изменять интонацию зависимо от пунктуации. Записи Tacotron-2 получили 4,53 балла по пятибалльной шкале. Он также реагирует на пунктуационные правила в тексте, а еще может подчеркивать конкретные слова.
Google разработала продвинутый синтезатор речи обновленного поколения. В конечном итоге средний балл, полученный образцами работы Tacotron 2, составил не менее 4,53, а записи настоящей речи получили 4,58 балла. Предшествующая версия программы — Tacotron — набрала в среднем 4,0 балла.
Как не прискорбно пока Tacotron 2 не имеет аналогов английскому языку и кроме того озвучивание производится только звуком женщины.
Программисты утверждают, что создали более совершенный на текущий момент инструмент для синтеза человеческой речи, который можно внедрить в функции голосовых помощников.