Google удалось синтезировать речь, неотличимую от человеческой

Google удалось синтезировать речь, неотличимую от человеческой

 

В компании утверждают, что Tacotron 2 использует контекст, чтобы произносить безусловно идентичные слова.

Первая преобразует текст в спектрограмму, а 2-ая — метод под названием WaveNet — озвучивает ее, генерируя соответствующие звуковые субъекты.

Компания Google создала новейшую технологию Tacotron 2, обладающую реалистичным синтезом человеческой речи.

Tacotron 2 основывается на нейронных сетях.

Система способна обрабатывать сложные слова и имена, а еще изменять интонацию зависимо от пунктуации. Записи Tacotron-2 получили 4,53 балла по пятибалльной шкале. Он также реагирует на пунктуационные правила в тексте, а еще может подчеркивать конкретные слова.

Google разработала продвинутый синтезатор речи обновленного поколения. В конечном итоге средний балл, полученный образцами работы Tacotron 2, составил не менее 4,53, а записи настоящей речи получили 4,58 балла. Предшествующая версия программы — Tacotron — набрала в среднем 4,0 балла.

Прочитайте также  Стивен Хокинг поддерживает идею создания мирового руководства

Как не прискорбно пока Tacotron 2 не имеет аналогов английскому языку и кроме того озвучивание производится только звуком женщины.

Программисты утверждают, что создали более совершенный на текущий момент инструмент для синтеза человеческой речи, который можно внедрить в функции голосовых помощников.

Google научился говорить не как робот, а как человек

 

 

Добавить комментарий