Компания Google создала продвинутый синтезатор речи нового поколения Tacotron 2, который основан на нейросети и может говорить с тембром, ритмом и произношением, не отличающимися от человеческой речи. Об этом сообщает TechCrunch.
Алгоритм Tacotron 2, работающий на основе двух нейронных сетей, представила команда разработчиков Google с участием Джонатана Шена. Печатная версия конвертируется в Tacotron-спектрограмму, где распределяются ритм и ударения. Слова генерируются в аналоге WaveNet. Также была добавлена система сбора данных для обучения нейросети.
Отмечается, что аудиозапись на самом деле похожа на язык живого человека. Темп речи звучит достаточно убедительно, а основные задержки происходят на словах с необычным произношением. Однако часть слушателей заявили, что система все же произносит некоторые слова "ломано".
Образцы работы Tacorton 2 уже можно послушать на официальном сайте Google. Вероятно, данную технологию сразу начнут использовать в продуктах компании.
В то же время одной из основных проблем нового алгоритма называют отсутствие регулирования тона речи. Из-за этого невозможно предсказать, какая фраза прозвучит возвышенно, а какая - грубо.
Комментарии
Случайное
В американских университетах установили
15 ноября 2013
Elite Dangerous: Horizons выходит на
4 мая 2016
God of War III. Обзор.
14 ноября 2012
Владимир Кличко ушел от истеричной и
4 декабря 2014
Разбитое неудачной любовью сердце лечим
26 сентября 2014
На побережье Орегона найдены загадочные
22 января 2013
LeEco LE X920 с двойной камерой
4 апреля 2017
Grand Theft Auto: San Andreas и другая
3 июня 2018