Компания Google создала продвинутый синтезатор речи нового поколения Tacotron 2, который основан на нейросети и может говорить с тембром, ритмом и произношением, не отличающимися от человеческой речи. Об этом сообщает TechCrunch.
Алгоритм Tacotron 2, работающий на основе двух нейронных сетей, представила команда разработчиков Google с участием Джонатана Шена. Печатная версия конвертируется в Tacotron-спектрограмму, где распределяются ритм и ударения. Слова генерируются в аналоге WaveNet. Также была добавлена система сбора данных для обучения нейросети.
Отмечается, что аудиозапись на самом деле похожа на язык живого человека. Темп речи звучит достаточно убедительно, а основные задержки происходят на словах с необычным произношением. Однако часть слушателей заявили, что система все же произносит некоторые слова "ломано".
Образцы работы Tacorton 2 уже можно послушать на официальном сайте Google. Вероятно, данную технологию сразу начнут использовать в продуктах компании.
В то же время одной из основных проблем нового алгоритма называют отсутствие регулирования тона речи. Из-за этого невозможно предсказать, какая фраза прозвучит возвышенно, а какая - грубо.
Комментарии
Случайное
Кот-автомат или кот-гитара: фото
6 июля 2018
Тонкий Android-смартфон Fly IQ4410
16 июня 2013
Город-сад на балконе
8 марта 2013
В Индии найдена 4000-летняя медная
10 июня 2016
Продвинуть до больного места
22 мая 2018
В Верховный суд пожаловались на
18 апреля 2018
ESA построит колонии на Луне
12 января 2016
Подруги и приятельницы: учимся дружить
16 марта 2013