Google добилась прорыва в области синтеза речи с помощью ИИ

Share Button

Пока довольно просто понять, говорит ли человек или текст преобразован в речь компьютерной программой. Новый искусственный интеллект WaveNet, разработанный компанией DeepMind, возможно, сделает речь роботов неотличимой от человеческой.

Синтез речи искусственным интеллектом WaveNet

В настоящее время разработчики используют два основных метода для создания программ генерации человеческой речи. Один подразумевает использование большой коллекции слов и фрагментов речи, произнесенных конкретным человеком. В этом случае сложно изменять интонацию голоса. Другой метод формирует слова электронно, в зависимости от того, как они должны звучать. Так проще задавать интонации, но результат менее естественный.

Чтобы создать синтезатор, звучащий близко к человеческой речи, команда в качестве входящих данных передала нейронной сети аудиозаписи реальных людей. WaveNet обучается соответствию текста определенным формам колебаний волны и на основании этой базы знаний формирует из текстовых отрывков отдельные звуковые волны.

Участвовавшие в тестировании люди оценивали новый метод в сравнении с другими алгоритмами на слух. Предпочтение было отдано WaveNet — этот ИИ звучал наиболее «по-человечески» из всех представленных.

Некоторые образцы речи, синтезированной WaveNet:

DeepMind заявила, что их метод сокращает дистанцию между самыми лучшими синтезаторами и настоящей человеческой речью более чем вдвое. В эксперименте участвовали тексты на английском и китайском.

Входящими данными может быть не только записи человеческой речи. WaveNet с таким же успехом справилась с образцами звука фортепиано, выделив информацию, позволяющую имитировать звучание инструмента:

Больше образцов синтезированной речи на сайте Deepmind.

Компания DeepMind специализируется на разработках в области искусственного интеллекта. В 2014 года DeepMind купил Google. Эта же команда создала искусственный интеллект AlphaGo, который победил одного из лучших игроков в настольную игру Го.

Источники: BloombergDeepmind.com

Читайте также о том, скоро ли искусственный интеллект станет умнее Эйнштейна?

Share Button

Нет комментариев.

Оставить комментарий

© 2014-2024 Занимательная робототехника, Гагарина Д.А., Гагарин А.С., Гагарин А.А. All rights reserved / Все права защищены. Копирование и воспроизведение в любой форме запрещено. Политика конфиденциальности. Соглашение об обработке персональных данных.
Наверх