Google научила ИИ говорить «четче и естественнее»

Компания Google обновит движок для преобразования текста в речь Speech Services на Android-устройствах, сделав звучание голосов более чистым и естественным.

По данным разработчиков, пользователям не придется ничего делать — модернизация технологии «произойдет за кулисами». Обновление «значительно улучшит» качество сгенерированной речи, особенно в отношении четкости и естественности, добавили они.

table, th, td { border:0px solid black; font-family: ‘Inter var’,sans-serif; font-size: 12px; font-weight: 400; color: #65687d; font-style:normal; }
Пример текущего звучания сгенерированной речи
Пример звучания сгенерированной речи после обновления

421 голос на 67 языках получит новую речевую модель и синтезатор. Текущее звучание американского английского автоматически изменится на спич, созданный с помощью «более свежих данных».

Разработчики также показали образцы обновленных голосов на других языках.

table, th, td { border:0px solid black; font-family: ‘Inter var’,sans-serif; font-size: 12px; font-weight: 400; color: #65687d; font-style:normal; }
Португальский (Бразилия) до обновления
Португальский (Бразилия) после обновления
Испанский (США) до обновления
Испанский (США) после обновления

Компания распространит обновление для Speech Services на все 64-разрядные Android-устройства через магазин приложений Google Play в течение следующих нескольких недель.

Напомним, в сентябре OpenAI представила систему распознавания речи с открытым исходным кодом Whisper, обеспечивающую транскрипцию на нескольких языках.

В августе стриминговый сервис Megogo задействовал ИИ для озвучивания видеоконтента.

В мае 2021 года Google представила нейросетевую модель LaMDA, которая общается как живой человек и поддерживает непринужденный диалог на разные темы.

Подписывайтесь на наш Telegram и будьте в курсе последних новостей!
Чтобы оставить комментарий необходимо или зарегистрироваться
Авторизация
*
*
Регистрация
*
*
*
*
Генерация пароля