Чат-бот заговорил: технология синтеза речи меняет правила игры в общении с пользователями

28 августа 2024 CNews

Речевые технологии становятся неотъемлемой частью цифровизации компаний. Внедрение программных решений по распознаванию и синтезу речи повышает эффективность бизнес-процессов, улучшает функции голосовых помощников, а также предоставляет сервисы для людей с ограниченным возможностями. Одним из таких решений является модуль синтеза речи ZIAX TTS, разработанный компанией САТЕЛ.

Голосовой модуль ZIAX TTS, работающий на основе нейронных сетей, предназначен для синтеза речи с высокой степенью реалистичности, близкой к естественному человеческому голосу. Решение может быть использовано для голосового управления, голосового ввода текста и поиска, а также для IVR, озвучивания стенограмм, диктовки текста.

Модуль подразумевает два формата работы: потоковую обработку (в режиме реального времени) и генерацию аудиофайлов в режиме офлайн. Аудиосигнал синтезируется в потоковом режиме с частотой дискретизации 8000 ГЦ или 22000 ГЦ, что обеспечивает высокое качество оцифровки голоса. Среди ключевых преимуществ голосового модуля:

  • Высокое качество произношения речи. Благодаря нормализации и предобработке текста все аббревиатуры, сокращения и числа сначала переводятся в прописной формат с анализом контекста фразы для того, чтобы синтез был максимально логичным и «человечным».
  • Брендирование голоса заказчика. В функционал модуля входит обучение модели новым голосам.
  • При внедрении сервиса возможно гибкое развертывание системы на сторонних серверах – модуль может быть установлен как в облаке, так и локально в защищенной среде заказчика.
  • Простая интеграция с различными кроссплатформенными приложениями и сервисами обеспечивается API на основе gRPC протокола либо REST.
  • ZIAX TTS адаптирован под работу как на стандартных ядрах вычислительного процессора, что существенно сокращает стоимость внедрения, так и на GPU.
  • ZIAX TTS может решать ряд важных бизнес-задач – повышать эффективность массового обзвона неограниченного количества адресатов, обслуживать клиентов на первой линии контакт-центров, записывать рекламные ролики или озвучивать текст. Кроме того, ZIAX TTS позволит компаниям внедрять сервисы для людей с ограниченными возможностями – например, использовать функцию озвучивания текста голосом для слабовидящих пользователей.


    Подписаться на новости