САТЕЛ о российском рынке голосовых роботов и особенностях решений ZIAX
На вопросы TAdviser по российскому рынку голосовых роботов и особенностям решений ZIAX ответил Роман Милованов, руководитель направления разработки чат-ботов и голосовых роботов, компания «САТЕЛ».
TAdviser: Как бы Вы охарактеризовали рынок чат-ботов и голосовых роботов в настоящее время
Роман Милованов: За последние несколько лет рынок чат-ботов и голосовых роботов сформировался. Он растет, и будет расти еще достаточно долго. Технология уже известна, а заказчики осознанно подходят к ее внедрению. Стало понятно, как пользоваться чат-ботами и голосовыми роботами, где можно их применять, а где — нельзя, и это самый главный результат на текущий момент. У заказчиков пропали завышенные ожидания, которые были при зарождении рынка. Например, полная автоматизация без обучения. Раньше заказчики думали, что робот самостоятельно будет продавать продукт или услугу, а менеджерам останется только обрабатывать заявки, выставлять счета и получать оплату. Кроме того, многие полагали, что роботам не требуется постоянного обучения, однако это не так, поскольку процесс обучения практически никогда не прекращается.
TAdviser: Используются ли сегодня чат-бот и голосовой робот по отдельности? Для каких задач?
Роман Милованов: Конечно, они используются как вместе, так и по отдельности. Одной компании важно снять нагрузку с операторов в телефонном канале, другой то же самое надо сделать в текстовом. Есть клиенты, которым интересна цифровизация обоих направлений, и это возможно, поскольку голосовой робот мало отличается от чат-бота. В нем используется «голосовой движок» для распознавания и синтеза речи, а в остальном «под капотом» все то же самое.
TAdviser: Как скоро появится видеоробот, чтобы закрыть еще один канал связи — видео?
Роман Милованов: Мне известно о нескольких попытках разработки так называемой «умной говорящей головы», в том числе нашими зарубежными коллегами. Насколько я знаю, в прошлом году в США запускали первого видеобота, использующего технологии искусственного интеллекта 3 в 1 (видео, голос, текст), который поддерживает переход на цифровое визуальное взаимодействие клиентов с различными специалистами компании. Думаю, что в ближайшем будущем уже станет возможным масштабировать использование данной технологии в коммерческих целях.
TAdviser: А запросы на такую технологию от рынка есть?
Роман Милованов: К нам поступают запросы на визуализацию голосовых помощников на сайте, чтобы «видео-ассистент» мог имитировать речь и создавать у посетителей сайта эффект присутствия, но могу заметить, что и подобных обращений не так много.
TAdviser: Вернемся к рыночным реалиям. В чем конкурентные преимущества голосовых роботов и чат-ботов ZIAX перед другими продуктами?
Роман Милованов: Основное преимущество — сама контекстно-интентная модель, по которой наша система работает. Это то, чем мы принципиально отличаемся от многих других продуктов.
TAdviser: В чем суть этой модели?
Роман Милованов: Данная модель приближена к работе человеческого мозга. Ведь любой диалог между людьми ведется в рамках контекста или нескольких контекстов. Например, мы встретились в первый раз и хотим познакомиться, что-то узнать друг о друге. Соответственно, у нас появился общий контекст — «контекст знакомства». В рамках этого контекста возникают разные намерения — «интенты», как мы их называем. Допустим, я хочу узнать имя – это намерение внутри контекста знакомства, потом я захочу узнать возраст, место работы. Когда я буду узнавать про работу, я подключаю дополнительный контекст — «контекст работы», но при этом не забуду и предыдущий. В рабочем контексте я могу спросить, где находится офис, про должностные инструкции. Когда мы пообщались по поводу работы, можем начать спрашивать, где любите отдыхать, то есть включить еще один контекст, который будет отвечать за отдых. Причем мы можем изменить порядок вопросов — сначала спросить про работу, потом про отдых, возраст и переходить с одного контекста на другой без ущерба для всего диалога. Собственно, именно это и позволяет делать наша система, работающая в рамках контекстов и интентов. Также у нас есть свой движок извлечения именованных сущностей — NER, Named-Entity Recognition.
TAdviser: Это что за инструмент, расскажите подробнее?
Роман Милованов: Мало понять намерение человека, нужно еще интерпретировать данные, которые он в него заложил. Для этого информацию нужно извлечь из фразы, а некоторые параметры нормализовать. Например, если человек сказал про «полдевятого вечера», система нормализует это время как «20:30». Полученная информация приближена к машинной и дает возможность работать через API (программный интерфейс) в разных внутренних и внешних системах заказчика, то есть производить интеграцию.
TAdviser: Как удалось реализовать контекстно-интентную модель?
Роман Милованов: Наша модель базируется на машинном обучении и ряде алгоритмических действий. По сути, мы объединили всё лучшее из классических нейронных и блочных систем, реализующих математическую логику на уровне блок-схем.
TAdviser: В каких отраслях чаще всего находит применение голосовой робот?
Роман Милованов: Чаще всего там, где есть повторяющиеся запросы со стороны клиентов, например — в банках, ресурсо-снабжающих организациях, интернет-магазинах. В целом голосовые роботы находят применение в любой отрасли, где есть коммуникации с клиентами. Я бы сказал, что так или иначе, 90% компаний могут использовать голосовых роботов.
TAdviser: Начиная с какого масштаба бизнеса использование голосового робота экономически целесообразно?
Роман Милованов: Из нашего опыта, решение показывает эффективность и экономическую целесообразность там, где больше 20-ти операторов.
TAdviser: Выполнение каких типовых задач робот может взять на себя?
Роман Милованов: Основная задача робота – снять нагрузку с людей, обрабатывающих заявки и звонки, чтобы они занимались не рутинными действиями, а более интеллектуальными, интересными задачами. Роботы могут взять на себя консультации по услугам компании, прием заявок, информирование клиентов о каких-то ситуациях, предоставление информации по статусу заказа. В некоторых случаях мы можем успешно подключать или отключать услуги на лицевых счетах клиентов. У нас есть несколько проектов, где мы делаем роботов-тренажеров для сотрудников компании и тем самым снимаем нагрузку с обучающего персонала. Если говорить в общем, то есть внешние и внутренние задачи. И мы можем использовать робота, как для внешних коммуникаций, так и для внутренних. Внутри компании его можно использовать для HR-службы, или для технической поддержки в IT-подразделениях, где есть постоянные запросы от пользователей. Сложности могут возникнуть при нетипичных и индивидуальных запросах.
TAdviser: С какими корпоративными системами требуется интеграция голосового робота/чат-бота внутри компании?
Роман Милованов: Жестких требований по интеграции нет, запрос идет от заказчика. Если для выполнения заложенной функции требуется интеграция, мы ее осуществляем. Безусловно, у системы должен быть механизм, который позволяет сделать интеграцию, то есть API.
TAdviser: Возможно ли подключение голосового робота к ВКС-системе? Есть такая практика на рынке?
Роман Милованов: На практике у нас была такая задача: робот «присутствует» в конференции, реагируя на определенные вызовы как голосовой помощник. По команде «покажи следующий слайд» или «включи свет в комнате» голосовой помощник показывает следующий слайд презентации или включает свет. Единственное ограничение: пока такое можно сделать в ВКС-системе на площадке заказчика, в переговорной, а не при облачной реализации.
TAdviser: Насколько сложно создать голосового робота/чат-бот? Может ли это сделать самостоятельно бизнес-пользователь заказчика?
Роман Милованов: Вся необходимая для создания робота документация, включая видеоуроки, находится в открытом доступе, мы проводим обучение сотрудников заказчика. Наши новые сотрудники, занимающиеся поддержкой и обучением роботов заказчика, проходят обучение, после чего начинают делать роботов сами. В большинстве случаев мы сами занимаемся созданием и поддержкой роботов. Заказчиков, разрабатывающих роботов самостоятельно, — единицы.
TAdviser: Какая у компании сейчас клиентская база?
Роман Милованов: В основном, мы работаем со страховыми компаниями, банками, ресурсо-снабжающими организациями — тепловые, газовые сети, с небольшими интернет-магазинами.
TAdviser: Голосовой робот или чат-бот на платформе ZIAX – это всегда решение на площадке заказчика или возможна облачная реализация?
Роман Милованов: Обычно мы размещаем свое решение на площадке заказчика, но можем развернуться на любых мощностях, в том числе на облачных серверах. Прецеденты размещения на серверах вне периметра заказчика в нашем портфеле также есть.
TAdviser: Акции компании «ЗИАКС» были приобретены «САТЕЛ» год назад, какие интересные проекты были реализованы за это время?
Роман Милованов: Активных клиентов у нас порядка десяти, и каждый по-своему интересен. Этим мне и нравится работа с чат-ботами и роботами: практически нет повторяющихся задач. Есть проекты со сложной реализацией с точки зрения диалога, где требуется серьезное обучение робота. В других случаях необходимо обеспечить способность выдержать высокую, бесперебойную нагрузку с обработкой большого количества клиентов в пиковые периоды. В одном проекте, который я уже упоминал выше, мы создаем роботы-тренажеры для сотрудников отдела продаж. У этих роботов разные легенды, различные жизненные ситуации, как у людей, а задача сотрудников - продать услугу или правильно проконсультировать.
TAdviser: А есть со стороны заказчика запрос на оценку эффективности робота?
Роман Милованов: Основной критерий эффективности робота – процент успешности, то есть процент общего количества диалогов, который мы признаем успешным. Это диалоги, которые робот обработал сам, без помощи оператора, даже если по ходу дела ошибался, но исправился и продолжил консультировать. Процент успешных диалогов мы всегда закладываем в договорах. На старте проекта его величина, как правило, чуть меньше, а потом робот дообучается и процент растет.
TAdviser: Каков максимальный процент успешных диалогов, достигнутый на сегодня?
Роман Милованов: Сейчас у нас максимальный процент - 87-90%, то есть из 1000 звонков 900 робот обработает без подключения оператора. Этот показатель относится к обученным, давно функционирующим роботам.
TAdviser: Таким образом, основных критериев эффективности обработки звонка два: человек не сбросил звонок и не потребовалось подключения оператора?
Роман Милованов: Не совсем так. Человек может сбросить звонок по разным причинам, поэтому звонки, сброшенные в первые 15 секунд соединения, даже не анализируются. Мы анализируем только те звонки, которые похожи на реальные диалоги. И здесь критерий успешности: робот правильно ответил на вопрос, поставленный человеком, без подключения оператора.
TAdviser: Планы по развитию продуктов платформы?
Роман Милованов: На данный момент мы разрабатываем модуль, чтобы в чате вместе с роботом могли работать операторы. Первую стабильную версию мы представим, предположительно, уже в конце января будущего года. Также на финальной стадии реализации находится наш модуль распознавания речи, который также планируем выпустить в конце января. Кстати, этот модуль мы делаем при поддержке Российского фонда развития информационных технологий (РФРИТ). Кроме того, в следующем году мы начинаем разработку модуля синтеза речи, чтобы максимально закрыть все потребности заказчика собственными программными решениями, без привлечения сторонних вендоров.