03 июня 2021
Интранет для внеофисных сотрудников: иногда проще ртом голосом, чем руками
Автор
Сергей Малинин
Digital-директор коммуникационной группы «МедиаЛайн»
Когда мы начали заниматься проблематикой голосовых интерфейсов, нас поразил один факт: никто в компаниях не сделал следующий очевидный, эффективный и очень короткий шаг — внедрение полного голосового доступа к информационной инфраструктуре. Почему этого не произошло? Давайте разбираться.
Вы когда-нибудь задумывались о том, что интранет-портал или мобильное приложение — это всего лишь посредник между сотрудником и сервисом? Причём, посредник, создающий иногда лишние барьеры в доступе к его услугам.
Проблематика: люди за бортом
Для офисных сотрудников, имеющих служебный ПК, стало привычным обращаться к графическому интерфейсу интранет-портала. Но при аудите корпоративных коммуникаций мы часто видим, что почти всегда за бортом информационной инфраструктуры компаний оказываются сотрудники, не имеющие служебного компьютера — производственники, водители, курьеры. Они не только не могут воспользоваться внутренними автоматическими сервисами компании, но и вообще порой выпадают из корпоративного информационного поля. Причём доля таких сотрудников может быть превалирующей.
Как пытаются решать эти задачи?
- Ставят инфокиоски на производствах (громоздко и негигиенично)
- Делают мобильные приложения для доступа к сервисам компании (обычно очень дорого и долго)
- Объявляют «горячую линию» по всем вопросам, указывая телефон ответственных лиц (снижая КПД ответственных лиц из-за необходимости синхронных ответов на звонки)
С точки зрения порога доступности, звонок по телефону для работников — самый доступный канал получения информации. Для этого не требуется знание никаких навыков, помимо врождённого навыка говорить.
Однако держать живого человека на другом конце провода слишком накладно. Если задуматься, то оператор в данном случае играет роль лишь посредника между работником и интранет-порталом.
А люди-посредники — это то, что в процессе цифровой трансформации подлежит автоматизации в первую очередь.
Сегодняшний уровень развития технологий синтеза и распознавания речи, а также построения диалогов позволяет организовать доступ к большинству функций интранет-портала через голосовой интерфейс.
Уже сейчас в российском корпоративном секторе появились первые пробные шаги звуковой коммуникации. Так, есть примеры внедрения голосовых роботов, которые проводят первичные беседы с кандидатами.
Когда мы начали сами этим заниматься, нас поразило то, что никто так и не сделал этот следующий логичный шаг — полный голосовой доступ к информационной инфраструктуре компании.
Как может выглядеть (звучать) голосовой интранет сегодня, на основе имеющихся в свободном доступе технологий?
- Канал связи — либо телефонный номер с бесплатным входящими звонками, либо смарт-помощник в существующем корпоративном мобильном приложении (если таковое уже есть).
- Идентификация — по голосу, это уже внедряется в банкинге, первые такие проекты уже запускали Сбер и Visa. Риск подделки голоса можно нивелировать дополнительным способом аутентификации — опять же, как это делают «горячие линии» банков, спрашивая «секретное слово», либо посылая SMS-сообщение с кодом тому сотруднику, именем которого представляется абонент.
- Заявки на отпуск, на заказ справок, на заказ канцтоваров, на получение СИЗ и т.д. Это важная часть любого интранет-портала. Проблем с реализацией через голосовой интерфейс не возникнет — подобные задачи уже сейчас легко решают голосовые роботы. Например, «Пермьэнергосбыт» внедрил голосового робота, которые собирает показания населения по счетчикам электричества, газа и воды, безошибочно распознавая цифры, которые люди диктуют по телефону. Причём, всего 4% абонентов понимают, что говорят с бездушной машиной, а не живым человеком.
- Поиск нужных документов — приняв голосовой запрос от пользователя на поиск, робот может сбросить на почту или в мессенджер сотрудника ссылки на документы, которые релевантны поисковой фразе.
- Поиск контактов сотрудников — робот по команде «найди сотрудника N» может назвать все подходящие совпадения в справочнике сотрудников (если в поисковую выдачу попало не более 9 сотрудников — иначе будет сложно в них ориентироваться на слух) и предложить связать с одним из них («…Скажите “четыре”, если хотите связаться с Иваном Ивановым из отдела логистики…»). Иными словами, сценарий упрощается до алгоритма работы IVR-маршрутизатора, только без ввода через клавиатуру телефона.
- Донесение важных новостей для сотрудников: при запросе некритичной информации (например, меню в столовой), перед её озвучиванием можно проигрывать короткие информационные сообщения.
- Курс адаптации для новичков: здесь вообще раздолье для экспериментов. Одним из вариантов решения может быть автоматический обзвон новых сотрудников с краткими опросниками или с рекомендациями ознакомиться с тем или иным документом. Сами документы в этом случае можно отправлять сотруднику по любому удобному ему каналу связи, либо, по желанию, зачитывать прямо в телефонную трубку.
Дополнительные преимущества:
- Через голосовой интерфейс можно автоматизировать панельные исследования — робот сам будет обзванивать по расписанию работников и собирать ответы на вопросы из анкеты в режиме диалога. Кстати, человеку психологически проще отвечать на вопросы последовательно, на один за другим, чем сразу видеть перед собой весь опросник целиком.
- К преимуществам голосового интерфейса также можно отнести легкую масштабируемость функционала. Например, работодатель в любой момент может ввести в перечень опций своего интранет-ресурса голосовые консультации с психологом или терапевтом. Точка доступа к получению услуги не изменится, а конечного пользователя нужно будет лишь уведомить о появлении новых возможностей.
Аудио-контент и голосовые интерфейсы — это возможность обойти сложившееся цифровое медиапотребление.
По исследованиям, которые озвучивает один из главных визионеров звукового Рунета Екатерина Ковалёва из Podcats.pro, потенциальный диапазон звукового потребления составляет порядка 4–5 часов в сутки. Это хоть и меньше экранного медиапотребления (7–8 часов в сутки), но эти пять часов пока ещё представляют собой «голубой океан» — за «уши» российской аудитории пока нет такой конкуренции, как в традиционных медиаканалах.
Особенности реализации
- Готовых «под ключ» решений пока нет. Однако уже сейчас разработчикам доступны мощные облачные решения от ряда ведущих российских вендоров, позволяющие эффективно распознавать голос, а также синтезировать речь из текста.
Для реализации голосового интерфейса к Интранет-порталу понадобятся:
— Сам Интранет-портал. Из требований — у него должен быть развитый программный интерфейс (API), позволяющий подключать к нему произвольные интерфейсы. Этим свойством обладают почти все современные коммерческие продукты такого рода.
— Прослойка, которая будет принимать команды от диалоговой системы, направлять их в Интранет-портал, получать и транслировать ответы.
— Диалоговая система — это механизм выстраивания диалога с пользователем, задачей которого является достижение определённых целей в ходе общения. Система будет пытаться понять тему запроса пользователя, вывести его на сценарий получения от него необходимых вводных для выполнения запроса к системе, после чего озвучит ему в удобной форме ответ системы.
Для простых задач можно сделать простое решение, основанное на «дереве» сценариев, когда ответы пользователя направляют робота по одной из ветвей сценария. Для более сложных ситуация есть готовые фреймворки построения сценариев, например, DeepPavlov.ai, Rasa и другие.
— Подсистемы распознавания и синтеза речи. Для этой работы уже есть мощные решения, в частности, Yandex SpeechKit, Google Cloud speechkit. Также есть отдельные решения для мобильных платформ — они могут работать без подключения к интернету.
- Основная доля трудозатрат при разработке придётся на составление сценариев общения или, как данные инструменты называются в звуковом интернете, — «навыков». Робот должен переспрашивать пользователя, уточнять и корректно отсекать ветви диалога, для которых у робота ничего не припасено.
- В голосовом интерфейсе важно избегать тупиковых сценариев для пользователя. Это связано с тем, что использование голосового интерфейса в среднем занимает больше времени, чем требует графический интерфейс (сделаем оговорку — это справедливо для офисного сотрудника, обладающего сравнительно высокой скоростью печати). Соответственно, воспроизведение пользователем одного и того же сценария раз за разом будет вести к существенному расходу времени.
Человеческий фактор
С чем мы столкнулись в наших первых опытах с этим форматом коммуникации:
- Одной из проблем восприятия является слишком разный уровень ожиданий конечных пользователей от качества работы системы. Часть пользователей, не веря в чудеса науки и техники, будет громко и чётко произносить короткие и однозначные команды, чтобы робот их точно понял. Но другая половина абонентов будет говорить с роботом, как с человеком, ожидая от того максимальной гибкости. Впрочем, эта пропасть постепенно сокращается вокруг медианы, которую задают голосовые помощники в голосовых колонках и в смартфонах.
- Даже в идеальном чат-боте у пользователя должен быть выход на живого собеседника. При этом даже в самых крупных компаниях проблематично организовать круглосуточную линию поддержки работников по неопределённому кругу вопросов. Это может быть решено созданием заявки на обратный звонок — всё это также можно сделать голосом.
Эпилога не будет. Голосовые технологии продолжают развиваться, причём пределы их применения сейчас ограничены не техническими аспектами, а полётом фантазии и смелостью инноваторов.