В журнале «Технологии и средства связи» (№4 Сентябрь 2010) опубликована моя статья о современных решениях по автоматизации call-центров. Привожу ее ниже.
Почти все компании, работающие с большим числом клиентов, имеют собственные call-центры (КЦ). Одной из самых актуальных задач для руководства КЦ в настоящее время является обеспечение требуемого качества обслуживания клиентов при сокращении или, как минимум, поддержании на прежнем уровне эксплуатационных расходов.
Практика отечественных компаний показывает, что манипуляции с персоналом – увеличение или наоборот сокращение численности – имеют свои ограничения. Однако в каждом call-центре существует элемент, который может существенно помочь в решении обозначенных выше задач – это система автоинформирования или интерактивное голосовое меню (IVR).
Эта статья посвящена тому, как при помощи системы автоинформирования можно решить задачи по повышению эффективности работы КЦ при одновременном сокращении расходов, какие технологии использовать для этого и в каких случаях следует применять тот или иной вариант обслуживания вызовов в автоматическом режиме.
Распознавание речи
Начнем с наиболее известной технологии — с распознавания речи (ASR). Несмотря на то, что это голосовое приложение сейчас на слуху, очень немногие компании в полной мере представляют себе, что это такое, и как следствие, не могут с максимальной эффективностью его применить.
ASR имеет достаточно долгую историю, изначально появившись как приложение для компьютеров. В call-центрах распознавание речи активно применяется 15 лет — с середины 90-х годов, и за время своего существования этот голосовой сервис в значительной мере усовершенствовался и показал свою эффективность. ASR позволяет пользователю КЦ в автоматическом режиме получать информацию, давать команды системе IVR с помощью голоса, без использования тонального донабора.
Главное преимущество технологии распознавание голоса для клиента – это удобство и простота управления. Человеку значительно проще сказать слово или фразу, чем запоминать порядковый номер нужного пункта меню и нажимать кнопки на телефонном аппарате. Удобство ASR для владельца call-центра заключается в том, что он может предложить пользователям в автоматическом режиме больше сервисов, чем доступно сейчас в стандартных КЦ с тоновым донабором. Речь идет о тех случаях, когда необходимо получение информации, которую невозможно уложить в 10 кнопок телефона: например, расписание сеансов в кинотеатрах, расписание движения транспорта, справочные службы 09, соединение с сотрудником по фамилии и др.
Большинство отечественных компаний не знают, как применить технологию распознавания речи, чтобы она принесла выгоду. При внедрении ASR заказчики обычно ограничиваются тем, что просто переносят ее возможности на существующее IVR-меню, заменив клавиши меню голосовым набором. Такой способ не учитывает сам принцип речевого взаимодействия человека с системой. В результате, клиенты не пользуются новыми автоматизированными сервисами, и количество обращений к IVR-системе не растет. Компании не получают экономии, а только увеличивают расходы — теперь уже и на эксплуатацию новой системы.
В то же время, западный опыт применения системы распознавания речи показывает, что данная технология реально может изменить сам принцип взаимодействия клиента с голосовыми сервисами. Чтобы достичь этого, необходимо оптимизировать всю IVR-систему, подстроить ее под возможность голосового набора с учетом психологии поведения клиента. В этом случае количество обращений к автоматическим сервисам может увеличиться на 40%.
Еще один важный момент, на который следует обратить внимание при внедрении ASR –проведение тестирования системы сначала внутри компании, а потом на группах пользователей. На основании результатов тестового периода и с учетом пожеланий клиентов следует провести корректировку сервисов, поскольку если система не будет удобна, клиенты не будут пользоваться ею, и компания не получит того эффекта от автоматизации, который планировался.
Технология распознавания речи применяется в call-центрах более 15 лет, поэтому на рынке есть надежные, стабильно работающие решения, обеспечивающие приемлемое качество. Из продуктов западных производителей – это решения «Nuance»; среди отечественных компаний существенный прорыв совершил «Центр речевых технологий». Какое решение использовать, выбирает заказчик, поскольку сейчас производители дают возможность тестирования своих продуктов: можно сравнить качество работы той или иной системы и удобство ее эксплуатации.
Технология распознавания речи не стоит на месте, а постоянно развивается. Появляются новые характеристики, которые расширяют возможности голосовых сервисов и повышают удобство их использования. Самой новой и перспективной тенденцией является применение так называемой открытой грамматики.
Открытая грамматика
Все системы распознавания речи, которые на текущий момент используются в России, требуют от клиента произношения строго определенных фраз или их синонимов. Часто пользователи говорят слова, которые не записаны в IVR-системе. Поэтому крайне необходимо заранее предусмотреть способы обработки таких обращений и возможность подсказок. Такая ситуация, безусловно, не является проблемой и вписывается в схему построения диалогов, однако она налагает ряд ограничений. Относительно недавно появилась следующая ступень в развитии голосовых сервисов – применение открытой грамматики, позволяющей человеку в произвольной форме сказать системе, какая информация его интересует.
Примером использования подобного сервиса является стартовый запрос, который применяется в системах с распознаванием речи. Сразу после приветствия клиента спрашивают, что какую информацию он хотел бы получить. Человек называет суть вопроса в совершенно естественной для него форме, так, как он привык это делать в обычной жизни. Преимущество открытой грамматики в том, что она позволяет создать более дружелюбные сервисы и еще более расширить варианты их применения.
Однако при принятии решения о том, какую грамматику использовать, необходимо учитывать, что внедрение и настройка открытой грамматики потребует гораздо больше усилий, времени и персонала. Нужно пройти специальный технологический цикл, прежде чем система будет естественным образом взаимодействовать с человеком. Но, несмотря на длительный период внедрения, открытая грамматика имеет много преимуществ, и с этого года мы начинаем применение технологии в наших проектах.
Синтез речи
Другим востребованным решением является синтез речи (TTS): воспроизведение текста компьютером с помощью синтезированных голосов. Эта технология также первоначально была разработана для компьютеров, в call-центрах же она используется уже около 8-10 лет.
Удобство синтеза речи состоит в том, что оно позволяет мгновенно озвучить и представить клиенту любую информацию именно в том виде, в каком она хранится у компании. На текущий момент меню большинства IVR озвучиваются профессиональными дикторами или сотрудниками компании. Плюсы данного способа в том, что пользователь слышит человеческую речь, а основной недостаток –даже не стоимость записи в студии (которая может быть достаточно дорогой), а временной фактор. Зачастую компаниям надо предоставлять в автоматическом режиме динамично меняющуюся информацию, но на перезапись обычно уходит от нескольких часов до нескольких дней, что значительно увеличивает срок ввода или обновления сервиса. Кроме того, существуют услуги, когда невозможно записать всю информацию заранее, например – данные о состоянии заказа, его доставки, информация новостного характера, справочные службы 09. Применение технологии синтеза речи может обеспечить включение этих сервисов в список доступных клиенту в автоматическом режиме круглосуточно и без участия операторов. Таким образом, только с помощью технологии синтеза речи можно предоставлять часто меняющуюся информацию в автоматическом режиме.
Ограничение TTS проистекает из самой природы синтеза речи и состоит в том, что пользователь слышит голос, который создан на компьютере. Несмотря на то, что технология прошла большой путь, и на русском языке существуют голоса, которые говорят достаточно понятно и разборчиво, определенный оттенок искусственности все же присутствует. Система может искаженно произносить те или иные слова: неправильно ставить ударение или использовать неверную интонацию. Надо понимать, что это не является непреодолимой проблемой. Разработчики вместе с синтезированными голосами поставляют и специальные программы, которые позволяют корректировать ошибки в произнесении и обеспечивать большую естественность звучания.
У технологии синтеза есть еще одно важное преимущество — наличие единого стандарта. Все современные системы IVR поддерживают работу с голосовыми приложениями по стандарту SAPI 5.1. Поэтому у компаний гораздо больше выбор голосов, которыми она может воспользоваться в КЦ, а для решения несложных задач при ограниченном бюджете можно взять системы синтеза речи для персонального компьютера.
На российском рынке систем синтеза речи с русским языком преобладают «Nuance», с русским женским голосом, и «Центр речевых технологий», обладающий большим выбором как женских, так и мужских голосов.
Верификация голоса
Относительно недавно была представлена новейшая технология — верификация голоса пользователя или же автоматическая идентификация. Сейчас очень много сервисов в КЦ, которые требуют верификации пользователя: банки предоставляют информацию о балансе на карточке или счете, предприятия связи — о наличии денег на счету за телефон или интернет. Обычно идентификация клиента производится или через оператора call-центра, или автоматическом режиме: через IVR вводом определенных кодов (номера контракта, логина и пароля). Главный недостаток такого подхода – необходимость ввода достаточно длинного ряда цифр, которого клиент в большинстве случаев не помнит. Система голосовой верификации снимает эти неудобства и позволяет клиенту с помощью речи получить быстрый и надежный доступ к индивидуальной информации.
Как клиент будет пользоваться системой? Человек, говоря специализированными терминами, оставляет слепок своего голоса, а фактически – продиктовывает произвольный текст или повторяет заранее установленную фразу как если бы он общался с автоответчиком. Система записывает сообщение, сохраняет его, и в следующий раз, когда клиент обращается за подобного рода сервисом, ему требуется сказать или определенную фразу, достаточно простую и естественную для произношения, или же произвольный набор слов. Система сравнивает сказанное с образцом, хранящимся у нее в базе, и, если его голос совпадает со «слепком», дает доступ пользователю. Для клиента эта процедура проста и естественна, как и система распознавания речи, поскольку базируется на тех же принципах. Главное же преимущество для компании — TTS расширяет доступность и востребованность автоматизированных сервисов.
IVR с кнопочным донабором
Мы говорили о трех основных голосовых технологиях для call-центров – распознавание, синтез речи и верификация голоса. Однако не хотелось бы забывать и о стандартном IVR с кнопочным донабором.
Подобного рода системы существуют практически в каждом КЦ, и повышение эффективности их работы также является актуальным вопросом для руководства. Решить подобную задачу можно не только внедрением голосовых технологий, но и посредством улучшения работы кнопочных систем. Основная проблема в работе call-центра заключается в том, что клиенты не пользуются сервисами IVR, а пытаются всеми способами связаться с оператором и задать ему вопрос, ответ на который они могли бы получить в автоматическом режиме. Для того, чтобы сделать кнопочные сервисы более востребованными, необходимо перестроить меню системы с учетом поведения пользователей и их восприятия IVR, сделать систему диалогов более удобной. Для этого нужно провести аудит работы существующего автоинформатора, посмотреть, какие разделы наиболее востребованы, какие вызывают у клиентов наибольшие затруднения. Выполнение этой работы требует довольно много временных и человеческих ресурсов, однако, как свидетельствует наш опыт, положительные результаты обязательно будут получены и показатели использования автоматических сервисов будут улучшены.