SpeechYear 2011
5 знаковых событий года

В новом 2012 г. нашему блогу исполнится один год. Неслучайно он появился в этом году, а не год или два назад. Именно в 2011 году произошли знаковые события в области голосовых услуг, как в целом для индустрии, так и для нашей страны.
В преддверии годовщины блога, мы решили подвести итоги 2011 года. Итак, встречайте:
5 самых важных событий 2011 г. в области голосовых технологий !
1. Голосовой помощник Siri
Голосовой сервис от Apple, включенный в новую ОС iOS 5 и работающий на новейшей версии смартфона Iphone 4S. Смартфоны стремительно набирают популярность, растет и количество голосовых сервисов для них. Появление в прошлом (2010) году сервиса Google Voice показало, что именно приложения для мобильных устройств будут определять тенденции развития голосовых сервисов. Выпуск Siri осенью этого года задал новый уровень не только в развитии мобильных приложений, но и в формате взаимодействия человек-машина.
Siri пока еще не полноценный помощник человека (даже формально это бета-версия), но с ее помощью наконец-то стал возможен естественный диалог с машиной. Конечно, ее возможности (пока) еще ограничены. Но с ней можно говорить и она «разумно» отвечает! Даже простые ответы или действия, которые выполняет Siri, произвели ошеломляющий эффект на пользователей. Не случайно во множестве появились сайты, на которых приводятся диалоги с Siri и ее наиболее забавные ответы.
После Siri стандартные диалоги телефонных систем будут смотреться крайне убого. После Siri и телефонные сервисы будут вынуждены становиться «гуманнее». Это главный итог 2011 г.!
2. Преобразование речи в текст
Siri хороша во многом, но главный ее недостаток (для нас) – она не понимает русский (и неизвестно как долго еще будет не понимать). Поэтому выход русскоязычных голосовых сервисов всегда является событием. А если речь идет о приложении, о котором спрашивали еще 10 лет назад – то это событие достойно стать №2 в списке событий года.
Речь идет о технологии преобразования речи в текст. 1 сентября компания Nuance представила русскоязычную версию сервиса Dragon Dictation для мобильных (тоже для мобильных!) устройств. В блоге мы подробно писали об этом. Более того, мы участвовали в предварительном тестировании этого приложения.
Сервис открывает еще один канал взаимодействия человека с машиной. Если раньше все возможности ограничивались командами, которые IVR (или телефон) с разной степенью точности выполнял, то теперь появляется возможность распознавать слитный текст. Естественно, что надиктовать «Войну и мир» не получится (пока), но набор коротких сообщений (SMS, напоминания и т.п.) выполняется неплохо.
Тем самым общение с машиной или с голосовыми сервисами становится более органичным и естественным.
3. Распространение синтеза речи.
Любое общение эффективно, если оно двухстороннее. Если человеку становится проще говорить с машиной, то и она должна отвечать ему естественным образом – голосом. В этом году приложения для синтеза русской речи стремительно совершенствовались.
Еще несколько лет назад клиенты категорически отказывались даже рассматривать вариант озвучивания меню IVR синтезированным голосом, а в этом году крупнейшая российская компания РЖД стала использовать вместо дикторов роботов. Позвоните по тел. 8 800 775 00 00. Отличить от человеческой речи очень сложно!
Важно, что растет не только качество, но и количество. Крупнейшие компании-разработчики (ЦРТ – это их голоса используются в РЖД; Nuance) предлагают на выбор нескольких дикторов-роботов, с мужскими и женскими голосами.
Преимущества роботов очевидны: они не болеют, не увольняются, постоянно готовы к работе. С их помощью можно создавать более гибкие голосовые сервисы.
4. EasySpeech – Естественный диалог.
Технологии в этом году сделали существенный рывок. Но улучшение в одном месте создает проблему в другом: как их наиболее эффективно использовать? Ведь сами по себе технологии не привлекут клиентов и не удержат их. Мы не устаем повторять: клиенты не будут пользоваться даже наиболее современными сервисами если они не будут им нужны. Если клиенты не будут получать в IVR оперативную, точную информацию, быстрее, чем у оператора – они не будут ими пользоваться.
Именно поэтому в этом году «Открытые коммуникации» разработали специальную методологию EasySpeech – Естественный диалог. Она базируется на современных технологиях и учитывает многолетний опыт создания голосовых сервисов. В результате применения методологии «Естественного диалога» стало возможным быстро создавать сервисы, которыми удобно пользоваться. Растет число обращений, обслуженных автоматически – улучшаются показатели работы компании. Применение методологии сокращает время внедрения сервисов в разы, а значит происходит значительная экономия средств и сокращаются сроки окупаемости системы
Выгодно клиенту – выгодно компании!
5. Взлет речи. Январь 2012 г.
По нашей информации, в конце этого года была завершена разработка качественно нового голосового сервиса. Разработчики старались учесть в нем многие из тех новинок, о которых мы здесь написали. В январе 2012 г. сервис планируется к запуску. Следите за нашими публикациями и Вы узнаете об этом первыми!
Девиз недели
Доброе молчание — чем не ответ? (из опыта распознавания речи)
Метки блога
ASR Avaya Call-центр CallCenter Guru CCW 2010 CCWF 2011 crm google iPhone IVR Nuance OpenCom SpeechBlog SpeechClass SpeechDay SpeechDemo SpeechNews TTS Наносемантика Открытые коммуникации СМИ Сколково Центр речевых технологий автоинформатор автоматизация аудит верификация голоса голосовая идентификация голосовой поиск голосовые сервисы голосовые технологии госуслуги инф исследование контакт-центр маркетинг меню IVR продажи распознавание речи речевые технологии рынок связь синтез речи транспорт юморЭлектронное периодическое издание Speechblog.ru (профессиональный блог о речевых технологиях) зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Свидетельство о регистрации Эл № ФС77–46171.


