Будущее за соединением технологий «инфов» и «голоса»

Интервью с Игорем Ашмановым

Портал Bankir.ru разместил интервью с Игорем Ашмановым, известным российским специалистом  в области искусственного интеллекта, генеральным директором компании «Ашманов и партнеры».

Интервью посвящено инфам — специально обученным виртуальным собеседникам, которые устанавливаются на сайт и общаются с посетителями. Один из вопросов касался планов по развитию инфов.

— Как вы собираетесь развивать инфов?

— Во-первых, мы делаем механизм, когда инф сам сможет обучиться по сайту заказчика. Всосать содержание и извлечь из него факты. Сейчас это делают люди – заказчики дают нам типовые вопросы, которые мы обрабатываем.

Также мы работаем над голосовым сопровождением для инфа. До сих пор, к сожалению, голосовые технологии, пригодные для разговора с любым пользователем, не созданы. Мы пока тестируем несколько решений по распознаванию голоса.

— А в чем сложность?..

— Синтез ответа по тексту – задача решённая. А вот распознавание любого диктора на большом словаре – пока нет. У разных людей разная манера разговора. Бывают также люди с дефектами речи. Роботу трудно со всеми этим разобраться.

Игорь прав, когда говорит о том, что есть сложности с работой систем распознавания на сайтах. Это совершенно новое направление для отечественных компаний. По моему мнению, это даже  более сложная задача, чем ответ на текстовый ввод. Применение стандартных подходов здесь не поможет, результаты получаются неудовлетворительные, что и подтвердил Игорь.

Тем не менее, добавление голосового управления на сайты – это перспективное направление в развитии интерактивности предоставляемой информации. Мы обсуждали способы ее реализации. Наше видение – применить принципы и способы построения диалогов для телефонных систем к работе сайтов.

Закономерный вопрос: будет ли это работать? Ведь это совсем другая форма взаимодействия, в отличие от разговора по телефону. Приведу свои аргументы.

Именно ввод «инфов», которые «разговаривают» с клиентом, может позволить построить диалог, похожий на телефонный. Именно в этом случае, наши способы построения диалогов могут помочь сделать работоспособную систему.

Прочитать полную версию интервью и узнать более подробную информацию о технологии инфов можно здесь.

Site Footer

Sliding Sidebar

Дмитрий Столяр

Дмитрий Столяр

Автор SpeechBlog. Cтоял у истоков распространения технологии Call-центров в России. Отвечал за развитие бизнеса в компаниях Genesys, Cayo, FrontRange, OpenComm, Центральный Телеграф. SpeechBlog существует уже более 14 лет. Цель Блога - помочь компаниям общаться с клиентом. По любому каналу...