Не голосом единым

голосовой помощник

ГОЛОСОВЫЕ ПОМОЩНИКИ УЧАТСЯ СЛУШАТЬ ЗВУКИ.

Мы достаточно много в последнее время писали о голосовых помощниках (например, здесь и здесь). Не только потому, что они сами по себе нам нравятся, а из-за того, что это один из самых быстро растущих голосовых сегментов рынка. В данном случае я имею ввиду не смартфоны, а помощников , “располагающихся” в иных бытовых устройствах, прежде всего — в колонках. 

Их главной технологической задачей является правильно преобразовать речь в текст, а затем текст — в смысл: понять, что хотел их «хозяин» и выполнить его просьбу. Технологии совершенствуются постоянно, стремясь лучше распознать речь ( для разных задач, особенностей произношения, в  различном окружении и на разных языках). Именно РЕЧЬ . 

Так было с момента возникновения первых систем распознавания РЕЧИ, так происходит и сейчас: различные алгоритмы и машинное обучение ориентированы на все лучшее распознавание и понимание того, что ГОВОРИТ человек .

Но человек в современном мире взаимодействует не только с другими людьми, он все больше взаимодействует с другими устройствами , которые напоминают ему о себе и сообщают о своем состоянии. Как? С помощью ЗВУКОВ. 

В современном доме появляется все больше «умных» устройств: холодильников, плит, утюгов, лампочек и т.п. Работа с ними строится с помощью приложений для смартфонов, но они также стараются «привлечь внимание» к себе с помощью аудио и визуальных сигналов. 

Но кроме звуков от устройств «умного дома» нас постоянно окружают и естественные звуки (лай собаки, звонок телефона, звук воды и т.п.), на которые мы должны реагировать. 

Логично, что развитие технологий привело к пониманию того, что

голосовые помощники должны слушать и понимать не только ГОЛОС, но и ЗВУКИ. 

Первым за решение этой задачи взялся Amazon со своим семейством устройств Echo и помощницей Alexa. Еще в 2018 году Amazon добавил возможность реагирования на ряд ЗВУКОВ, включающих звук разбитого стекла и сигнал от детекторов дыма и газа. Эта опция называется Alexa Guard и включается после ухода «хозяина» из дома. Она начинает контролировать звуки и, в случае необходимости, отправляет уведомление на телефон. 

Позднее была добавлена возможность реагирования на лай собаки, плачь ребёнка и храп. 

На конференции в сентябре этого года Amazon объявил о разработке опции самостоятельного добавления звуков клиентами. Пока она находится в разработке, в ноябре Amazon добавил еще два типа звуков, на которые можно настроить действия: звук льющейся воды и звуковые сигналы от домашних устройств (бипы). 

По типу звуков, на которые сейчас реагирует Alexa, можно заключить, что этот функционал прежде всего ориентирован на решение вопросов безопасности: собственно само название функции говорит само за себя — Alexa Guard. Здесь голосовые помощники, которые являются универсальными бытовыми устройствами, входят на территорию отдельных специализированных устройств для контроля и безопасности. Потенциально, у голосовых помощников есть все возможности для активного развития в этом направлении , т.к. они более универсальны и готовы выполнить самые разные запросы, как связанные с безопасностью, так и помочь с развлечением, предоставить информацию или связаться по голосовой или видео связи. Немаловажно, что базовый функционал Alexa Guard бесплатный и доступен всем владельцам современных устройств с поддержкой Alexa. 

Но попробовать эти функции у нас не получится — Alexa Guard работает сейчас только в США.  

То, что устройства начинают слушать ЗВУКИ, может добавить дополнительное беспокойство по поводу конфиденциальности того, что происходит в доме. Но в конечном итоге, относительно скоро по поведению клиентов мы сможем увидеть, что важнее в настоящее время: новые возможности по контролю жилища и его безопасности или опасения по поводу конфиденциальности работы голосовых помощников.

Site Footer

Sliding Sidebar

Дмитрий Столяр

Дмитрий Столяр

Автор SpeechBlog. Cтоял у истоков распространения технологии Call-центров в России. Отвечал за развитие бизнеса в компаниях Genesys, Cayo, FrontRange, OpenComm, Центральный Телеграф. SpeechBlog существует уже более 14 лет. Цель Блога - помочь компаниям общаться с клиентом. По любому каналу...