Приоткрывая будущее  

будущее речевых технологий

ПЕРСПЕКТИВНЫЕ РЕЧЕВЫЕ ТЕХНОЛОГИИ.

Технологии распознавания и синтеза речи оказывают значительное влияние на различные отрасли, трансформируя способы взаимодействия с пользователями и оптимизируя процессы. Изучая материалы специализированных конференций можно составить представление о том, над чем сейчас работают исследователи во всем мире и какие технологии будут представлены в ближайшем будущем. 

Недавний материал на портале Speech Technology поделился сведениями о конференции LREC-COLING-2024. Она проходила в мае в Турине и объединяла под общим названием две конференции: конференцию по языковым ресурсам и оценке (LREC — Language Resources and Evaluation Conference) и конференцию по вычислительной лингвистике (COLING — Computational Linguistics Conference). 

В сегодняшней заметке расскажем о наиболее интересном направлении в языковых технологиях, о котором говорилось на этой конференции.  Речь идёт о понимании речи, основанном не только на том , ЧТО было сказано , но и на том КАК это было сказано. Т.е. о эмоциональной оценке диалога. Где это может востребовано:

Сервисная поддержка — в такой сфере, как обслуживание клиентов, очень важно понимать не только слова, но и эмоции пользователей, передаваемые тоном голоса, акцентом и темпом речи, независимо от произносимых слов. 

Медицина — то, как сказано, может иметь решающее значение в медицинских приложениях. Например, оценка тона и характера речи может дать информацию, полезную для диагностики многих заболеваний, влияющих на речь человека, таких как болезни Паркинсона и Альцгеймера или помочь выявлению депрессии.

Оценивать эмоции становится все более важно не только для голосовых вызовов, но и в текстовых приложениях, прежде всего в чатах. И здесь прежде всего обращается внимание на отслеживание ненормативной и агрессивной лексики. Автоматизированная модерация коммуникаций может существенно упростить и ускорить администрирование подобного рода диалогов.  

Еще недавно все новации в области речевых технологий были доступны только для основных международных языков. Ситуация меняется и количество доступных языков измеряется уже сотнями. Но их количество продолжает расширяться. Многие представленные на конференции исследования были посвящены распространению методов, используемых в таких языках, как английский, на менее распространенные языки. Большой энтузиазм вызвало сообщение от Google о том, что компания приступает к реализации амбициозного проекта по предоставлению вычислительных ресурсов для анализа еще 7 500 языков мира, начав с публикации общего формата описания языков. 

Конференция показала, что речевые технологии становятся все более точными и способны адаптироваться к индивидуальным особенностям пользователей, что открывает новые горизонты для их применения в различных сферах.

Site Footer

Sliding Sidebar

Дмитрий Столяр

Дмитрий Столяр

Автор SpeechBlog. Cтоял у истоков распространения технологии Call-центров в России. Отвечал за развитие бизнеса в компаниях Genesys, Cayo, FrontRange, OpenComm, Центральный Телеграф. SpeechBlog существует уже более 14 лет. Цель Блога - помочь компаниям общаться с клиентом. По любому каналу...