ПЕРСПЕКТИВНЫЕ РЕЧЕВЫЕ ТЕХНОЛОГИИ.
Технологии распознавания и синтеза речи оказывают значительное влияние на различные отрасли, трансформируя способы взаимодействия с пользователями и оптимизируя процессы. Изучая материалы специализированных конференций можно составить представление о том, над чем сейчас работают исследователи во всем мире и какие технологии будут представлены в ближайшем будущем.
Недавний материал на портале Speech Technology поделился сведениями о конференции LREC-COLING-2024. Она проходила в мае в Турине и объединяла под общим названием две конференции: конференцию по языковым ресурсам и оценке (LREC — Language Resources and Evaluation Conference) и конференцию по вычислительной лингвистике (COLING — Computational Linguistics Conference).
В сегодняшней заметке расскажем о наиболее интересном направлении в языковых технологиях, о котором говорилось на этой конференции. Речь идёт о понимании речи, основанном не только на том , ЧТО было сказано , но и на том КАК это было сказано. Т.е. о эмоциональной оценке диалога. Где это может востребовано:
Сервисная поддержка — в такой сфере, как обслуживание клиентов, очень важно понимать не только слова, но и эмоции пользователей, передаваемые тоном голоса, акцентом и темпом речи, независимо от произносимых слов.
Медицина — то, как сказано, может иметь решающее значение в медицинских приложениях. Например, оценка тона и характера речи может дать информацию, полезную для диагностики многих заболеваний, влияющих на речь человека, таких как болезни Паркинсона и Альцгеймера или помочь выявлению депрессии.
Оценивать эмоции становится все более важно не только для голосовых вызовов, но и в текстовых приложениях, прежде всего в чатах. И здесь прежде всего обращается внимание на отслеживание ненормативной и агрессивной лексики. Автоматизированная модерация коммуникаций может существенно упростить и ускорить администрирование подобного рода диалогов.
Еще недавно все новации в области речевых технологий были доступны только для основных международных языков. Ситуация меняется и количество доступных языков измеряется уже сотнями. Но их количество продолжает расширяться. Многие представленные на конференции исследования были посвящены распространению методов, используемых в таких языках, как английский, на менее распространенные языки. Большой энтузиазм вызвало сообщение от Google о том, что компания приступает к реализации амбициозного проекта по предоставлению вычислительных ресурсов для анализа еще 7 500 языков мира, начав с публикации общего формата описания языков.
Конференция показала, что речевые технологии становятся все более точными и способны адаптироваться к индивидуальным особенностям пользователей, что открывает новые горизонты для их применения в различных сферах.