Родная речь

тестируем современные голоса синтеза речи

В конце прошлого года ЦРТ выпустила новый голос – Юлию. В пресс-релизе говорилось, что голос специально создавался для озвучивания меню в Контакт-центрах. Нам захотелось проверить, так ли это. И мы решили провести свой первый SpeechTest.

Для сравнения мы взяли 2 голоса, уже присутствующих на рынке: Милену (разработка Nuance) и Марию (разработка ЦРТ). Оба голоса были выпущены в 2009 г. и хорошо себя зарекомендовали именно в IVR.

Существуют специальные методики оценки синтезированной речи, но они слишком специализированные. Мы подошли с позиций Заказчика: компании, владеющей Call-центром или голосовым сервисом. На что обращают внимание Заказчики:

1.    Естественность речи: на сколько голос похож на человеческую речь
2.    Точность произношения: как голос справляется с озвучиванием нередактированного текста (например, из БД) – с сокращениями, номерами телефонов, адресами эл. почты и сайтов в интернете
3.    Выразительность голоса: способность передавать эмоции. Раньше это было не очень актуально, но сейчас многие Заказчики хотят, чтобы система могла спрашивать, повышать голос и т.п. (особенно при исходящих звонках).

Именно по этим трем критериям мы и протестировали голоса. Результаты в таблице.

Как видите, Юлия действительно лучше всех справилась с заданиями. Справедливости ради надо сказать, что точность произношения у Милены может быть подкорректирована с использованием средств отладки, поставляемых производителем.

Прослушать тесты и сделать свои выводы, можно посмотрев видео-презентацию.

Site Footer

Sliding Sidebar

Дмитрий Столяр

Дмитрий Столяр

Автор SpeechBlog. Cтоял у истоков распространения технологии Call-центров в России. Отвечал за развитие бизнеса в компаниях Genesys, Cayo, FrontRange, OpenComm, Центральный Телеграф. SpeechBlog существует уже более 14 лет. Цель Блога - помочь компаниям общаться с клиентом. По любому каналу...