тестируем современные голоса синтеза речи
В конце прошлого года ЦРТ выпустила новый голос – Юлию. В пресс-релизе говорилось, что голос специально создавался для озвучивания меню в Контакт-центрах. Нам захотелось проверить, так ли это. И мы решили провести свой первый SpeechTest.
Для сравнения мы взяли 2 голоса, уже присутствующих на рынке: Милену (разработка Nuance) и Марию (разработка ЦРТ). Оба голоса были выпущены в 2009 г. и хорошо себя зарекомендовали именно в IVR.
Существуют специальные методики оценки синтезированной речи, но они слишком специализированные. Мы подошли с позиций Заказчика: компании, владеющей Call-центром или голосовым сервисом. На что обращают внимание Заказчики:
1. Естественность речи: на сколько голос похож на человеческую речь
2. Точность произношения: как голос справляется с озвучиванием нередактированного текста (например, из БД) – с сокращениями, номерами телефонов, адресами эл. почты и сайтов в интернете
3. Выразительность голоса: способность передавать эмоции. Раньше это было не очень актуально, но сейчас многие Заказчики хотят, чтобы система могла спрашивать, повышать голос и т.п. (особенно при исходящих звонках).
Именно по этим трем критериям мы и протестировали голоса. Результаты в таблице.
Как видите, Юлия действительно лучше всех справилась с заданиями. Справедливости ради надо сказать, что точность произношения у Милены может быть подкорректирована с использованием средств отладки, поставляемых производителем.
Прослушать тесты и сделать свои выводы, можно посмотрев видео-презентацию.