ТЕПЕРЬ НАШИ ПИТОМЦЫ ТОЧНО МОГУТ ГОВОРИТЬ
Этот пост немного не напрямую касается темы блога, но так или иначе связан с голосовыми технологиями.
Всем известна компания Манго — отечественный разработчик программного обеспечения и сервисов для бизнес-коммуникаций. Однако у неё есть однофамилица — компания из Гонконга Mango Animate , которая занимается разработкой программного обеспечения для создания анимации и видео. Этим мало кого можно сейчас удивить.
Но недавно компания представила инструмент Mango AI, который превращает фотографии животных в говорящих персонажей. Достаточно загрузить фото питомца с чётко видимым лицом, и вы сможете задать текст или аудио, которое животное «произнесёт». Благодаря продвинутой системе распознавания лиц, синхронизация речи и мимики получается реалистичной и выразительной.
Для достижения естественного звучания, в текст можно вставлять паузы, имитируя ритм живой речи. Платформа интегрирована с Microsoft Azure, Amazon Polly и ElevenLabs, предоставляя разнообразие голосов на разных языках. Дополнительная настройка мимики позволяет придать анимации индивидуальность и глубину.
Mango AI расширяет возможности создания контента: от персонализированных поздравлений до креативных роликов для социальных сетей. Готовые видео легко экспортируются и публикуются на платформах вроде YouTube. Кроме того, инструмент предлагает функции перевода видео на разные языки и замену лиц в клипах, что открывает новые горизонты для мультиязычного и адаптивного контента.
Как отметил CEO Mango Animate, Уинстон Чжан, цель компании — сделать создание видео доступным для всех, независимо от технических навыков. Mango AI — яркий пример того, как речевые технологии могут быть не только функциональными, но и весёлыми, вовлекающими и эмоционально насыщенными.