Манго , да не наша

генерация речи животных

ТЕПЕРЬ НАШИ ПИТОМЦЫ ТОЧНО МОГУТ ГОВОРИТЬ

Этот пост немного не напрямую касается темы блога, но так или иначе связан с голосовыми технологиями. 

Всем известна компания Манго — отечественный разработчик программного обеспечения и сервисов для бизнес-коммуникаций. Однако у неё есть однофамилица  — компания из Гонконга Mango Animate , которая занимается разработкой программного обеспечения для создания анимации и видео. Этим мало кого можно сейчас удивить. 

Но недавно компания представила инструмент Mango AI, который превращает фотографии животных в говорящих персонажей. Достаточно загрузить фото питомца с чётко видимым лицом, и вы сможете задать текст или аудио, которое животное «произнесёт». Благодаря продвинутой системе распознавания лиц, синхронизация речи и мимики получается реалистичной и выразительной.

Для достижения естественного звучания, в текст можно вставлять паузы, имитируя ритм живой речи. Платформа интегрирована с Microsoft Azure, Amazon Polly и ElevenLabs, предоставляя разнообразие голосов на разных языках. Дополнительная настройка мимики позволяет придать анимации индивидуальность и глубину.

Mango AI расширяет возможности создания контента: от персонализированных поздравлений до креативных роликов для социальных сетей. Готовые видео легко экспортируются и публикуются на платформах вроде YouTube. Кроме того, инструмент предлагает функции перевода видео на разные языки и замену лиц в клипах, что открывает новые горизонты для мультиязычного и адаптивного контента.

Как отметил CEO Mango Animate, Уинстон Чжан, цель компании — сделать создание видео доступным для всех, независимо от технических навыков. Mango AI — яркий пример того, как речевые технологии могут быть не только функциональными, но и весёлыми, вовлекающими и эмоционально насыщенными.

Site Footer

Sliding Sidebar

Дмитрий Столяр

Дмитрий Столяр

Автор SpeechBlog. Cтоял у истоков распространения технологии Call-центров в России. Отвечал за развитие бизнеса в компаниях Genesys, Cayo, FrontRange, OpenComm, Центральный Телеграф. SpeechBlog существует уже более 14 лет. Цель Блога - помочь компаниям общаться с клиентом. По любому каналу...