Голосовой ИИ-стартап ElevenLabs представил функцию GenFM, которая позволяет генерировать подкасты с двумя ведущими на базе разных типов контента. Технология работает на 32 языках, включая русский. Доступна для всех пользователей бесплатно на iOS и Android.
Послушайте, как это звучит, здесь.
Чтобы сделать подкаст, мы загрузили в программу текст этой новости. Для записи 7-минутного аудио искусственному интеллекту понадобилось около 5 минут. В подкасте ведущие обсудили не только саму новость, но и замену живых людей на ИИ-аватаров, а также авторские права и будущее ИИ-индустрии, хоть запроса на это не было.
Ключевые факты
- GenFM работает с PDF-файлами и другими документами, ссылками на внешние сайты и форматами электронных книг. Также можно просто написать текст в окне приложения или отсканировать физический документ.
- После загрузки файла приложение само выбирает голоса для озвучки. Ведущих может быть максимум двое. Примечательно, что ИИ добавляет в речь персонажей междометия и «вдумчивые паузы», чтобы «очеловечить» запись.
Источник: YouTube-канал ElevenLabs
- Новую функцию GenFM можно найти в приложении ElevenLabs Reader для iOS и Android, пока оно работает лишь в мобильной версии.
Бэкграунд
Напомним, что в конце августа этого года ElevenLabs выпустила приложение для чтения и перевода текстов на 32 языка, включая русский. Приложение Reader можно скачать на iOS и Android, оно тоже работает с документами различных форматов.
Автор новости: Тимофей Петрищенко
Источник: ElevenLabs