Голосовой ИИ-стартап ElevenLabs выпустил новую модель Scribe, которая может переводить аудио в текст с 99 различных языков, включая украинский, беларусский, казахский и русский. Технология распознаёт как и речь от нескольких человек, так и фоновые шумы. Инструмент уже доступен для всех пользователей, но у бесплатной версии есть ограничение по количеству символов.
Ключевые факты
- ИИ Стартап ElevenLabs, который стал популярным, благодаря озвучке текстовых файлов, выпустил новую модель Scribe. Эта технология может преобразовывать аудиофайлы в текст.
- Новая модель поддерживает 99 языков. Компания предлагает 4 уровня качества транскрипции: отличный (менее 5% ошибок в словах), высокий (от 5% до 10%), хороший (от 10% до 20%) и умеренный (от 25% до 50%).

Источник: ElevenLabs
- В список доступных языков входят беларусский и русский. Как заявляет ElevenLabs, ИИ распознаёт беларусскую речь с процентом ошибки от 5,1% до 3,1%, а русскую от 3,5% до 3,1%.
- Модель умеет распознавать, кто говорит на аудио, добавлять точные метки времени для субтитров и автоматически отмечать звуки, например как смех аудитории.

Источник: ElevenLabs
- Чтобы перевести аудио в текст, пользователю нужнозагрузить файл в систему. Все остальные задачи ИИ модель выполнит самостоятельно.
- Технология доступна сейчас по бесплатной подписке, также есть и платная от 5$ до 22$ в месяц. В бесплатной версии искусственный интеллект может суммарно написать не более 10 тысяч символов в месяц. За один раз инструмент прослушает и озвучит не более 5 тысяч символов.
Бэкграунд
Напомним, в конце августа 2024 года ElevenLabs выпустила приложение для чтения и перевода текстов на 32 языка, включая русский. Приложение Reader можно скачать на iOS и Android, оно тоже работает с документами различных форматов.
Также в ноябре 2024 года стартап представил функцию GenFM, которая позволяет генерировать подкасты с двумя ведущими на базе разных типов контента.
Автор новости: Тимофей Петрищенко
Источник: ElevenLabs