Дата релиза Eleven v3 раскрыта + поддержка 70+ языков: январский вебинар ElevenLabs за 5 минут

Приветствуем, это Sonetho! ⚡

Мы спешим поделиться главными анонсами с вебинара ElevenLabs, который состоялся 13 января.

ElevenLabs выходит за рамки привычного сервиса «AI-озвучки» и трансформируется в полноценную платформу для AI-креатива «все в одном».

От Studio 3.0, объединившей передовые видеомодели, такие как Sora 2 и Veo 3, до Scribe v2, распознающей речь точнее, чем человеческий слух — разбираем все обновления в деталях.

1. Studio 3.0: творческий процесс в едином окне (All-in-One)

Ключевая новинка — Studio 3.0. Суть концепции проста: «бесшовная интеграция рабочего процесса».

Больше никаких переключений между десятком сторонних сервисов для создания видео.

🎥 3 главные инновации Studio 3.0

Интеграция топовых видеомоделей: Теперь Google Veo 3, OpenAI Sora 2, Kling и Ideogram доступны непосредственно внутри ElevenLabs Studio. Вам больше не нужны отдельные подписки — все инструменты генерации контента под рукой.
Универсальный таймлайн: Просто введите текстовый запрос, и система автоматически сгенерирует проект: [озвучка (TTS) + звуковые эффекты (SFX) + фоновая музыка (BGM) + субтитры + видеоряд].
Инлайновое редактирование: Не устраивает конкретный фрагмент? Не нужно перегенерировать весь проект — просто выделите участок и внесите правки локально.

Это не просто обновление функционала, а результат глубокого стратегического партнерства с лидерами индустрии: Disney, NVIDIA и Adobe.

2. Scribe v2: точность, меняющая правила игры

Представленный следом Scribe v2 показал результаты, которые задают новый стандарт для инструментов распознавания речи (STT).

Особое внимание стоит уделить показателям частоты ошибок (WER).

Модель	Частота ошибок (WER)	Статус
ElevenLabs Scribe v2	2.2%	Абсолютный лидер
GPT-4o Transcribe	2.7%	-
Gemini 1.5 Pro	3.0%	-
Deepgram Nova 3	6.9%	-

* Чем ниже показатель, тем выше точность (усредненные данные для английского, французского, испанского и других языков).

Ключевые возможности Scribe v2:

Тегирование аудиособытий: Автоматическое распознавание смеха, аплодисментов или фоновых шумов.
Умная диаризация: Точная идентификация спикеров, даже при перебивании друг друга.
Пословная временная метка: Идеальная синхронизация субтитров с точностью до слова.

3. Безопасность и масштабируемость уровня Enterprise

ElevenLabs активно расширяет возможности для корпоративного сегмента.

🔒 Безопасность и комплаенс

Сертификация SOC 2 / ISO 27001: Соответствие стандартам информационной безопасности международного уровня.
Zero Retention (Без хранения данных): Опция, при которой данные не сохраняются на серверах компании.
Соответствие GDPR: Полное соблюдение европейских норм защиты данных.

🤝 Инструменты для совместной работы

Общий доступ к проектам и поддержка командных процессов согласования.
Гибкое управление правами доступа для сотрудников и внешних подрядчиков.

4. Q&A: Ответы на вопросы

Мы отобрали самые важные инсайды из сессии Q&A.

В. Когда выйдет движок V3?
О. Он находится на финальной стадии тестирования. Релиз ожидается в конце января или феврале.

В. Можно ли будет регулировать дыхание или тональность (Pitch)?
О. Да. Мы работаем над расширенными параметрами для Fine-tune аудио, которые скоро станут доступны.

В. Планируется ли русскоязычный интерфейс?
О. Да, локализация запланирована на этот год. Скоро пользоваться платформой станет еще удобнее.

Итог: скорость, с которой идеи обретают форму

Главный посыл вебинара звучит так: «Просто представьте — AI создаст».
Мы живем в эпоху, когда из текстового промпта одновременно рождаются видео, голос и саунд-дизайн.

Если вы готовы развиваться вместе с технологиями, рекомендуем протестировать возможности Studio 3.0 уже сегодня.

⚡ Попробовать ElevenLabs Studio 3.0 (официально)

На связи, Sonetho. ⚡