«Почему один и тот же текст вчера звучал отлично, а сегодня — совсем иначе?»
Это знакомо каждому, кто работает с ElevenLabs.
На самом деле, 80% успеха зависит от того, как именно составлен ваш «промпт» (текст для генерации).
Привет! С вами Sonetho ⚡
В ElevenLabs «промпт» — это не что-то сложное, а просто текст, который вы вводите для озвучки.
Но важно понимать: этот текст — не просто «набор букв», а полноценная инструкция для модели.
Даже простую фразу «Это просто невероятно» можно прочитать по-разному.
Без настроек она прозвучит монотонно. Но добавьте один эмоциональный тег — и модель оживит голос, передав настоящий восторг. Цифра, точка или даже дефис способны кардинально изменить результат.
Мы работаем с ElevenLabs уже почти три года и сегодня раскроем все секреты идеального промпта.
Внутри: аудио-теги v3, исправление произношения, паузы и готовые шаблоны для копирования. Читайте до конца!
📌 Важно: работа промптов зависит от выбора «модели»
Прежде чем начнем, проясним один момент.
«Аудио-теги» (audio tags) — такие как [excited] или [laughs] в квадратных скобках — работают только в модели Eleven v3.
Что будет, если добавить эти теги в модель v2 (Multilingual v2)?
Она не «сыграет» эмоцию, а просто прочитает тег как обычный текст (или проигнорирует его). 😅
(Наш эксперимент с сравнением v2 и v3 в 9 различных аудиодорожках можно послушать в статье Сравнение Eleven v3 и v2 на русском языке.)
Краткое резюме:
• Хотите эмоции и звуковые эффекты? — Используйте v3.
• Важна консистентность голоса в длинном тексте? — Используйте v2 (чтобы избежать возможных колебаний тона, присущих v3 при смене абзацев).
• Исправление произношения и паузы (дефисы) — работают в обеих моделях.
Если хотите глубже погрузиться в разницу между моделями, почитайте наш разбор «Опыт использования: v2 vs v3».
🎭 1. Полный гайд по аудио-тегам v3 (Эмоции и эффекты)
Аудио-тег — это команда в квадратных скобках [ ], которая говорит модели «как именно произнести текст».
Официально считается, что тег влияет на подачу (delivery). На практике: если поставить тег перед предложением, он задает тон всей фразе; если внутри — добавляет эффект (смех, вздох и т.д.) прямо в этом месте.
Запомните два золотых правила:
Пишите теги на английском. (Тег [whispers] сработает гораздо лучше, чем «[шепот]» на кириллице).
Теги не озвучиваются. Это режиссерская инструкция, модель не будет произносить слово «whispers».
(Актуально только для v3).
① Эмоциональные теги (лучше ставить перед фразой)
Тег | Эффект | Для чего подходит |
|---|---|---|
[excited] | Воодушевление, радость | Анонсы, презентации |
[sad] | Печаль, грусть | Драматические нарративы |
[angry] | Гнев, раздражение | Актерская игра, персонажи |
[whispers] | Шепот | Секреты, ASMR, напряжение |
[sarcastic] | Сарказм, ирония | Юмористический контент |
[curious] | Любопытство | Вопросы в сценарии |
[nervous] | Нервозность, дрожь | Напряженные ситуации |
[calm] | Спокойствие, уверенность | Медитации, инструкции |
Пример ввода (v3):
[excited] Друзья, наконец-то мы запустили наш новый проект!
[whispers] А теперь по секрету: только сегодня у нас действует скидка.
👉 Первая фраза звучит ярко, а вторая — понижает голос до доверительного шепота. Возможность менять интонации внутри одного текста — главная фишка v3.
② Эффекты (невербальные звуки)
Эти теги добавляют реальные звуки: смех, вздох или кашель.
Тег | Звук | Где ставить |
|---|---|---|
[laughs] | Смех | В середине или конце |
[chuckles] | Легкое посмеивание | В середине или конце |
[sighs] | Вздох | В начале или середине |
[gasps] | Удивленный вдох | В начале |
[clears throat] | Покашливание | В начале |
[exhales] | Выдох | В середине или конце |
Пример ввода (v3):
Ох, опять я это забыл. [sighs] Придется начинать сначала.
Знаете, что я вчера сделал?.. [laughs] Совершил нелепейшую ошибку.
📌 Совет редакции: не переборщите! ⚡
Теги можно комбинировать, но не перегружайте ими предложение. Слишком много команд могут привести к нестабильной работе (прерывистая речь, шум). Один тег на предложение — оптимальный стандарт. Чем меньше, тем естественнее.
🔤 2. Исправление произношения: если ИИ ошибается
Даже лучший промпт не поможет, если ИИ читает имя «Алексей» как «Алек-сей» с неправильным ударением. Проблемы произношения — это отдельная история.
Есть три способа их решения:
① Фонетическая запись (самый быстрый метод)
Просто запишите слово так, как оно должно звучать.
ChatGPT → Чат-джи-пи-ти
API → Эй-пи-ай
2026 год → Две тысячи двадцать шестой год (если модель спотыкается на цифрах)
Это идеальный вариант для разовых задач.
② Разделение через дефис
Если слова сливаются в одно, используйте дефис для четкого разделения.
Чат-джи-пи-ти / Эй-пи-ай
Дефис помогает разделить слоги и добавить микро-паузу.
③ Словарь произношений (Pronunciation Dictionary)
Если специфический термин встречается в каждом ролике, не нужно постоянно править текст. Просто один раз добавьте его в Pronunciation Dictionary в настройках аккаунта.
🚨 Самая частая ошибка (берегите кредиты!):
В поле Alias (псевдоним) лучше использовать латиницу для иностранных слов или фонетическую запись на русском. Важно: в словаре не используйте дефисы. Просто напишите слово целиком, например: «Eat Sub». Дефисы нужны только в самом тексте сценария для акцентов и пауз.
Как настроить словарь, мы подробно разобрали в гайде «Идеальное произношение в ElevenLabs». Если голос «ломается», начните с этой статьи!
Кстати, v3 гораздо лучше обрабатывает цифры и символы (например, «$22» → «двадцать два доллара»), чем предыдущие модели. Но если важна идеальная консистентность произношения терминов — словарь всегда надежнее.
⏸️ 3. Паузы и дыхание: магия знаков препинания
ИИ ориентируется на ваши знаки препинания, чтобы понять, где сделать вдох и с какой интонацией закончить мысль.
① Длительность пауз
Знак | Эффект | Длительность |
|---|---|---|
Запятая , | Короткая пауза, продолжение мысли | Короткая |
Точка . | Завершение фразы, снижение тона | Средняя |
Абзац (Enter) | Смена блока, сброс дыхания | Длинная |
Вопросительный знак ? | Повышение тона в конце | Средняя |
Восклицательный знак ! | Акцент, напор | Средняя |
Многоточие … | Недосказанность, сомнение | Длинная |
Дефис - | Мгновенная микро-пауза | Очень короткая |
② Дефис (-) — наш любимый инструмент
Когда запятая — это слишком долго, а отсутствие знака — слишком быстро.
Разделение звуков: три-семь (чтобы слова не слипались).
Микро-вдох: «Итак, давайте-» (создает живое ощущение).
Напряжение: «Это-то самое-».
📌 Для пользователей v3: абзацы — палка о двух концах.
В v3 голос слегка «перезагружается» на каждом абзаце. Если в длинном тексте важно единство тембра — старайтесь меньше использовать перенос строк. Если же нужно кардинально менять настроение — смело делайте абзацы.
③ Точное управление паузами (для разных моделей) ⚡
Модель | Как сделать паузу | Примечание |
|---|---|---|
v3 | [pause], [short pause], [long pause] | Только для v3 |
v2 / Turbo / Flash | <break time="1.5s" /> | Указание секунд, в v3 не работает |
Studio (редактор) | Кнопка «Insert pause» | Самый простой способ |
🚨 Самая частая ошибка: использование <break> в v3.
Модель v3 игнорирует старые теги SSML. Используйте [pause]. И наоборот: в v2 теги [pause] не сработают. Всегда проверяйте выбранную модель!
Если работаете в Studio, не нужно ничего писать вручную — используйте встроенную кнопку для вставки пауз.
📋 4. Шаблоны промптов (скопируйте и используйте)
① Информационный YouTube-нарратив
[curious] Ребята, вы знали об этом?
То, что я сейчас расскажу — очень просто, но результат впечатляет.
[excited] Что ж, давайте начинать!
▶ Рекомендация: Eleven v3.
② Эмоциональный диалог
[whispers] Никому не говори…
[nervous] На самом деле, я был там в тот день.
[sighs] Пожалуй, жалеть уже поздно.
▶ Рекомендация: Eleven v3.
③ Реклама товара (15 сек)
[excited] Только один день! Цена снижена.
Не ждите — потом будет дороже.
[calm] Сделайте выбор в пользу качества прямо сейчас.
▶ Рекомендация: Eleven v3.
④ Спокойная инструкция
Здравствуйте.
Сейчас я покажу, как настроить устройство.
Для начала нажмите кнопку питания и удерживайте ее три секунды.
▶ Рекомендация: Eleven Multilingual v2 (ради стабильности).
❓ FAQ — Часто задаваемые вопросы
Q. Тег [excited] прочитался как слово «эк-сай-тед». Почему?
Вы используете модель v2. Переключитесь на v3 в настройках.
Q. Можно ли писать теги на русском?
Можно, но стабильность будет ниже. Рекомендуем строго английские теги, как в нашей таблице.
Q. Как лучше управлять паузами в длинных текстах?
Для v3 — [pause]. Для v2 — теги <break>. Главное: не злоупотребляйте ими, иначе аудио станет «рваным».
🎁 Итог
ElevenLabs — это навык «дрессировки» нейросети. Один и тот же текст может звучать как сухой отчет или как глубокая актерская игра в зависимости от вашего промпта.
Сохраните эти шаблоны в закладки. Мы уверены: ваши тексты зазвучат совершенно по-новому!
С вами была Sonetho ⚡ До встречи в новых выпусках!