Полный гайд по промптам ElevenLabs: от эмоций v3 до настройки произношения

Исчерпывающее руководство по составлению промптов для ElevenLabs. Узнайте, как использовать аудио-теги для эмоций и звуковых эффектов в модели v3, корректировать произношение и управлять паузами с помощью знаков препинания, дефисов и тегов break. Мы собрали всё необходимое: от продвинутых техник озвучки до готовых шаблонов промптов для YouTube, персонажей и рекламы, которые помогут добиться идеального результата.

«Почему один и тот же текст вчера звучал отлично, а сегодня — совсем иначе?»

Это знакомо каждому, кто работает с ElevenLabs.
На самом деле, 80% успеха зависит от того, как именно составлен ваш «промпт» (текст для генерации).

Привет! С вами Sonetho

В ElevenLabs «промпт» — это не что-то сложное, а просто текст, который вы вводите для озвучки.
Но важно понимать: этот текст — не просто «набор букв», а полноценная инструкция для модели.

 

Даже простую фразу «Это просто невероятно» можно прочитать по-разному.
Без настроек она прозвучит монотонно. Но добавьте один эмоциональный тег — и модель оживит голос, передав настоящий восторг. Цифра, точка или даже дефис способны кардинально изменить результат.

 

Мы работаем с ElevenLabs уже почти три года и сегодня раскроем все секреты идеального промпта.
Внутри: аудио-теги v3, исправление произношения, паузы и готовые шаблоны для копирования. Читайте до конца!

 


📌 Важно: работа промптов зависит от выбора «модели»

Прежде чем начнем, проясним один момент.
«Аудио-теги» (audio tags) — такие как [excited] или [laughs] в квадратных скобках — работают только в модели Eleven v3.

 

Что будет, если добавить эти теги в модель v2 (Multilingual v2)?
Она не «сыграет» эмоцию, а просто прочитает тег как обычный текст (или проигнорирует его). 😅
(Наш эксперимент с сравнением v2 и v3 в 9 различных аудиодорожках можно послушать в статье Сравнение Eleven v3 и v2 на русском языке.)

 

Краткое резюме:
Хотите эмоции и звуковые эффекты? — Используйте v3.
Важна консистентность голоса в длинном тексте? — Используйте v2 (чтобы избежать возможных колебаний тона, присущих v3 при смене абзацев).
Исправление произношения и паузы (дефисы) — работают в обеих моделях.

Если хотите глубже погрузиться в разницу между моделями, почитайте наш разбор «Опыт использования: v2 vs v3».

 


🎭 1. Полный гайд по аудио-тегам v3 (Эмоции и эффекты)

Аудио-тег — это команда в квадратных скобках [ ], которая говорит модели «как именно произнести текст».
Официально считается, что тег влияет на подачу (delivery). На практике: если поставить тег перед предложением, он задает тон всей фразе; если внутри — добавляет эффект (смех, вздох и т.д.) прямо в этом месте.

 

Запомните два золотых правила:

  • Пишите теги на английском. (Тег [whispers] сработает гораздо лучше, чем «[шепот]» на кириллице).

  • Теги не озвучиваются. Это режиссерская инструкция, модель не будет произносить слово «whispers».
    (Актуально только для v3).

 

① Эмоциональные теги (лучше ставить перед фразой)

Тег

Эффект

Для чего подходит

[excited]

Воодушевление, радость

Анонсы, презентации

[sad]

Печаль, грусть

Драматические нарративы

[angry]

Гнев, раздражение

Актерская игра, персонажи

[whispers]

Шепот

Секреты, ASMR, напряжение

[sarcastic]

Сарказм, ирония

Юмористический контент

[curious]

Любопытство

Вопросы в сценарии

[nervous]

Нервозность, дрожь

Напряженные ситуации

[calm]

Спокойствие, уверенность

Медитации, инструкции

 

Пример ввода (v3):

[excited] Друзья, наконец-то мы запустили наш новый проект!
[whispers] А теперь по секрету: только сегодня у нас действует скидка.

👉 Первая фраза звучит ярко, а вторая — понижает голос до доверительного шепота. Возможность менять интонации внутри одного текста — главная фишка v3.

 

② Эффекты (невербальные звуки)

Эти теги добавляют реальные звуки: смех, вздох или кашель.

Тег

Звук

Где ставить

[laughs]

Смех

В середине или конце

[chuckles]

Легкое посмеивание

В середине или конце

[sighs]

Вздох

В начале или середине

[gasps]

Удивленный вдох

В начале

[clears throat]

Покашливание

В начале

[exhales]

Выдох

В середине или конце

 

Пример ввода (v3):

Ох, опять я это забыл. [sighs] Придется начинать сначала.
Знаете, что я вчера сделал?.. [laughs] Совершил нелепейшую ошибку.

 

📌 Совет редакции: не переборщите! ⚡
Теги можно комбинировать, но не перегружайте ими предложение. Слишком много команд могут привести к нестабильной работе (прерывистая речь, шум). Один тег на предложение — оптимальный стандарт. Чем меньше, тем естественнее.

 


🔤 2. Исправление произношения: если ИИ ошибается

Даже лучший промпт не поможет, если ИИ читает имя «Алексей» как «Алек-сей» с неправильным ударением. Проблемы произношения — это отдельная история.

 

Есть три способа их решения:

① Фонетическая запись (самый быстрый метод)

Просто запишите слово так, как оно должно звучать.

  • ChatGPTЧат-джи-пи-ти

  • APIЭй-пи-ай

  • 2026 годДве тысячи двадцать шестой год (если модель спотыкается на цифрах)

Это идеальный вариант для разовых задач.

 

② Разделение через дефис

Если слова сливаются в одно, используйте дефис для четкого разделения.

Чат-джи-пи-ти / Эй-пи-ай

Дефис помогает разделить слоги и добавить микро-паузу.

 

③ Словарь произношений (Pronunciation Dictionary)

Если специфический термин встречается в каждом ролике, не нужно постоянно править текст. Просто один раз добавьте его в Pronunciation Dictionary в настройках аккаунта.

 

🚨 Самая частая ошибка (берегите кредиты!):
В поле Alias (псевдоним) лучше использовать латиницу для иностранных слов или фонетическую запись на русском. Важно: в словаре не используйте дефисы. Просто напишите слово целиком, например: «Eat Sub». Дефисы нужны только в самом тексте сценария для акцентов и пауз.

Как настроить словарь, мы подробно разобрали в гайде «Идеальное произношение в ElevenLabs». Если голос «ломается», начните с этой статьи!

 

Кстати, v3 гораздо лучше обрабатывает цифры и символы (например, «$22» → «двадцать два доллара»), чем предыдущие модели. Но если важна идеальная консистентность произношения терминов — словарь всегда надежнее.

 


⏸️ 3. Паузы и дыхание: магия знаков препинания

ИИ ориентируется на ваши знаки препинания, чтобы понять, где сделать вдох и с какой интонацией закончить мысль.

 

① Длительность пауз

Знак

Эффект

Длительность

Запятая ,

Короткая пауза, продолжение мысли

Короткая

Точка .

Завершение фразы, снижение тона

Средняя

Абзац (Enter)

Смена блока, сброс дыхания

Длинная

Вопросительный знак ?

Повышение тона в конце

Средняя

Восклицательный знак !

Акцент, напор

Средняя

Многоточие …

Недосказанность, сомнение

Длинная

Дефис -

Мгновенная микро-пауза

Очень короткая

 

② Дефис (-) — наш любимый инструмент

Когда запятая — это слишком долго, а отсутствие знака — слишком быстро.

  • Разделение звуков: три-семь (чтобы слова не слипались).

  • Микро-вдох: «Итак, давайте-» (создает живое ощущение).

  • Напряжение: «Это-то самое-».

 

📌 Для пользователей v3: абзацы — палка о двух концах.
В v3 голос слегка «перезагружается» на каждом абзаце. Если в длинном тексте важно единство тембра — старайтесь меньше использовать перенос строк. Если же нужно кардинально менять настроение — смело делайте абзацы.

 

③ Точное управление паузами (для разных моделей) ⚡

Модель

Как сделать паузу

Примечание

v3

[pause], [short pause], [long pause]

Только для v3

v2 / Turbo / Flash

<break time="1.5s" />

Указание секунд, в v3 не работает

Studio (редактор)

Кнопка «Insert pause»

Самый простой способ

 

🚨 Самая частая ошибка: использование <break> в v3.
Модель v3 игнорирует старые теги SSML. Используйте [pause]. И наоборот: в v2 теги [pause] не сработают. Всегда проверяйте выбранную модель!

Если работаете в Studio, не нужно ничего писать вручную — используйте встроенную кнопку для вставки пауз.

 


📋 4. Шаблоны промптов (скопируйте и используйте)

① Информационный YouTube-нарратив

[curious] Ребята, вы знали об этом?
То, что я сейчас расскажу — очень просто, но результат впечатляет.
[excited] Что ж, давайте начинать!

▶ Рекомендация: Eleven v3.

② Эмоциональный диалог

[whispers] Никому не говори…
[nervous] На самом деле, я был там в тот день.
[sighs] Пожалуй, жалеть уже поздно.

▶ Рекомендация: Eleven v3.

③ Реклама товара (15 сек)

[excited] Только один день! Цена снижена.
Не ждите — потом будет дороже.
[calm] Сделайте выбор в пользу качества прямо сейчас.

▶ Рекомендация: Eleven v3.

④ Спокойная инструкция

Здравствуйте.
Сейчас я покажу, как настроить устройство.
Для начала нажмите кнопку питания и удерживайте ее три секунды.

▶ Рекомендация: Eleven Multilingual v2 (ради стабильности).

 


❓ FAQ — Часто задаваемые вопросы

Q. Тег [excited] прочитался как слово «эк-сай-тед». Почему?
Вы используете модель v2. Переключитесь на v3 в настройках.

Q. Можно ли писать теги на русском?
Можно, но стабильность будет ниже. Рекомендуем строго английские теги, как в нашей таблице.

Q. Как лучше управлять паузами в длинных текстах?
Для v3 — [pause]. Для v2 — теги <break>. Главное: не злоупотребляйте ими, иначе аудио станет «рваным».


🎁 Итог

ElevenLabs — это навык «дрессировки» нейросети. Один и тот же текст может звучать как сухой отчет или как глубокая актерская игра в зависимости от вашего промпта.

Сохраните эти шаблоны в закладки. Мы уверены: ваши тексты зазвучат совершенно по-новому!

С вами была Sonetho ⚡ До встречи в новых выпусках!