"Por que o roteiro é o mesmo, mas a narração de ontem soou diferente da de hoje?"
Se você usa o ElevenLabs, com certeza já passou por isso.
Na verdade, 80% dessa diferença está em "como você escreveu o seu prompt (entrada de texto)".
Olá, aqui é a Sonetho ⚡
No ElevenLabs, um 'prompt' não é nada complicado; é simplesmente o texto que você insere para converter em áudio.
No entanto, o segredo é entender que esse texto não é apenas um "bloco de palavras" qualquer.
Mesmo uma frase simples como "Isso é realmente incrível":
Se você digitar apenas a frase, a IA lerá de forma comum.
Mas, se adicionar uma etiqueta de emoção antes, a IA atuará com uma voz genuinamente surpresa. Um número, um ponto final ou um hífen podem mudar completamente o resultado.
Depois de usar o ElevenLabs diariamente há quase três anos,
hoje vamos mergulhar fundo em 'como escrever prompts'.
Preparamos tudo: etiquetas de áudio v3, correção de pronúncia, pausas e até modelos (templates) prontos para você copiar e colar. Leia até o fim!
📌 Primeiro: O funcionamento dos prompts varia conforme o 'modelo'
Antes de começar, um aviso importante.
As 'etiquetas de áudio (audio tags)' que apresentaremos a seguir — como [excited] ou [laughs] — funcionam apenas no modelo Eleven v3.
O que acontece se você inserir essas tags no v2 (Multilingual v2)?
O modelo não as interpretará como 'atuação', mas as tratará como texto comum (a tag será lida literalmente ou ignorada). 😅
(Você pode conferir nossa comparação experimental de 9 faixas entre v2 e v3 em Comparativo Eleven v3 vs v2 em português.)
Resumo em uma linha
• Para etiquetas de emoção/efeitos sonoros → Use o v3
• Para conteúdos longos + consistência de voz → Use o v2 (evita a variação tonal do v3 entre parágrafos)
• Para correção de pronúncia e pausas (hífen) → Funciona em ambos (v2 e v3)
Se quiser se aprofundar nas vantagens e limitações, confira nosso artigo sobre dicas de usuários reais do v2 vs v3.
🎭 1. Guia completo de etiquetas de áudio v3 (emoções e efeitos)
As etiquetas de áudio são comandos escritos em inglês dentro de colchetes [ ] que indicam à IA 'como falar'.
Embora a orientação oficial seja que 'a etiqueta influencia a entrega do texto seguinte', na prática, descobrimos que:
Ao colocar no início da frase, ela define o tom de toda a sentença;
Ao colocar no meio, ela gera o efeito (risada, suspiro, etc.) naquele ponto exato.
Lembre-se de dois pontos importantes:
As etiquetas devem ser escritas em inglês. (Ex: [whispers] funciona muito melhor do que [sussurro])
As etiquetas não são ditas em voz alta. São instruções de atuação; a IA não vai falar a palavra "whispers".
(Isso vale apenas para o v3.)
① Etiquetas de tom emocional (funcionam melhor no início da frase)
Etiqueta | Efeito / Significado | Ideal para |
|---|---|---|
[excited] | Tom empolgado/animado | Anúncios de eventos, lançamentos |
[sad] | Tom triste/abatido | Narração emotiva, leitura de contos |
[angry] | Tom irritado/exaltado | Diálogos de personagens, drama |
[whispers] | Sussurrado/baixo | Segredos, estilo ASMR, tensão |
[sarcastic] | Tom irônico/sarcástico | Conteúdo de humor, personalidade |
[curious] | Tom curioso | Narração com perguntas |
[nervous] | Tom tenso/trêmulo | Cenas de suspense ou urgência |
[calm] | Tom calmo e estável | Meditação, guias de instruções |
Exemplo de aplicação (v3):
[excited] Pessoal, finalmente o nosso novo produto foi lançado!
[whispers] Na verdade, preparamos um desconto especial só para hoje.
👉 A primeira frase sobe o tom, enquanto a segunda baixa a voz para um sussurro. Essa capacidade de alternar tons no mesmo roteiro é o que torna o v3 incrível.
② Etiquetas de efeitos sonoros (inserir no meio da frase)
Essas não definem um 'tom', mas produzem um som real: risadas, suspiros ou pigarros.
Etiqueta | Som produzido | Posição ideal |
|---|---|---|
[laughs] | Risada | Meio ou fim |
[chuckles] | Risada leve/curta | Meio ou fim |
[sighs] | Suspiro | Início ou meio |
[gasps] | Susto (inspiração rápida) | Início da frase |
[clears throat] | Pigarrar | Início da frase |
[exhales] | Expiração/ar | Meio ou fim |
Exemplo de aplicação (v3):
Ah, esqueci disso de novo. [sighs] Vou ter que começar do zero.
Então, o que eu fiz ontem foi... [laughs] cometi um erro absurdo.
📌 Dica do editor: Menos é mais ⚡
Você pode combinar etiquetas, mas exagerar em uma única frase pode tornar o áudio instável (ritmo estranho, ruídos) ou fazer com que a tag seja ignorada.
Nossa recomendação é: uma etiqueta por frase, apenas onde for estritamente necessário. O naturalismo mora na moderação.
🔤 2. Correção de pronúncia: Quando nomes, números ou siglas falham
Mesmo com um ótimo prompt, se a IA ler "ElevenLabs" como "Ele-ve-labis", o resultado perde a qualidade. 😭
Problemas de pronúncia não se resolvem com etiquetas de emoção; o método é diferente.
Existem três formas principais:
① Escrita fonética (rápida e simples)
Escreva a palavra do jeito que ela soa em português (ou no idioma de destino).
ChatGPT → Chat-dji-pi-ti
API → A-Pê-I
2026 → dois mil e vinte e seis (quando a IA se confunde nos números)
Ideal para roteiros que você usará apenas uma vez.
② Hífen para separar pronúncia
Quando duas sílabas se fundem de forma estranha, adicione um hífen para separar.
A-Pê-I / Chat-dji-pi-ti
O hífen ajuda tanto na separação quanto em uma micro-pausa.
③ Dicionário de Pronúncia (obrigatório para nomes recorrentes)
Se um nome próprio aparece em todos os seus vídeos, cadastrar manualmente é exaustivo. Use o 'Dicionário de Pronúncia (Pronunciation Dictionary)' nas configurações.
Basta registrar uma vez e o ElevenLabs aplicará a regra automaticamente para sempre.
🚨 Erro comum (economize seus créditos!)
No campo Alias (Apelido), você pode usar português, mas para siglas em inglês, usar a escrita fonética em inglês costuma ser mais estável. Ex: ElevenLabs → Eleven Labs (ou I-lé-vên-lébs).
※ Ponto de atenção: Não use hífens no campo Alias do Dicionário. Apenas o termo separado por espaços.
O hífen (-) é uma ferramenta de uso exclusivo no campo de texto principal para pausas e separação.
Criamos um guia completo de pronúncia com capturas de tela. Se a pronúncia está falhando, comece por ali!
Vale lembrar: o v3 é muito mais flexível com padrões de números e símbolos (ex: "$22" lido como "vinte e dois dólares"). Porém, para nomes técnicos ou em inglês, o Dicionário é a única forma de garantir 100% de consistência.
⏸️ 3. Controle de pausas e ritmo: A magia da pontuação e do hífen
A pontuação é, surpreendentemente, sua ferramenta mais poderosa. A IA decide onde respirar e quando terminar com base no que você digita.
① Entendendo a duração de cada pontuação
Sinal | Efeito | Duração da pausa |
|---|---|---|
Vírgula , | Pausa curta e continuidade | Curta |
Ponto . | Fim de frase, queda de tom | Média |
Quebra de linha | Troca de parágrafo/Reset | Longa |
Interrogação ? | Entonação ascendente | Média |
Exclamação ! | Tom enfático | Média |
Reticências … | Hesitação/expectativa | Longa (suave) |
Hífen - | Pausa mínima (instantânea) | Muito curta |
② Hífen (-) — O nosso segredo mais valioso
Quando a vírgula parece longa demais, mas sem ela a leitura fica atropelada? O hífen resolve esse 'intervalo incômodo'.
Separação: vinte-e-dois → evita que a IA emende sílabas indevidamente.
Micro-respiração: Bom, então- gera uma transição natural para a próxima frase.
Tensão: Isso-é-realmente- cria um ritmo cadenciado.
📌 Dica para usuários v3: Cuidado com quebras de linha
O v3 tende a ajustar a voz levemente em cada quebra de linha. Se você precisa de consistência total em um texto longo, tente minimizar quebras. Se, pelo contrário, você quer mudar o clima entre cenas, use as quebras a seu favor.
③ Pausas precisas — O método varia por modelo ⚡
Para pausas exatas, como "pare por 1 segundo aqui", o método depende do modelo que você está usando.
Situação | Como pausar | Observação |
|---|---|---|
Modelo v3 | [pause], [short pause], [long pause] | Exclusivo do v3 |
v2 · Turbo · Flash | <break time="1.5s" /> | Não funciona no v3 |
Studio (editor web) | Botão 'Inserir Pausa' | Mais simples, sem digitar nada |
🚨 Erro fatal: Colocar tag <break> no v3
O v3 não suporta a tag SSML <break> e a ignorará. Use [pause] ou reticências/hífen. O inverso também é real: [pause] não funciona em modelos v2. Sempre verifique o modelo selecionado antes!
📋 4. Modelos de prompts práticos (copie e cole)
① Narração Informativa (YouTube)
[curious] Pessoal, vocês sabiam disso?
O que vou ensinar hoje é-realmente simples, mas os resultados são garantidos.
[excited] Então, vamos começar!
▶ Recomendado: Eleven v3
② Diálogo de personagem (Atuação)
[whispers] Não conte para ninguém…
[nervous] Na verdade, eu estava lá naquele dia.
[sighs] Não adianta se arrepender agora.
▶ Recomendado: Eleven v3
③ Propaganda de produtos (15s)
[excited] Só hoje! Este preço é exclusivo para agora.
Dúvida é-perda de tempo.
[calm] Faça a escolha inteligente e confira agora mesmo.▶ Recomendado: Eleven v3
④ Guia de Instruções Calmo
Olá, seja bem-vindo.
A partir de agora, vou te orientar passo a passo na instalação.
Primeiro, pressione e segure o botão liga/desliga por três segundos.▶ Recomendado: Eleven Multilingual v2
❓ FAQ — Perguntas Frequentes
Q. Coloquei a tag [excited] e a IA leu a palavra "excited". Por quê?
Você provavelmente está usando o modelo v2. As tags de áudio são exclusivas do v3.Q. Posso combinar várias etiquetas?
Pode, mas não exagere. O ideal é 1 tag por frase para evitar ruídos.Q. O v3 altera o tom em textos longos. Como evito?
Tente reduzir o número de parágrafos ou, se a estabilidade for prioridade absoluta, use o v2.
🎁 Considerações finais
Tags de emoção ([excited], [laughs]) são exclusivas do v3.
Correção segue a ordem: Escrita fonética → Hífen → Dicionário (sem hífen no Alias).
Pausas: [pause] no v3, <break> no v2/Flash.
O ElevenLabs é uma arte de 'treinamento'. Com os prompts certos, você transforma uma leitura comum em uma atuação profissional.
Copie um dos nossos modelos, insira no seu painel e teste agora. Você vai sentir a diferença instantaneamente!
Até a próxima dica.
De Sonetho ⚡