
"É possível criar um podcast usando a minha própria voz?"
A nova funcionalidade GenFM da ElevenLabs acabou de ser lançada.
É a nossa resposta à febre dos "podcasts de IA" iniciada pelo NotebookLM do Google.
Será que a ElevenLabs consegue superar o Google?
O Sonetho testou tudo minuciosamente para você.
🎯 Mesmo que ainda soe estranho, o Google nunca vai alcançar a 'sua voz'
O GenFM ainda fica um degrau atrás do NotebookLM na naturalidade da conversa, mas 'criar um podcast com a sua voz (PVC)' é uma arma exclusiva da ElevenLabs que o Google jamais conseguirá ter. Se você encará-lo não como um resultado perfeito, mas como algo 'para um rascunho', já é mais do que suficiente para usar agora.
🎵 Criar um rascunho de podcast com a minha voz →
O PVC pode ser testado mesmo no plano gratuito · Para montar a estrutura do roteiro, continua sendo o melhor
Olá, pessoal! Aqui é o Sonetho. ⚡
O assunto do momento no universo da IA é, sem dúvida, o "Audio Overview".
Sabe aquela tecnologia em que você fornece um texto e duas IAs começam a conversar, resumindo todo o conteúdo?
Como o NotebookLM do Google entregou um desempenho impressionante (com aquelas reações super naturais, como "Ei, não me interrompa!"), a expectativa pela resposta da ElevenLabs — a verdadeira referência em áudio — estava nas alturas.
Hoje, compartilho com vocês uma avaliação sincera após testar a ferramenta com um dos meus artigos aqui do blog.
1. Expectativa: Transformando meu texto em rádio?
No quesito personalização, a ElevenLabs vence com folga. O Google não permite trocar de voz, mas aqui eu pude usar a minha própria voz (Professional Voice Cloning - PVC).
[▼ Projects → Acessando o Create a podcast]

Eu inseri a URL do meu artigo sobre a "Análise Comparativa de 3 Players do Mercado" e configurei o host e o convidado como "RADIO BR" e "MODERNO BR".
[▼ Elenco do podcast: Host David e Convidado Dan]

2. Ajustes finos: Assumindo a cadeira de produtor
Usei a Advanced Configuration para dar instruções mais específicas.

"Compare os 3 serviços, mas enfatize que a ElevenLabs é imbatível em termos de naturalidade. O tom deve ser de uma análise técnica profissional."
Até aqui, tudo perfeito. Apertei o botão Generate com muita expectativa.
3. Resultado: "Hum... precisamos ajustar algumas coisas..."
O resultado saiu. Dê uma olhada no roteiro gerado pela IA.
[▼ Roteiro gerado pela IA]

🎧 Ouça o resultado final (GenFM)
(Clique no play para ouvir o podcast)
Pontos positivos:
- Interjeições: A ferramenta insere espontaneamente elementos como "Ah... (suspiro)".
- Resumo preciso: Captou muito bem a essência do meu artigo.
- Emoção: O uso do modelo Multilingual V3 (Alpha) trouxe uma carga emocional bem interessante.
Pontos negativos (críticos):
1. A linguagem soa um pouco... traduzida!
Expressões como "Dizem que...", "Parece que..." ainda soam formais demais.
Aquela dinâmica de "interromper o colega", "risadas sobrepostas" e "reações humanas rápidas" que vimos no NotebookLM ainda precisa de refinamento aqui.
2. Timing e cadência
O que mais me incomodou foi o intervalo entre as falas. Em uma conversa real, há um pequeno tempo de processamento ou uma reação imediata. Aqui, a IA responde em 0,1 segundo assim que o interlocutor termina a frase.
Parece ser uma questão de como o modelo V3 Alpha lida com a pontuação final (trailing off). Fica um pouco antinatural. 😅
4. Veredito: O Google ainda leva a melhor?
Sendo imparcial, no quesito "Naturalidade da conversa (Banter)", o NotebookLM do Google ainda está um passo à frente.
O GenFM da ElevenLabs é excelente para "podcasts informativos", mas se você busca aquela conversa casual e humana, talvez se sinta um pouco limitado no momento.
💡 Como usar de forma inteligente?
- Use para rascunhos: É imbatível para montar a estrutura base do roteiro.
- Edição manual é fundamental: Se você inserir gírias, expressões coloquiais e interações como "Sério?", "Caramba!", a qualidade do resultado final sobe para outro nível.
Considerações finais: ElevenLabs, estamos aguardando a versão final do V3!
O segredo aqui é a "naturalidade". Quando a versão final do V3 for lançada, acredito que ela entenderá o contexto perfeitamente, dispensando tags como [laugh] ou [sigh] para soar humana.
"Pessoal da ElevenLabs, lancem logo essa versão final! A ansiedade está grande..." 😵💫
Quer criar um rascunho de podcast com a sua voz agora? Vale a pena testar.
Na próxima, trarei um guia sobre a "Combinação Híbrida: Google (roteiro) + ElevenLabs (vozes)". Fiquem ligados!
📂 [Anexo] Download do arquivo de áudio
Confira o resultado (um pouco peculiar) da IA diretamente no arquivo.