
« Un podcast créé avec ma propre voix ? »
La fonctionnalité ambitieuse GenFM d'ElevenLabs vient de recevoir une mise à jour majeure.
Une réponse directe à l'engouement suscité par les « podcasts IA » du service NotebookLM de Google.
ElevenLabs peut-il réellement rivaliser avec Google ?
Le Sonetho a mené un test en toute impartialité.
🎯 Même si c'est encore imparfait, Google ne pourra jamais reproduire « ma propre voix »
GenFM reste encore un cran en dessous de NotebookLM pour le naturel de la conversation, mais « créer un podcast avec ma propre voix (PVC) » est une arme propre à ElevenLabs que Google ne pourra jamais offrir. Si vous l'abordez non pas comme un résultat parfait mais comme un « brouillon », c'est déjà tout à fait utilisable aujourd'hui.
🎵 Créer un brouillon de podcast avec ma propre voix →
Le PVC est aussi accessible en version d'essai sur le plan gratuit · Idéal encore aujourd'hui pour poser la structure d'un script
Bonjour à tous. Ici le Sonetho. ⚡
En ce moment, le sujet qui passionne la communauté IA est sans conteste l'« Audio Overview ».
Le principe est simple : vous soumettez un texte, et deux IA entament une discussion animée pour en résumer le contenu.
Face à la puissance impressionnante de NotebookLM (avec ses réactions bluffantes du type : « Hé, ne me coupe pas la parole ! »),
on attendait avec impatience la riposte du géant de l'audio : ElevenLabs.
Aujourd'hui, je vous livre mon avis honnête après avoir testé l'outil à partir de l'un de mes propres articles de blog.
1. Objectif : transformer mon blog en émission de radio ?
Sur le plan des options de personnalisation, ElevenLabs l'emporte haut la main. Contrairement à Google, il m'est ici possible d'utiliser ma propre voix (PVC - Professional Voice Cloning).
[▼ Accès : Projects → Create a podcast]

J'ai inséré l'URL de mon article comparatif sur « les 3 acteurs du marché » et configuré les rôles de l'hôte et de l'invité sur les profils 'Echo Talk' et 'Modern Insight'.
[▼ Line-up du podcast : David (hôte) et Dan (invité)]

2. Configuration avancée : le rôle du producteur
J'ai ajouté des instructions spécifiques dans la section Advanced Configuration.

« Comparez les trois services, mais soulignez qu'ElevenLabs reste la référence en matière de naturel. Adoptez un ton de revue technologique professionnelle. »
Jusque-là, tout semblait parfait. J'ai lancé la génération avec enthousiasme en cliquant sur le bouton Generate.
3. Résultat : « Hum... il y a quelque chose qui cloche... »
Le résultat a été généré. Jugez plutôt le script produit par l'IA.
[▼ Script et indications générés par l'IA]

🎧 Écouter le résultat réel (GenFM)
(Cliquez sur Play pour écouter le podcast)
Les points forts :
- « Pff... (soupir) » : l'IA insère des didascalies spontanément.
- Le résumé est précis : les points essentiels de mon article sont bien captés.
- Grâce au modèle V3 (Alpha), l'expression des émotions est déjà très convaincante.
Les points faibles (critiques) :
1. Le ton est trop... scolaire !
« C'est ce qu'on peut dire », « Il semble que... »
On est loin du dynamisme de NotebookLM : pas de vraies interruptions, pas de rires partagés, et peu de marqueurs de conversation naturels.
2. Le problème du timing : « Pas de place pour respirer ? »
Ce qui manque le plus, c'est l'espace entre les répliques. Dans une vraie discussion, il y a des silences réflexifs ou des relances. Ici, 0,1 seconde après la fin d'une phrase, l'interlocuteur s'engouffre immédiatement dans la brèche.
C'est probablement un artefact du modèle V3 Alpha qui gère mal les fins de phrases (trailing off). À l'écoute, cela rend le tout très artificiel. 😅
4. Verdict : avantage Google pour l'instant ?
Soyons honnêtes : en termes de « naturel de la conversation », Google NotebookLM garde une longueur d'avance.
GenFM d'ElevenLabs est excellent pour les podcasts informatifs, mais si vous recherchez une discussion vivante, vous risquez d'être déçus.
💡 Comment en tirer le meilleur parti ?
- Utilisez-le pour vos brouillons : C'est un outil imbattable pour poser une structure de script.
- Modification manuelle indispensable : Ajoutez des répliques courtes et dynamiques (ex: « Vraiment ? », « C'est fou ! », « Tu m'étonnes ! ») et la qualité sera décuplée.
En conclusion : on attend la version finale du V3 !
Le nerf de la guerre reste le naturel. Avec la sortie prochaine du modèle V3, je suis convaincu qu'ElevenLabs sera capable de saisir le contexte sans avoir recours aux balises [laugh] ou [sigh], effaçant ainsi cet aspect rigide.
« L'équipe d'ElevenLabs, sortez-nous ce V3 au plus vite, on est impatients ! » 😵💫
Néanmoins, si vous souhaitez créer un brouillon de podcast avec votre propre voix dès aujourd'hui, tentez l'expérience !
La prochaine fois, je reviendrai avec une technique hybride : « Le script Google + La voix ElevenLabs ». Restez à l'écoute !
📂 [Annexe] Téléchargement du résultat original
Écoutez ce dialogue singulier généré par l'IA.