
"Czy mój własny głos sprawdzi się w podcaście?"
Funkcja GenFM od ElevenLabs doczekała się znaczącej aktualizacji.
To nasza odpowiedź na trend "podcastów AI", spopularyzowany przez narzędzie NotebookLM od Google.
Czy ElevenLabs zdoła wyprzedzić Google?
Sonetho przetestowało tę nowość bez taryfy ulgowej.
🎯 Nawet jeśli na razie brzmi to niezgrabnie, Google nie dogoni "mojego głosu"
GenFM wciąż ustępuje NotebookLM pod względem naturalności rozmowy, ale tworzenie podcastu "moim głosem (PVC)" to coś, czego Google nigdy nie potrafi, i jest to wyłączna broń ElevenLabs. Jeśli podejdziesz do tego nie jak do gotowego efektu, lecz jak do "wersji roboczej", już teraz jest to w pełni użyteczne.
🎵 Stwórz roboczą wersję podcastu moim głosem →
PVC można wypróbować nawet w planie darmowym · Do naszkicowania szkieletu scenariusza nadal jest najlepsze
Cześć! Tu Sonetho. ⚡
W świecie AI mówi się ostatnio głównie o jednym: "Audio Overview".
To technologia, w której przesyłasz tekst, a dwójka AI prowadzi na jego temat ożywioną dyskusję, wyciągając najważniejsze wnioski.
NotebookLM od Google wykonało kawał solidnej roboty (te wtrącenia typu: "Hej, nie przerywaj mi!" brzmią niesamowicie realistycznie), więc oczekiwania wobec lidera branży audio – ElevenLabs – były ogromne.
Dziś dzielę się szczerą recenzją po tym, jak przepuściłem wpis z mojego bloga przez to narzędzie.
1. Wielkie nadzieje: Czy to radio z własnym głosem?
W kwestii konfiguracji ElevenLabs nie ma sobie równych. O ile w Google nie masz wpływu na dobór głosów, tutaj możesz użyć swojego sklonowanego głosu (PVC - Professional Voice Cloning).
[▼ Projects → Create a podcast]

Wkleiłem link do mojego wpisu o analizie porównawczej trzech technologii, a jako prowadzących wybrałem głosy 'KKC RADIO' i 'KKC Modern'.
[▼ Skład podcastu: Host David (dawniej KKC RADIO), Gość Dan (dawniej KKC Modern)]

2. Detale: Reżyserka w moich rękach
W zakładce Advanced Configuration mogłem sprecyzować wytyczne dla prowadzących.

"Porównaj te trzy rozwiązania, podkreślając, że ElevenLabs oferuje najbardziej naturalne brzmienie. Prowadź audycję w stylu profesjonalnego przeglądu technologicznego."
Do tego momentu wszystko wyglądało świetnie. Nacisnąłem przycisk Generate.
3. Werdykt: "Hmm... trochę sztywno..."
Oto efekt końcowy. Spójrzcie na scenariusz wygenerowany przez AI.
[▼ Wygenerowany skrypt i wskazówki]

🎧 Posłuchaj wyniku (GenFM)
(Naciśnij play, aby odsłuchać podcast)
Zalety:
- "Ach... (wzdycha)" – AI samodzielnie wstawia naturalne pauzy i dźwięki.
- Streszczenie jest merytorycznie bardzo trafne.
- Dzięki modelowi V3 (Alpha) ekspresja głosów wypada całkiem nieźle.
Wady (niestety istotne):
1. Brzmi jak... wykład!
"Tak więc, w podsumowaniu...", "Można by rzec, że..."
Brak tego luzu znanego z NotebookLM, gdzie prowadzący wchodzą sobie w słowo, śmieją się czy dorzucają krótkie "Dokładnie!".
2. Problem z timingiem (brak oddechu)
Największym minusem są pauzy. W prawdziwej rozmowie potrzebujemy chwili na zastanowienie. Tutaj AI wchodzi z kolejną kwestią 0,1 sekundy po zakończeniu poprzedniego zdania.
Wygląda na to, że model V3 Alpha nie radzi sobie jeszcze idealnie z płynnym wygaszaniem zdań (trailing off). Brzmi to momentami mało przekonująco. 😅
4. Podsumowanie: Czy Google wygrywa?
Szczerze mówiąc, jeśli chodzi o "naturalną chemię w rozmowie", NotebookLM od Google wciąż ma przewagę.
ElevenLabs GenFM to doskonałe narzędzie do podcastów informacyjnych, ale jeśli liczysz na żywiołową dyskusję, możesz poczuć lekki niedosyt.
💡 Jak z tego korzystać efektywnie?
- Używaj jako szkicu: To świetna baza do stworzenia własnego scenariusza.
- Edytuj skrypt ręcznie: Dodaj wtrącenia typu "serio?", "wow!", "hm" – to natychmiast poprawi dynamikę rozmowy.
Zakończenie: Czekamy na stabilną wersję V3!
Wszystko rozbija się o naturalność. Wierzę, że gdy model V3 wyjdzie z fazy testów, lepiej zrozumie kontekst bez konieczności ręcznego dodawania tagów typu [laugh] czy [sigh] i naprawi tę sztywność.
"Ekipo ElevenLabs, czekamy na finalną wersję V3 z niecierpliwością!" 😵💫
Niemniej jednak, jeśli chcesz wygenerować pierwszy szkic podcastu własnym głosem, koniecznie wypróbuj tę funkcję już dziś.
W kolejnym wpisie pokażę Wam "Metodę hybrydową: Scenariusz z Google + Głosy z ElevenLabs". Będzie ciekawie!
📂 [Dodatek] Pobierz wynik podcastu
Posłuchaj pliku wygenerowanego przez nasze AI.