
“用我的声音制作播客?”
ElevenLabs 的重磅功能 GenFM 现已更新。
面对 Google NotebookLM 掀起的“AI 播客”热潮,ElevenLabs 这次发起了正面反击。
ElevenLabs 究竟能否超越 Google?
Sonetho进行了深度测评,带你一探究竟。
🎯 即使还不够自然,"我的声音"也是谷歌追不上的
GenFM 在对话的自然度上目前还略逊 NotebookLM 一筹,但"用我自己的声音(PVC)制作播客"是谷歌绝对做不到的、ElevenLabs 独有的武器。如果不追求完美的成品,而是把它当作"初稿"来用,那么现在也已经足够好用了。
PVC 在免费套餐中也可体验 · 搭建脚本框架它现在依然是最佳之选
大家好,这里是 Sonetho。 ⚡
最近 AI 圈最火的话题,莫过于“音频概览 (Audio Overview)”了。
只要喂给它一段文本,两个 AI 就能模拟真人聊天,把内容总结得头头是道。
鉴于 Google NotebookLM 的表现实在太过惊艳(那种“哎呀,别打断我!”的真实互动感),
作为音频领域的领头羊,ElevenLabs 的回应自然备受期待。
今天,我直接把自己博客的文章丢进去实测了一番,以下是最真实的深度测评,毫无保留地分享给大家。
1. 期待满满:用我的声音做电台?
首先,自定义功能绝对是 ElevenLabs 的碾压级优势。Google 无法更换音色,但在 ElevenLabs,你可以使用你自己的声音 (PVC)。
[▼ 进入 Projects → Create a podcast]

我输入了我的博客中“三家产品对比深度分析(第11期)”的 URL,并将主持人设为 'KKC RADIO',嘉宾设为 'KKC Modern'。
[▼ 播客阵容:主持人 David (原 KKC RADIO),嘉宾 Dan (原 KKC Modern)]

2. 细节配置:化身制作人(PD)进行指令微调
我在 Advanced Configuration 中添加了具体的要求。

“在对比三家产品时,请重点强调 ElevenLabs 在自然度方面的领先优势。请使用专业科技测评的口吻进行讲解。”
一切就绪,我喊了一句“ElevenLabs 冲啊!”,随即按下了 Generate 按钮。
3. 结果公布:“嗯……这稍微有点……”
结果出来了,先来看看 AI 生成的逐字稿。
[▼ AI 生成的剧本与指令]

🎧 试听最终成品 (GenFM)
(点击播放按钮即可聆听播客)
优点:
- “哈……(叹气声)”之类的语气词能自动插入。
- 内容概括非常精准,准确捕捉了我文章的核心逻辑。
- 得益于 V3 (Alpha) 模型,情感表达表现不俗。
缺点(致命伤):
1. 文案语气太“翻译腔”了……!
诸如“据说如此”、“感觉好像是这样”之类的表达过于书面。
并没有像 NotebookLM 那种“互相打断”、“重叠大笑”、“真实附和”的沉浸感。
2. “完全没有喘息空间?(时机问题)”
最让人遗憾的是对话之间的间隙。人类交谈时需要思考的停顿或适时附和,但 AI 往往在对方话音刚落的 0.1 秒内就立刻接话。
这可能是因为 V3 Alpha 模型的句尾处理(Trailing off)还不够自然,听久了会感到非常僵硬。😅
4. 总结:目前还是 Google 略胜一筹?
客观评价,在“对话的自然度 (Banter)”层面,Google NotebookLM 目前确实高出一筹。
ElevenLabs 的 GenFM 对于制作“信息传递型播客”来说非常出色,但如果你追求的是“极致真实的闲聊感”,现阶段可能会有些失望。
💡 那现阶段该如何使用?
- 作为草稿:它是梳理播客剧本逻辑的最佳工具。
- 必须手动润色:在 AI 生成的剧本基础上,手动加入口语化的反馈,比如“真的吗?”、“太牛了!”等互动,整体质感会瞬间提升。
结尾:ElevenLabs,我只期待 V3 正式版!
归根结底,关键在于“自然度”。我相信随着 ElevenLabs 目前正在开发的 V3 模型正式上线,即便没有 [laugh] 或 [sigh] 标签,它也能通过理解上下文来优化这些衔接问题。
“ElevenLabs 的工程师们,赶紧发布 V3 正式版吧,我等得头晕眼花了……” 😵💫
不过,如果你想体验一下用自己的声音制作播客草稿,现在就可以亲自试试。
下期我将带来弥补这些遗憾的“Google (剧本) + ElevenLabs (声音) 混搭大法”,敬请期待!
📂 [附录] 播客源文件下载
AI 制作的“尴尬”对话,下载文件亲自体验一下吧。