
"Bikin podcast pakai suara sendiri? Bisa banget!"
Fitur ambisius terbaru dari ElevenLabs, GenFM, kini telah dirilis.
Fitur ini hadir untuk menantang tren 'AI Podcast' yang sedang naik daun berkat NotebookLM dari Google.
Kira-kira, bisakah ElevenLabs mengungguli Google?
Sonetho telah mengujinya secara objektif untuk Anda.
🎯 Meski masih terasa canggung, 'suara saya' tidak bisa ditiru Google
GenFM memang masih kalah selangkah dari NotebookLM dalam hal kealamian percakapan, tetapi 'membuat podcast dengan suara saya (PVC)' adalah senjata khas ElevenLabs yang tak akan pernah bisa dilakukan Google. Kalau pendekatannya bukan untuk hasil yang sempurna melainkan untuk 'draf', sekarang pun sudah cukup layak dipakai.
🎵 Coba buat draf podcast dengan suara saya →
PVC bisa dicoba bahkan di paket gratis · Untuk menyusun kerangka naskah pun masih yang terbaik sekarang
Halo semuanya. Selamat datang di Sonetho. ⚡
Topik yang sedang hangat di dunia AI saat ini tak lain adalah 'Audio Overview'.
Teknologi ini memungkinkan dua AI untuk berbincang layaknya manusia dan merangkum sebuah konten hanya dari teks yang Anda berikan.
Mengingat NotebookLM dari Google menampilkan performa yang sangat impresif (terutama respons alaminya seperti "Eh, jangan potong pembicaraanku!"),
banyak yang penasaran dengan langkah balasan dari ElevenLabs sebagai pemain utama di dunia audio.
Hari ini, saya akan membagikan ulasan jujur setelah mencoba fitur ini menggunakan tulisan blog saya sendiri tanpa filter.
1. Ekspektasi Tinggi: Bikin Podcast dengan Suara Sendiri?
Untuk urusan pengaturan, ElevenLabs jelas unggul. Google tidak mengizinkan kita mengganti suara, tetapi di sini, Anda bisa menggunakan suara Anda sendiri (Professional Voice Cloning/PVC).
[▼ Masuk ke menu Projects → Create a podcast]

Saya memasukkan URL tulisan 'Analisis Perbandingan 3 Perusahaan (11)' dari blog saya, dan mengatur host serta tamunya sebagai 'Host A' dan 'Host B'.
[▼ Lineup Podcast: Konfigurasi Host]

2. Konfigurasi Detail: Menjadi Produser Anda Sendiri
Saya juga memberikan instruksi spesifik di bagian Advanced Configuration.

"Bandingkan ketiga perusahaan ini, namun tekankan bahwa ElevenLabs adalah yang paling alami. Sajikan seperti ulasan teknologi yang profesional."
Sejauh ini semuanya terasa menjanjikan. Saya menekan tombol Generate dengan penuh antusias!
3. Hasil Akhir: "Hmm... rasanya ada yang kurang..."
Hasilnya sudah keluar. Mari kita lihat naskah yang disusun oleh AI.
[▼ Naskah dan petunjuk panggung hasil AI]

🎧 Dengarkan hasilnya (GenFM)
(Tekan tombol play untuk mendengarkan podcast)
Kelebihan:
- AI mampu memasukkan instruksi seperti "(menghela napas)" secara otomatis.
- Rangkuman konten sangat akurat. AI memahami poin penting dari tulisan saya dengan baik.
- Menggunakan model V3 (Alpha), ekspresi emosinya cukup memuaskan.
Kekurangan (Cukup signifikan):
1. Gaya bahasa naskahnya terasa... seperti terjemahan kaku!
Penggunaan kata penghubung terasa monoton. Saya tidak menemukan 'interupsi', 'tawa yang menimpa', atau 'respons spontan' yang benar-benar natural layaknya NotebookLM.
2. Masalah Timing (Jeda antar percakapan)
Hal yang paling disayangkan adalah jeda antar dialog. Saat manusia berbincang, ada jeda untuk berpikir atau memberi ruang, tapi AI ini langsung masuk 0,1 detik setelah kalimat berakhir.
Sepertinya ini terjadi karena penanganan akhir kalimat (trailing off) pada model V3 Alpha belum sempurna. Jika didengarkan terus-menerus, terdengar kurang organik. 😅
4. Kesimpulan: Apakah Google Masih Unggul?
Secara objektif, untuk urusan 'kealamian percakapan (banter)', Google NotebookLM masih selangkah lebih maju.
GenFM dari ElevenLabs sangat ideal untuk 'podcast informatif', namun jika Anda mengharapkan 'obrolan santai yang hidup', Anda mungkin akan sedikit kecewa.
💡 Jadi, bagaimana cara terbaik menggunakannya?
- Gunakan untuk draf: Sangat efektif untuk membangun kerangka naskah podcast.
- Wajib edit manual: Tambahkan bahasa percakapan sehari-hari agar chemistry antar host lebih terasa.
Penutup: Kami menantikan versi final V3!
Intinya adalah 'kealamian'. Saat model V3 yang sedang disiapkan ElevenLabs resmi dirilis, saya yakin AI akan mampu memahami konteks dengan lebih luwes tanpa perlu banyak bantuan tag seperti [laugh] atau [sigh].
"Tim ElevenLabs, tolong segera rilis versi final V3! Kami tidak sabar menunggu peningkatan kualitasnya..." 😵💫
Namun, jika Anda ingin mulai membuat draf podcast dengan suara Anda sendiri, jangan ragu untuk mencobanya sekarang.
Di artikel berikutnya, saya akan membagikan 'Metode Hybrid: Google (Naskah) + ElevenLabs (Suara)' untuk mengatasi kekurangan ini. Nantikan ya!
📂 [Lampiran] Unduh Hasil Podcast
Coba dengarkan percakapan "canggung" hasil buatan AI secara langsung.