ElevenLabs GenFM का परीक्षण: क्या यह Google NotebookLM को पछाड़ पाएगा? (समीक्षा)

हाल ही में मैंने ElevenLabs GenFM AI पॉडकास्ट टूल का उपयोग किया। यह टूल जटिल जानकारी का सारांश तैयार करने में काफी सटीक है, जो कि Vande Bharat ट्रेन की गति या Sensex के उतार-चढ़ाव जैसी खबरों को समझने के लिए उपयोगी है। हालाँकि, जब बात बातचीत की स्वाभाविकता और मानवीय लहजे की आती है, तो यह Google NotebookLM के स्तर तक नहीं पहुँच पाता। जिस तरह Priya Sharma WhatsApp पर चर्चा करती हैं, वैसा सहज अनुभव यहाँ कम है। अगर आप अपने 'रुपये' खर्च कर रहे हैं, तो अभी NotebookLM का विकल्प अधिक प्रभावी महसूस होता है।

इलेवनलैब्स लैब (Sonetho)

"क्या एआई मेरी अपनी आवाज़ में पॉडकास्ट बना सकता है?"
इलेवनलैब्स (ElevenLabs) का महत्वाकांक्षी GenFM फीचर अब उपलब्ध है।
गूगल के NotebookLM द्वारा शुरू की गई 'एआई पॉडकास्ट' की लहर को अब इलेवनलैब्स ने कड़ी चुनौती दी है।

क्या इलेवनलैब्स वास्तव में गूगल को पछाड़ पाएगा?
इलेवनलैब्स लैब ने इसका निष्पक्ष परीक्षण किया है।

 

🎯 भले ही अभी थोड़ा अटपटा लगे, 'मेरी आवाज़' तक Google नहीं पहुँच सकता

GenFM बातचीत की स्वाभाविकता में अभी NotebookLM से थोड़ा पीछे है, लेकिन 'अपनी आवाज़ (PVC) से पॉडकास्ट बनाना' ऐसी चीज़ है जो Google कभी नहीं कर सकता—यह सिर्फ़ ElevenLabs का ही हथियार है। इसे एक परफेक्ट नतीजे के रूप में नहीं, बल्कि 'ड्राफ्ट के लिए' देखें तो यह अभी भी काफ़ी काम का है।

🎵 अपनी आवाज़ से पॉडकास्ट का ड्राफ्ट बनाकर देखें →

PVC को फ्री प्लान में भी आज़माया जा सकता है · स्क्रिप्ट का ढाँचा तैयार करने के लिए अभी भी सबसे बेहतरीन है

नमस्ते! हम हैं इलेवनलैब्स लैब

आजकल एआई (AI) जगत में सबसे चर्चित विषय 'ऑडियो ओवरव्यू' (Audio Overview) है।

यह एक ऐसी तकनीक है जहाँ आप टेक्स्ट (लिखा हुआ लेख) प्रदान करते हैं और दो एआई पात्र आपस में चर्चा करते हुए उस सामग्री का सारांश प्रस्तुत करते हैं।

 

चूँकि गूगल नोटबुक-एलएम ने बहुत ही प्रभावशाली प्रदर्शन किया है (जैसे कि एक-दूसरे की बात को काटना या स्वाभाविक प्रतिक्रिया देना), इसलिए ऑडियो की दुनिया के दिग्गज इलेवनलैब्स से भी काफी उम्मीदें थीं।

आज मैं अपने ब्लॉग पोस्ट का उपयोग करके इसके परीक्षण का ईमानदार अनुभव आपके साथ साझा कर रहा हूँ।


1. बड़ी उम्मीदें: क्या मेरी आवाज़ रेडियो पर सुनाई देगी?

सबसे पहले, कस्टमाइज़ेशन (Settings) के मामले में इलेवनलैब्स की स्पष्ट बढ़त है। गूगल में आप आवाज़ नियंत्रित नहीं कर सकते, लेकिन यहाँ आप अपनी स्वयं की आवाज़ (PVC - Professional Voice Cloning) का उपयोग कर सकते हैं।

[▼ Projects → Create a podcast में प्रवेश]

पॉडकास्ट बनाएँ

मैंने अपने ब्लॉग के '3 प्रमुख एआई सेवाओं का तुलनात्मक विश्लेषण' लेख का यूआरएल (URL) डाला और होस्ट के रूप में 'Priya Sharma' और गेस्ट के रूप में 'Amit Verma' की आवाज़ों का चयन किया।

 

[▼ पॉडकास्ट लाइनअप: होस्ट Priya, गेस्ट Amit]

पॉडकास्ट सेटिंग्स

2. विस्तृत सेटिंग्स: एक निर्देशक की तरह निर्देश दें

Advanced Configuration (उन्नत विन्यास) में मैंने बहुत ही सटीक निर्देश दिए।

 

"तीनों कंपनियों की तुलना करो, लेकिन इस बात पर जोर दो कि सहजता के मामले में इलेवनलैब्स अग्रणी है। इसे एक पेशेवर टेक रिव्यू की तरह संचालित करें।"

 

यहाँ तक सब कुछ शानदार था। मैंने बड़े उत्साह के साथ Generate बटन दबाया।


3. परिणाम: "हम्म... यह कुछ अधूरा सा है..."

परिणाम सामने है। आइए एआई द्वारा तैयार की गई स्क्रिप्ट पर एक नज़र डालते हैं।

[▼ एआई द्वारा जनरेट की गई स्क्रिप्ट और निर्देश]

जनरेट की गई स्क्रिप्ट

🎧 वास्तविक परिणाम सुनें (GenFM)

(पॉडकास्ट सुनने के लिए प्ले बटन दबाएँ)

विशेषताएँ:

  • "हूँ..." जैसे भावपूर्ण संकेतों को यह स्वतः जोड़ देता है।
  • सामग्री का सारांश सटीक है। इसने लेख के मुख्य बिंदुओं को बहुत स्पष्ट रूप से समझा।
  • V3 (Alpha) मॉडल का उपयोग करने के कारण भावनाओं की अभिव्यक्ति काफी प्रभावशाली है।

 

कमियाँ (गंभीर):

1. बातचीत का लहज़ा थोड़ा किताबी या औपचारिक है।

"जैसा कि उल्लेख किया गया है...", "मेरी राय में..."

नोटबुक-एलएम में दिखने वाली वह 'सहज प्रतिक्रियाएं' और 'बात काटने का अंदाज' यहाँ अभी भी नदारद है।

 

2. "सांस लेने की जगह का अभाव (टाइमिंग की समस्या)"

सबसे बड़ी कमी दो पात्रों के बीच का अंतराल है। जब इंसान संवाद करते हैं, तो वे सोचने के लिए रुकते हैं, लेकिन यहाँ एआई एक वाक्य खत्म होते ही 0.1 सेकंड के भीतर अगला संवाद बोल देता है।

यह V3 Alpha मॉडल के परिष्करण (refinement) की कमी को दर्शाता है। सुनने में यह थोड़ा अस्वाभाविक लगता है। 😅


4. निष्कर्ष: क्या अभी भी गूगल आगे है?

यदि निष्पक्ष होकर कहें, तो 'सहज बातचीत' (Banter) के मामले में गूगल का नोटबुक-एलएम अभी भी एक कदम आगे है।

इलेवनलैब्स का GenFM 'सूचनात्मक पॉडकास्ट' के लिए तो उत्कृष्ट है, लेकिन यदि आप 'अनौपचारिक चर्चा' की तलाश में हैं, तो आपको थोड़ी निराशा हो सकती है।

 

💡 तो इसका उपयोग कैसे करें?

  • प्रारूप (Draft) तैयार करने के लिए: स्क्रिप्ट का ढांचा बनाने के लिए यह सर्वोत्तम है।
  • मैनुअल एडिटिंग अनिवार्य है: स्क्रिप्ट में खुद से "क्या सच में?", "गजब!", "भाई, सुनो..." जैसे बोलचाल के शब्द जोड़ दें, तो गुणवत्ता बहुत बढ़ जाएगी।

अंतिम शब्द: इलेवनलैब्स, हम V3 के फाइनल वर्जन की प्रतीक्षा कर रहे हैं!

अंततः, सब कुछ 'प्राकृतिकता' पर निर्भर करता है। हमें विश्वास है कि जब इलेवनलैब्स का V3 मॉडल आधिकारिक तौर पर लॉन्च होगा, तो यह बिना किसी [laugh] या [sigh] टैग के संदर्भ को समझते हुए इस यांत्रिक लहज़े को पूरी तरह मिटा देगा।

 

"इलेवनलैब्स टीम, कृपया जल्द ही V3 का फाइनल वर्जन लाएँ। अब और इंतज़ार नहीं होता!" 😵‍💫

 

फिर भी, यदि आप अपनी आवाज़ में पॉडकास्ट का ड्राफ्ट बनाना चाहते हैं, तो इसे अभी आज़माएँ।

🚀 इलेवनलैब्स के साथ अपना पॉडकास्ट बनाएँ

अगली बार मैं 'गूगल (स्क्रिप्टिंग) + इलेवनलैब्स (वॉयस) का हाइब्रिड तरीका' साझा करूँगा। जुड़े रहें!

 


📂 [परिशिष्ट] पॉडकास्ट परिणाम की मूल फाइल

एआई द्वारा बनाई गई इस बातचीत को आप स्वयं सुनें।