
Halo semuanya, ini Sonetho! ⚡
Kami hadir untuk memberikan rangkuman kilat dari webinar ElevenLabs yang berlangsung pada 13 Januari lalu.
ElevenLabs kini bersiap untuk melangkah lebih jauh; bukan sekadar layanan 'pengisi suara AI' yang kita kenal selama ini, melainkan bertransformasi menjadi 'Platform Kreatif AI All-in-One'.
Mulai dari Studio 3.0 yang mengintegrasikan model video kelas dunia seperti Sora 2 dan Veo 3, hingga Scribe v2 yang akurasinya melampaui kemampuan pendengaran manusia.
Kami akan membedah secara mendalam setiap detail yang diungkapkan dalam webinar tersebut untuk Anda.
1. Studio 3.0: Solusi Kreasi dalam Satu Tempat (All-in-One)
Hal pertama yang diperkenalkan adalah Studio 3.0. Inti dari pembaruan ini adalah "Integrasi Alur Kerja (Workflow)".
Kini, Anda tidak perlu lagi berpindah-pindah antar aplikasi hanya untuk menyelesaikan satu konten video.
🎥 3 Inovasi Utama Studio 3.0
- Integrasi Model Video Terkemuka: Kini, model generator video/gambar terbaik seperti Google Veo 3, OpenAI Sora 2, Kling, dan Ideogram telah terintegrasi di dalam ElevenLabs Studio. Anda dapat langsung menggunakannya tanpa perlu berlangganan alat eksternal secara terpisah.
- Timeline All-in-One: Cukup masukkan teks, maka elemen [Voice(TTS) + Efek Suara(SFX) + Musik Latar(BGM) + Subtitle + Video] akan otomatis tercipta dalam satu lini masa (timeline).
- Penyuntingan Inline (Inline Editing): Ada bagian video atau audio yang kurang pas? Anda tidak perlu membuat ulang semuanya; cukup tarik (drag) dan sesuaikan bagian tersebut langsung di timeline.
Ini bukan sekadar penambahan fitur biasa, melainkan hasil dari kemitraan strategis yang dijalin dengan Disney, NVIDIA, dan Adobe.
2. Scribe v2: Akurasi yang Tak Tertandingi
Selanjutnya, Scribe v2 diperkenalkan dengan performa yang melampaui standar alat STT (Speech-to-Text) pada umumnya.
Data Tingkat Kesalahan (WER - Word Error Rate) yang dipaparkan pun sangat impresif.
| Nama Model | Tingkat Kesalahan (WER) | Catatan |
|---|---|---|
| ElevenLabs Scribe v2 | 2.2% | Peringkat 1 |
| GPT-4o Transcribe | 2.7% | - |
| Gemini 1.5 Pro | 3.0% | - |
| Deepgram Nova 3 | 6.9% | - |
* Semakin rendah angka, semakin akurat (Rata-rata bahasa utama seperti Inggris/Prancis/Spanyol)
Fitur Unggulan Scribe v2:
- Audio Event Tagging: Mendeteksi suara tawa, tepuk tangan, hingga langkah kaki dan mengubahnya menjadi label teks.
- Smart Diarization: Mampu membedakan "siapa yang berbicara" dengan presisi, bahkan saat ada pembicara yang tumpang tindih.
- Word-level Timestamp: Menangkap waktu per kata untuk sinkronisasi subtitle yang sempurna.
3. Keamanan dan Skalabilitas untuk Enterprise
Bagi para pengambil keputusan di perusahaan, ElevenLabs kini telah berevolusi menjadi solusi Enterprise yang tangguh.
🔒 Keamanan dan Kepatuhan (Security)
- Sertifikasi SOC 2 / ISO 27001: Memenuhi standar sertifikasi perlindungan informasi tingkat global tertinggi.
- Zero Retention: Menyediakan opsi bagi perusahaan agar data tidak disimpan di server kami jika diinginkan.
- Kepatuhan GDPR: Sepenuhnya mematuhi regulasi perlindungan data Eropa.
🤝 Fitur Kolaborasi
- Dukungan proses berbagi proyek dan alur persetujuan antar anggota tim.
- Manajemen hak akses yang detail untuk tim internal maupun agensi pihak ketiga.
4. [Q&A] Sesi Tanya Jawab Webinar
Berikut adalah rangkuman dari beberapa pertanyaan penting yang muncul dalam sesi tanya jawab:
Q. Kapan mesin V3 akan dirilis?
A. Saat ini sedang dalam tahap akhir pengembangan. Anda dapat menikmatinya pada akhir Januari atau paling lambat Februari mendatang.
Q. Bisakah kita menyesuaikan napas atau pitch pada audio?
A. Ya, ini adalah fitur yang banyak diminta. Kami sedang meneliti parameter untuk fine-tuning (penyesuaian halus) setelah audio dibuat, dan fitur ini akan segera diperbarui.
Q. Bagaimana dengan rencana dukungan bahasa Indonesia pada antarmuka (UI)?
A. Ya, kami sedang mempersiapkannya tahun ini agar Anda tidak perlu lagi bergantung pada alat bantu terjemahan pihak ketiga!
Kesimpulan: Imajinasi Menjadi Realitas
Pesan dari webinar hari ini sangat jelas: "Cukup bayangkan, AI yang akan mengeksekusinya."
Era di mana satu baris teks dapat menciptakan video, suara, dan musik berkualitas tinggi telah tiba.
Jika Anda ingin menjadi yang terdepan dalam gelombang perubahan ini, segera coba Studio 3.0 sekarang juga.
Salam hangat, Sonetho. ⚡