
Hej alla, här är Sonetho! ⚡
Vi ger er en snabb genomgång av allt som presenterades under vårt webbinarium den 13 januari.
ElevenLabs tar nu steget från att bara vara tjänsten vi känner som "AI-röster" till att bli en "All-in-one AI-kreativitetsplattform".
Från Studio 3.0, som nu integrerar toppmoderna videomodeller som Sora 2 och Veo 3, till Scribe v2, som transkriberar med en precision som överträffar mänsklig förmåga.
Här är en djupdykning i alla nyheter som presenterades under sändningen.
1. Studio 3.0: Allt skapande på en plats (All-in-One)
Det första som presenterades var Studio 3.0. Kärnan i uppdateringen är "integration av arbetsflödet".
Nu behöver du inte längre hoppa mellan olika tjänster för att producera innehåll.
🎥 Studio 3.0: De tre stora innovationerna
- Integration av ledande videomodeller: Vi har integrerat marknadens främsta video- och bildgenereringsmodeller direkt i ElevenLabs Studio, inklusive Google Veo 3, OpenAI Sora 2, Kling och Ideogram. Du kan använda dem direkt i plattformen utan behov av separata prenumerationer.
- Allt-i-ett-tidslinje: Genom att skriva in en text skapas [röst (TTS) + ljudeffekter (SFX) + bakgrundsmusik (BGM) + undertexter + video] automatiskt på en och samma tidslinje.
- Inline-redigering: Vill du göra justeringar i videon eller ljudet? Du behöver inte generera om allt – justera bara det specifika segmentet direkt i tidslinjen.
Detta är mer än bara en ny funktion; det är resultatet av strategiska partnerskap med industrijättar som Disney, NVIDIA och Adobe.
2. Scribe v2: Överlägsen precision
Härnäst presenterades Scribe v2, som sätter en ny standard för STT-verktyg (Speech-to-Text).
Data gällande WER (Word Error Rate) visar på en imponerande utveckling.
| Modell | Felmarginal (WER) | Notering |
|---|---|---|
| ElevenLabs Scribe v2 | 2,2 % | Branschledande |
| GPT-4o Transcribe | 2,7 % | - |
| Gemini 1.5 Pro | 3,0 % | - |
| Deepgram Nova 3 | 6,9 % | - |
* Lägre siffra innebär högre precision (genomsnitt för större språk som engelska, franska och spanska).
Scribe v2:s unika styrkor:
- Audio Event Tagging: Identifierar automatiskt ljudhändelser som skratt, applåder och fotsteg.
- Smart Diarization: Identifierar exakt "vem som säger vad", även vid överlappande tal.
- Word-level Timestamp: Synkroniserar varje enskilt ord perfekt för felfria undertexter.
3. Säkerhet och skalbarhet för företag
Vi har även viktiga nyheter för våra företagskunder. ElevenLabs utökar nu sitt fokus från B2C till att erbjuda omfattande företagslösningar.
🔒 Säkerhet och efterlevnad (Compliance)
- SOC 2 / ISO 27001-certifiering: Vi möter de högsta globala standarderna för informationssäkerhet.
- Zero Retention: För företag med höga integritetskrav erbjuder vi alternativet att inte lagra någon data på våra servrar.
- GDPR-efterlevnad: Fullständig anpassning till europeiska dataskyddsförordningar.
🤝 Samarbetsfunktioner
- Dela projekt enkelt med teammedlemmar och hantera godkännandeflöden.
- Finkornig behörighetshantering för både interna team och externa samarbetspartners.
4. [Q&A] Frågor och svar från webbinariet
Här är de mest centrala frågorna från vår frågestund:
F. När släpps V3-motorn?
S. Vi befinner oss i slutfasen. Räkna med en lansering senast under februari.
F. Kan man justera andetag eller pitch i ljudet?
S. Ja, det är en efterfrågad funktion. Vi arbetar på parametrar för finjustering efter genererat ljud, vilket kommer i en kommande uppdatering.
F. Finns planer på svenskt gränssnitt?
S. Ja, vi arbetar med lokalisering och siktar på att ha stöd för detta senare under året.
Sammanfattning
Budskapet från dagens webbinarium är tydligt: "Du behöver bara föreställa dig det – AI sköter produktionen." Vi har nått en punkt där video, röst och ljudeffekter skapas samtidigt, utifrån en enkel textinstruktion.
Vill du ligga i framkant? Prova Studio 3.0 redan idag.
Hälsningar från Sonetho. ⚡