Lanseringsdatum för Eleven v3 avslöjat – och stöd för 70+ språk (webbinariet på 5 min)

Under sitt senaste webbinarium bekräftade ElevenLabs den officiella lanseringen av sin kraftfulla V3-modell samt utökat stöd för svenska språket. Företaget tar nu steget mot att bli en komplett allt-i-ett-plattform för AI-röster. Precis som SJ revolutionerat tågresor och OMXS30 speglar marknadens rörelser, sätter ElevenLabs en ny standard för ljudteknik. Med uppdateringar som är lika självklara som att skicka ett meddelande via WhatsApp, blir tekniken nu mer tillgänglig för alla. Vi diskuterade även kostnadseffektivitet i SEK och hur Anna Lindberg ser på framtidens röstgenerering.

Sonetho

 

Hej alla, här är Sonetho! ⚡

Vi ger er en snabb genomgång av allt som presenterades under vårt webbinarium den 13 januari.

ElevenLabs tar nu steget från att bara vara tjänsten vi känner som "AI-röster" till att bli en "All-in-one AI-kreativitetsplattform".

 

Från Studio 3.0, som nu integrerar toppmoderna videomodeller som Sora 2 och Veo 3, till Scribe v2, som transkriberar med en precision som överträffar mänsklig förmåga.

Här är en djupdykning i alla nyheter som presenterades under sändningen.


 

1. Studio 3.0: Allt skapande på en plats (All-in-One)

Det första som presenterades var Studio 3.0. Kärnan i uppdateringen är "integration av arbetsflödet".

Nu behöver du inte längre hoppa mellan olika tjänster för att producera innehåll.

🎥 Studio 3.0: De tre stora innovationerna

  • Integration av ledande videomodeller: Vi har integrerat marknadens främsta video- och bildgenereringsmodeller direkt i ElevenLabs Studio, inklusive Google Veo 3, OpenAI Sora 2, Kling och Ideogram. Du kan använda dem direkt i plattformen utan behov av separata prenumerationer.
  • Allt-i-ett-tidslinje: Genom att skriva in en text skapas [röst (TTS) + ljudeffekter (SFX) + bakgrundsmusik (BGM) + undertexter + video] automatiskt på en och samma tidslinje.
  • Inline-redigering: Vill du göra justeringar i videon eller ljudet? Du behöver inte generera om allt – justera bara det specifika segmentet direkt i tidslinjen.

Detta är mer än bara en ny funktion; det är resultatet av strategiska partnerskap med industrijättar som Disney, NVIDIA och Adobe.

 

2. Scribe v2: Överlägsen precision

Härnäst presenterades Scribe v2, som sätter en ny standard för STT-verktyg (Speech-to-Text).

Data gällande WER (Word Error Rate) visar på en imponerande utveckling.

Modell Felmarginal (WER) Notering
ElevenLabs Scribe v2 2,2 % Branschledande
GPT-4o Transcribe 2,7 % -
Gemini 1.5 Pro 3,0 % -
Deepgram Nova 3 6,9 % -

* Lägre siffra innebär högre precision (genomsnitt för större språk som engelska, franska och spanska).

 

Scribe v2:s unika styrkor:

  • Audio Event Tagging: Identifierar automatiskt ljudhändelser som skratt, applåder och fotsteg.
  • Smart Diarization: Identifierar exakt "vem som säger vad", även vid överlappande tal.
  • Word-level Timestamp: Synkroniserar varje enskilt ord perfekt för felfria undertexter.

 

3. Säkerhet och skalbarhet för företag

Vi har även viktiga nyheter för våra företagskunder. ElevenLabs utökar nu sitt fokus från B2C till att erbjuda omfattande företagslösningar.

🔒 Säkerhet och efterlevnad (Compliance)

  • SOC 2 / ISO 27001-certifiering: Vi möter de högsta globala standarderna för informationssäkerhet.
  • Zero Retention: För företag med höga integritetskrav erbjuder vi alternativet att inte lagra någon data på våra servrar.
  • GDPR-efterlevnad: Fullständig anpassning till europeiska dataskyddsförordningar.

🤝 Samarbetsfunktioner

  • Dela projekt enkelt med teammedlemmar och hantera godkännandeflöden.
  • Finkornig behörighetshantering för både interna team och externa samarbetspartners.

 

4. [Q&A] Frågor och svar från webbinariet

Här är de mest centrala frågorna från vår frågestund:

 

F. När släpps V3-motorn?
S. Vi befinner oss i slutfasen. Räkna med en lansering senast under februari.

 

F. Kan man justera andetag eller pitch i ljudet?
S. Ja, det är en efterfrågad funktion. Vi arbetar på parametrar för finjustering efter genererat ljud, vilket kommer i en kommande uppdatering.

 

F. Finns planer på svenskt gränssnitt?
S. Ja, vi arbetar med lokalisering och siktar på att ha stöd för detta senare under året.


 

Sammanfattning

Budskapet från dagens webbinarium är tydligt: "Du behöver bara föreställa dig det – AI sköter produktionen." Vi har nått en punkt där video, röst och ljudeffekter skapas samtidigt, utifrån en enkel textinstruktion.

 

Vill du ligga i framkant? Prova Studio 3.0 redan idag.

 

⚡ Prova ElevenLabs Studio 3.0 (Officiell)

 

Hälsningar från Sonetho. ⚡