⚡ Sammanfattning på 3 punkter
• Ingen manuell redigering krävs — AI:n hanterar tonläge, betoning och skådespeleri på en helt annan nivå än i v1.
• Vi har testat att automatiskt dubba "Demon Slayer: Mugen Train" till svenska.
• En ny era är här där kreatörer kan nå ut internationellt med sin egen röst.
Hej alla, här är Sonetho! ⚡
I samband med att vi presenterade nyheten om Dubbing v2 lovade vi att sätta tekniken på prov.
Vi har nu tagit en scen ur Demon Slayer: Mugen Train och dubbat den till svenska med v2.
För att gå rakt på sak… resultatet är helt otroligt. De där sista 2 % som saknades tidigare har inte bara fyllts, de har överträffats.
▲ ElevenLabs Dubbing v2 · Automatisk dubbning (original på japanska → svenska) · Speaker similarity 7
Utmaningarna med v1
Som vi gick igenom i vårt tidigare inlägg om dubbningsmetoder (Clip vs Track vs IVC), såg arbetsflödet under v1-tiden ofta ut så här:
Den automatiska dubbningen synkade ofta dåligt och översättningarna var inkonsekventa, vilket gjorde efterbearbetning obligatorisk.
Vi var tvungna att klippa ut varje ljudsegment manuellt i en studio för att skapa kloner för varje enskild replik.
Detta ledde till att röstkaraktären skiftade mellan scener. Samma karaktär kunde låta som olika personer beroende på klipp.
Eftersom träningsdatan var begränsad till korta klipp, blev resultatet ofta ojämnt och osammanhängande.
Det krävdes oändliga försök för att få ett acceptabelt resultat, och även då kändes dubbningen ofta "stel".
Kort sagt: Det kändes mer som att man kämpade *med* AI:n snarare än att AI:n gjorde jobbet åt en.
v2… levererar utan timmar i studion
Med v2 är vi ärligt talat imponerade.
Vi behövde inte lägga någon tid på manuell redigering, och redan efter en enda körning:
Fångade den originalskådespelarens tonläge och betoning med precision.
Levererade en skådespelarinsats som känns genuin.
Det manuella arbetet med att klippa segment och finjustera kloner är ett minne blott.
Jämfört med v1 är detta ett enormt kliv framåt.
Lyssna själv i videon ovan — den där typiska "AI-känslan" är i princip borta.
En viktig inställning — Speaker similarity
I v2 finns en slider under Advanced-menyn som heter 'Speaker similarity'.
Den styr balansen mellan hur mycket rösten ska "likna originalskådespelaren" kontra hur "naturlig den ska låta på målspråket".
För Demon Slayer-dubbningen använde vi standardvärdet 7 (på en skala från 0 till 10).

▲ Inställt på 7 — naturligt på målspråket med en hint av originalets betoning
Slidern kan dras till ytterligheterna. Vi testade samma scen med 0 och 10, så att du kan jämföra resultaten.
Inställning | Resultat |
|---|---|
0 (Naturligt) | Större dynamik i tonfallet, låter som en professionell röstskådespelare. |
7 (Vår rekommendation) | Balanserat: naturligt + behåller originalets tonfall (rekommenderat intervall 4–7) |
10 (Originaltroget) | Ligger närmast originalet i betoning, |
🔊 Speaker similarity 0 — Mest naturligt

▲ Inställt på 0 — mest naturligt på målspråket
Vi blev förvånade över att 0 faktiskt gav bäst resultat.
Dynamiken i rösten var mycket större, och det lät som om en professionell skådespelare gjort jobbet.
Trots att den "liknar originalet mindre", var den svenska dubbningen betydligt mer levande.
🔊 Speaker similarity 10 — Mest lik originalrösten

▲ Inställt på 10 — följer originalets betoning strikt (kan låta stelt på målspråket)
Vid 10 blev skådespeleriet märkbart stelare.
Eftersom AI:n försöker följa originalets betoning slaviskt, blir det svenska uttalet ibland för platt eller mekaniskt.
🎬 0 vs 10 — Lyssna själv
▲ Jämförelse av samma scen med 0 (naturligt) vs 10 (originaltroget) — hör skillnaden i inlevelse
Visst hörs skillnaden tydligt?
Sammanfattningsvis: Ju lägre värde, desto mer naturligt och levande skådespeleri på målspråket.
Ju högre värde, desto striktare följs originalets tonfall, vilket ibland sker på bekostnad av naturligheten.
För innehåll där känslor är A och O rekommenderar vi lägre värden. För projekt där röstens unika klang är det viktigaste, kan högre värden vara aktuella. Vi rekommenderar att du experimenterar mellan 4 och 7.
En sak till — kontrollera egennamn
Den automatiska översättningen var förvånansvärt bra. Däremot bör du alltid dubbelkolla egennamn.
I Demon Slayer kallas 'Oni (鬼)' för 'Demoner' i den officiella översättningen.
Men den automatiska översättningen valde ibland att använda 'Troll' i vissa sammanhang. 😅
Det är små saker, men för fans gör det stor skillnad. Så trots kraften i v2 är en snabb genomläsning och korrigering av egennamn fortfarande en viktig mänsklig uppgift.
💡 Notera: v2 befinner sig i Alpha-stadiet, så vissa funktioner i Dubbing Studio är ännu inte fullt aktiverade.
Efter den officiella lanseringen kommer du att kunna redigera översättningarna direkt i studion.
En total förändring av dubbningsmarknaden
Att kunna uppnå denna kvalitet med några få klick är inte bara en vanlig uppdatering.
Dubbningsbranschen står inför en stor omställning. Skillnaden i kostnad och tidsåtgång mot traditionella metoder är enorm.
För kreatörer är detta fantastiska nyheter.
Du behöver inte längre anlita externa röstskådespelare för enklare projekt — du kan nå ut internationellt med din egen röst.
Om du bygger en global kanal eller flerspråkigt innehåll, har v2 gått från att vara "något att testa" till ett verktyg du inte vill vara utan.
Vill du prova själv?
Just nu ingår 30 minuter gratis dubbning (för Creator-plan och uppåt, 15 min för Starter, 1 min för Free) under de första 7 dagarna. Detta räcker gott för att testa resultatet på en scen likt den vi visade ovan.
※ Länken är en officiell affiliate-länk från Sonetho (ingen extra kostnad för dig).
📚 Mer läsning
ElevenLabs Dubbing v2 är här! — 90+ språk, dubbning som behåller originalets inlevelse
Tillkännagivande · Officiell sammanfattning av v2
Dubba animationer med hög synk: 3 metoder för kloning (Clip vs Track vs IVC)
ElevenLabs-tips · Jämförelse med v1-metoder
Den ultimata guiden för ElevenLabs Dubbing: Så översätter och dubbar du videor (v1)
ElevenLabs-tips · Arbetsflöde för v1
🚀 Avslutningsvis
Den "stela AI-känslan" från v1-tiden har minskat drastiskt i v2.
Visst krävs fortfarande mänsklig kontroll för saker som egennamn, men gränsen för vad som är möjligt har flyttats fram rejält.
Nu är det dags att ta din kanal över gränserna — med din egen röst!
Lycka till med skapandet!
Sonetho ⚡