Ultimat guide till ElevenLabs-prompter: Bemästra röstgenerering från v3-taggar till pauser

Vill du skapa perfekt ljud med ElevenLabs? Denna guide ger dig en komplett genomgång av avancerad prompt-teknik. Lär dig använda v3-taggar för känslor och ljudeffekter, korrigera uttal, samt kontrollera pauser med skiljetecken och break-taggar. Vi delar även färdiga prompt-mallar för YouTube, karaktärsröster och reklam. Optimera din text-till-tal för professionella resultat och upptäck hemligheterna bakom naturligt och engagerande ljud.

"Varför låter samma manus så olika från igår till idag?"

Det är en utmaning som de flesta ElevenLabs-användare stöter på förr eller senare.
Sanningen är att 80 % av skillnaden ligger i hur du formulerar din prompt.

Hej från Sonetho

Hos ElevenLabs är en 'prompt' ingen komplicerad term – det är helt enkelt texten du matar in för att konvertera till tal.
Men nyckeln till framgång är att förstå att texten är mer än bara ord i en följd.

 

Samma mening, som "Det är verkligen fantastiskt", kan låta intetsägande om den läses rakt upp och ner.
Men lägger du till en liten känslo-tagg blir det plötsligt en engagerad och överraskad röst.
En siffra, ett skiljetecken eller ett bindestreck kan förändra slutresultatet dramatiskt.

 

Efter att ha finjusterat ElevenLabs dagligen i snart tre år,
ska vi idag gå på djupet med hur man skriver effektiva prompter.
Vi täcker allt från ljudtaggar i v3, uttalshjälp och pausering, till färdiga mallar du kan kopiera direkt. Läs hela vägen till slutet!

 


📌 Först: Prompter fungerar olika beroende på modell

Innan vi sätter igång måste vi klargöra en viktig detalj.
De 'ljudtaggar (audio tags)' vi går igenom här – alltså kommandon inom hakparenteser som [excited] eller [laughs]fungerar endast i Eleven v3-modellen.

 

Vad händer om du använder dessa taggar i v2 (Multilingual v2)?
Modellen kommer inte att "agera" på dem. Istället tolkar den taggarna som vanlig text, vilket innebär att den läser upp dem som ord eller ignorerar dem helt. 😅
(Vi har jämfört v2 och v3 med identiska meningar – du kan lyssna på resultaten i vår guide Eleven v3 vs v2: En svensk jämförelse.)

 

Snabb sammanfattning
För känslo- och effekt-taggar → Använd v3
För långt innehåll + röstkonsekvens → Använd v2 (för att undvika v3-modellens tendens att variera tonläge mellan stycken)
Uttalskorrigering och pausering (bindestreck) → Fungerar i både v2 och v3

Vill du fördjupa dig i modellernas styrkor? Kolla in artikeln Erfarenheter: v2 vs v3.

 


🎭 1. Totalguide till v3-ljudtaggar (känslor & effekter)

Ljudtaggar är kommandon inom hakparenteser [ ] där du anger på engelska hur rösten ska låta.
I praktiken märker vi att om du placerar dem före en mening sätter de tonen för hela meningen, och placerar du dem mitt i triggar de en omedelbar effekt (som skratt eller en suck).
(Det finns inga absoluta regler, men detta ger oftast mest naturliga resultat.)

 

Kom ihåg dessa två viktiga punkter:

  • Skriv taggarna på engelska. (Taggen [whispers] fungerar betydligt bättre än att försöka skriva [viskning].)

  • Taggarna läses inte upp som ljud. Det är instruktioner för hur det ska låta, inte ord som ska sägas högt.
    (Detta gäller specifikt för v3.)

 

① Känslo-taggar (fungerar bäst i början av meningen)

Tagg

Effekt

Användning

[excited]

Entusiastisk/glad

Eventinbjudan, produktlansering

[sad]

Nedstämd/sorgsen

Berättande, emotionella historier

[angry]

Arg/upprörd

Karaktärsdialog, dramatik

[whispers]

Viskande

Hemligheter, ASMR, spänning

[sarcastic]

Sarkastisk/ironisk

Humor, karaktärsdrag

[curious]

Nyfiken

Frågande berättarröst

[nervous]

Nervös/darrig

Spända situationer

[calm]

Lugn och stabil

Meditation, guider

 

Exempel på inmatning (v3):

[excited] Hej allihopa, nu är vår nya produkt äntligen här!
[whispers] Och förresten, vi har ett hemligt erbjudande just idag.

👉 Den första meningen får energi, medan den andra sänker rösten till en viskning.
Att kunna växla tonläge inom samma manus är den stora styrkan med v3.

 

② Effekt-taggar (icke-verbala ljud, placeras ofta mitt i)

Dessa skapar faktiska ljud snarare än enbart ett tonläge, såsom skratt, suckar eller harklingar.

Tagg

Ljud

Placering

[laughs]

Skratt

Mitten eller slutet

[chuckles]

Småskratt

Mitten eller slutet

[sighs]

Suck

Början eller mitten

[gasps]

Hämtar andan (överraskad)

Början

[clears throat]

Harkling

Början

[exhales]

Utandning

Mitten eller slutet

 

Exempel på inmatning (v3):

Åh, jag glömde bort det igen. [sighs] Jag får väl börja om från början.
Det var igår jag gjorde det där… [laughs] vilket otroligt misstag.

 

📌 Redaktionens tips: "Less is more" ⚡
Du kan kombinera flera taggar, men överanvändning i en och samma mening kan göra rösten instabil eller leda till att de ignoreras.
Vår rekommendation: max en tagg per mening för ett naturligt resultat.

 


🔤 2. Uttalskorrigering: När AI:n uttalar namn eller siffror fel

Även den bästa prompten fallerar om AI:n uttalar ett namn som "ElevenLabs" på ett märkligt sätt. 😭
Uttalsproblem kräver en annan lösning än känslo-taggar.

 

Här är tre sätt att fixa det:

① Fonetisk stavning (snabbaste lösningen)

Skriv ordet så som det faktiskt uttalas.

  • ChatGPTTjatt-G-P-T

  • APIA-P-I

  • 2026tjugotjugosex (om modellen läser siffran fel)

Detta är idealiskt för korta manus.

 

② Bindestreck för tydlighet

När två ord tenderar att flyta ihop (t.ex. när 'sjuttio' blir ett otydligt ljud), lägg till ett bindestreck för att tvinga fram en paus.

Sjuttio-nio / Tjänste-utveckling / A-P-I

Bindestrecket separerar uttalet och ger en kort andningspaus.

 

③ Uttalsordlista (Pronunciation Dictionary)

Om samma egennamn återkommer i varje video är det tidskrävande att skriva om dem varje gång.
Använd vår 'Uttalsordlista' för att registrera namnet en gång. Då kommer modellen ihåg det i hela projektet.

 

🚨 Vanligt misstag (Spara krediter!)
I fältet för "Alias", se till att du anger den fonetiska stavningen tydligt. Om du vill ha ett brittiskt eller amerikanskt uttal på engelska ord, skriv ut dem fonetiskt på engelska. ✅ Exempel: ElevenLabs → I-lev-en-Labs

※ Viktigt: Använd aldrig bindestreck i Alias-fältet. Använd endast mellanslag.
Bindestreck (-) är ett verktyg för själva manustexten.

Lär dig hur du skapar en ordlista på en minut i vår kompletta guide för uttal.

 

Notera att v3 generellt hanterar siffer- och symbolmönster bättre än tidigare versioner, men för att garantera konsekvens över tid är en uttalsordlista alltid säkrast.

 


⏸️ 3. Pausering och andning: Kraften i skiljetecken

Skiljetecken är ett av de mest kraftfulla verktygen du har för att styra AI:ns rytm.

 

① Pauslängd baserat på tecken

Tecken

Effekt

Paustid

Komma ,

Kort paus

Kort

Punkt .

Avslut, tonläge ner

Mellan

Radbrytning

Styckebrytning, återställer andning

Lång

Frågetecken ?

Tonläge upp

Mellan

Utropstecken !

Betoning/energi

Mellan

Ellips …

Tvekan, eftertanke

Lång (mjuk)

Bindestreck -

Mikro-paus

Väldigt kort

 

② Bindestrecket (-) — Vårt hemliga vapen

När ett komma blir för långt, men du ändå behöver en naturlig paus:

  • Separera uttal: Sjuttio-nio → hindrar orden från att smälta samman.

  • Mikropauser: Ja, det är det- skapar en naturlig övergång.

  • Spänning: Det var-precis-då.

 

📌 För v3-användare: Radbrytningar är ett tveeggat svärd
v3-modellen tenderar att återställa sin röstprofil något vid varje radbrytning.
För konsekvent röst i långa texter: håll ihop texten i längre stycken. Vill du variera stämningen mellan scener: använd radbrytningar aktivt.

 

③ Precisionspauser — helt olika metoder per modell ⚡

Situation

Metod för paus

Notering

v3-modellen

[pause], [short pause], [long pause]

Ljudtaggar — endast v3

v2 · Turbo · Flash

<break time="1.5s" />

SSML, fungerar ej i v3

Studio

Klicka på knappen 'Insert Pause'

Enklast, ingen kod behövs

 

🚨 Vanligt fel: <break>-taggar i v3
v3 stödjer inte <break>-taggar och ignorerar dem helt. Använd [pause] för v3 och SSML-taggar för v2.

 


📋 4. Praktiska prompter (kopiera och kör)

 

① YouTube-manus

[curious] Har du någonsin undrat över detta?
Vad jag ska visa dig nu-är riktigt enkelt, men otroligt effektivt.
[excited] Då sätter vi igång!

▶ Rekommenderad modell: Eleven v3

 

② Karaktärsdialog

[whispers] Berätta det inte för någon…
[nervous] Sanningen är, jag var där den dagen.
[sighs] Det spelar väl ingen roll längre, eller hur?

▶ Rekommenderad modell: Eleven v3

 

③ Produktreklam (15 sek)

[excited] Bara idag! Priset gäller endast nu.
Tveka inte-det leder bara till längre leveranstid.
[calm] Ta steget och välj den smarta lösningen.

▶ Rekommenderad modell: Eleven v3

 

④ Informativ guide

Hej.
Här får du en steg-för-steg-guide.
Börja med att hålla in strömbrytaren i tre sekunder.

▶ Rekommenderad modell: Eleven Multilingual v2

 

✅ Checklista för prompter

  • Använder du känslo-taggar? → Är modellen inställd på v3?

  • Är taggarna på engelska, max en per mening?

  • Är svåra namn/ord fonetiskt skrivna eller har bindestreck?

  • Långt manus med ojämn ton? → Minska radbrytningar eller byt till v2.

 


🎁 Sammanfattning

  • Känslo-taggar ([excited], [laughs]) är för v3.

  • Uttal fixas bäst med fonetisk stavning eller uttalsordlista.

  • Pausering sker med skiljetecken, bindestreck för mikropauser, och [pause]-taggar för v3.

 

ElevenLabs handlar om att lära känna verktyget. Samma manus kan bli ett mästerverk eller en trött uppläsning beroende på hur du skriver din prompt.
Kopiera mallarna ovan och testa själv – du hör skillnaden direkt!

 

Tack för att du läste,
Sonetho ⚡