[일레븐랩스 프롬프트 완벽 가이드] 똑같은 대본인데 왜 결과가 다를까? v3 감정·효과음 태그부터 발음·끊어읽기 비기까지 ⚡

일레븐랩스 프롬프트(텍스트 입력) 작성법 총정리. v3 감정·효과음 오디오 태그 사용법, 발음 교정, 마침표·하이픈·break 태그로 끊어읽기 제어, 그리고 유튜브·캐릭터·광고용 복붙 프롬프트 템플릿까지 한 번에 정리했습니다.

"왜 똑같은 대본인데, 어제 뽑은 거랑 오늘 뽑은 게 느낌이 다르지?"

일레븐랩스를 쓰다 보면 누구나 한 번쯤 겪는 일입니다.
사실 그 차이의 8할은 '프롬프트(텍스트 입력)를 어떻게 썼느냐'에서 갈립니다.

안녕하세요, Sonetho입니다 ⚡

일레븐랩스에서 '프롬프트(prompt)'란, 거창한 게 아니라 여러분이 음성으로 바꾸려고 넣는 텍스트 그 자체를 말합니다.
그런데 이 텍스트가 단순한 '글자 덩어리'가 아니라는 게 핵심입니다.

 

같은 "정말 대단하네요"라는 문장도,
그냥 넣으면 평범하게 읽고,
앞에 감정 태그 하나만 붙이면 진짜 놀란 목소리로 연기합니다.
숫자 하나, 마침표 하나, 하이픈 하나로도 결과가 확 달라지죠.

 

거의 3년째 매일 일레븐랩스를 다뤄온 저희가,
오늘은 '프롬프트 작성법' 하나만 제대로 파보겠습니다.
v3 오디오 태그, 발음 교정, 끊어읽기, 그리고 바로 복붙해서 쓰는 실전 템플릿까지 다 담았으니 끝까지 읽어주세요!

 


📌 먼저: 프롬프트는 '모델'에 따라 작동법이 다릅니다

본론 들어가기 전에 딱 하나만 짚고 갈게요.
지금부터 소개할 '오디오 태그(audio tag)' — 그러니까 [excited], [laughs] 같은 대괄호 명령어는 Eleven v3 모델에서만 작동합니다.

 

v2(Multilingual v2)에 이 태그를 넣으면 어떻게 될까요?
태그를 '연기'로 바꾸는 게 아니라, 태그를 '연기'로 해석하지 못하고, 그냥 일반 텍스트처럼 취급해 버립니다(태그가 글자로 읽히거나 무시돼요). 😅
(저희가 직접 v2·v3를 같은 문장으로 비교한 실험은 Eleven v3 vs v2 한국어 비교에서 9개 트랙으로 들어보실 수 있어요.)

 

한 줄 요약
감정·효과음 태그를 쓰고 싶다 → v3
긴 콘텐츠 + 보이스 일관성이 중요하다 → v2 (단락마다 톤이 변하는 v3의 약점 회피)
발음 교정·끊어읽기(하이픈)는 → v2·v3 둘 다 적용됩니다

모델별 강약점을 더 깊게 보고 싶다면 실사용자의 v2 vs v3 노하우 글을 같이 보시면 딱 좋습니다.

 


🎭 1. v3 오디오 태그 총정리 (감정 · 효과음)

오디오 태그는 대괄호 [ ] 안에 '어떻게 말해라'를 영어로 적어주는 명령어입니다.
공식적으로는 '태그가 그 뒤 텍스트의 전달(딜리버리)에 영향을 준다'고만 안내하는데,
실제로 굴려보면 문장 에 붙이면 주로 그 뒤 문장 전체의 톤을 잡아주고,
문장 중간에 끼우면 그 자리에서 효과(웃음·한숨 등)를 내는 경우가 많습니다.
(절대 규칙은 아니고, 이렇게 쓰면 대체로 자연스러워요.)

 

중요한 점 두 가지부터 기억하세요.

  • 태그는 한글이 아니라 '영어'로 적습니다. (한글 [속삭임]보다 영어 [whispers]가 훨씬 잘 먹습니다)

  • 태그는 음성으로 출력되지 않습니다. 연기 지시일 뿐, "위스퍼스"라고 읽지 않아요.
    (단, v3에서만 그렇습니다.)

 

① 감정 톤 태그 (주로 문장 앞에 붙이면 잘 먹어요)

태그

뜻 / 효과

이럴 때 씁니다

[excited]

들뜬 · 신난 톤

이벤트 안내, 신제품 소개

[sad]

가라앉은 · 슬픈 톤

감성 내레이션, 사연 읽기

[angry]

화난 · 격앙된 톤

캐릭터 대사, 드라마틱한 장면

[whispers]

속삭이듯 작게

비밀 얘기, ASMR풍, 긴장감

[sarcastic]

비꼬는 · 빈정대는 톤

유머 콘텐츠, 캐릭터 개성

[curious]

궁금해하는 톤

질문형 내레이션

[nervous]

긴장한 · 떨리는 톤

긴박한 상황 묘사

[calm]

차분하고 안정된 톤

명상, 가이드 안내

 

실제 입력 예시 (v3):

[excited] 여러분, 드디어 신제품이 출시됐습니다!
[whispers] 사실은요, 오늘만 특별 할인을 준비했어요.

👉 첫 문장은 톤이 위로 튀어오르고, 둘째 문장은 갑자기 목소리를 낮춰 속삭이듯 읽습니다.
이렇게 한 대본 안에서 톤을 바꿔가며 연출할 수 있다는 게 v3 태그의 진짜 매력이에요.

 

② 효과음(비언어) 태그 (주로 문장 중간에 끼워요)

이건 '톤'이 아니라 실제 소리를 냅니다.
웃음, 한숨, 헛기침 같은 '말이 아닌 소리(비언어 표현)'를 그 자리에서 내주죠.

태그

나는 소리

주로 넣는 위치

[laughs]

웃음소리

문장 중간·끝

[chuckles]

가볍게 피식 웃음

문장 중간·끝

[sighs]

한숨

문장 앞·중간

[gasps]

숨 들이켜는 놀람 소리

문장 앞

[clears throat]

헛기침

문장 앞

[exhales]

숨 내쉬기

문장 중간·끝

 

실제 입력 예시 (v3):

아, 이걸 또 까먹었네. [sighs] 다시 처음부터 해야겠다.
그래서 제가 어제 뭘 했냐면요… [laughs] 말도 안 되는 실수를 했어요.

 

📌 에디터 팁: 태그는 '욕심'을 버려야 잘 됩니다 ⚡
여러 태그를 조합해서 쓸 수도 있습니다.
다만 한 문장에 태그를 과하게 쌓으면 톤이 불안정해지거나(속도가 들쭉날쭉, 잡음) 그냥 무시되는 일이 잦았어요.
저희가 직접 굴려본 결론은 문장 하나당 태그 1개를 기본값으로 두고, 꼭 필요한 곳에만 콕 찍는 것. 적을수록 자연스럽습니다.

 


🔤 2. 발음 교정: 고유명사·영어·숫자가 안 맞을 때

프롬프트를 아무리 잘 써도, AI가 "ITSUB(잇섭)"을 "아이티숩"이라고 읽어버리면 말짱 도루묵이죠. 😭
발음 문제는 톤·감정과는 완전히 다른 영역이라, 해결법도 따로 있습니다.

 

발음을 잡는 방법은 크게 세 가지예요.

① 풀어쓰기 (가장 간단, 즉석 처방)

그냥 소리 나는 대로 한글로 바꿔서 프롬프트에 넣는 방법입니다.

  • ChatGPT챗지피티

  • API에이피아이

  • 2026년이천이십육 년 (숫자가 자꾸 튈 때)

한 번 쓰고 마는 대본이면 이게 제일 빠릅니다.

 

② 하이픈으로 발음 분리

두 글자가 뭉쳐서 이상하게 붙어 읽힐 때(예: '쉰일곱'을 '쉬닐곱'으로), 사이에 하이픈을 넣으면 깔끔하게 떨어집니다.

쉰-일곱 / 챗-지피티 / 에이-피-아이

하이픈은 발음 분리 + 아주 짧은 호흡까지 같이 잡아주는데, 자세한 활용은 아래 '끊어읽기' 파트에서 더 다룰게요.

 

③ 발음 교정 사전 (반복 사용한다면 필수)

같은 고유명사가 영상마다 계속 나온다면, 매번 풀어쓰는 건 노가다죠.
이럴 땐 '발음 교정 사전(Pronunciation Dictionary)'에 한 번만 등록해두면,
원본 텍스트를 그대로 넣어도 알아서 변환해 읽어줍니다.

 

🚨 가장 많이 하는 실수 (크레딧 사수!)
발음 사전의 Alias(별칭) 칸에는 한국어로 읽히는 음성이면 한글(잇섭)도 적용됩니다. 다만 영어로 또렷이 읽히길 원하거나 결과가 불안정하면 소리 나는 대로 영어 철자가 더 안정적이에요. ✅ ITSUB → Eat Sub (또는 It Sub)

※ 헷갈리기 쉬운 점: 발음 사전 Alias에는 하이픈을 넣지 않습니다. 그냥 띄어쓴 영어 철자(Eat Sub)면 돼요.
하이픈(-)은 발음 사전이 아니라, 본문 텍스트에서 끊어읽기·발음 분리용 도구입니다(아래 3번 참고).

발음 사전 만드는 법은 스크린샷까지 곁들여 일레븐랩스 발음 교정 완벽 가이드에 1분 컷으로 정리해뒀습니다.
발음이 자꾸 깨진다면 이 글부터 보세요!

 

참고로 v3는 v2보다 처음 보는 숫자·기호 패턴(예: "$22" → "이십이 달러")을 더 유연하게 처리합니다.
대신 같은 영어 단어를 출력 안에서 미국식↔영국식으로 왔다갔다 하는 약점이 있으니,
발음 일관성이 중요하면 발음 사전으로 못을 박아두는 게 안전합니다.

 


⏸️ 3. 끊어읽기·호흡 제어: 문장부호와 하이픈의 마법

프롬프트에서 의외로 가장 강력한 도구가 바로 문장부호입니다.
AI는 우리가 찍은 부호를 보고 '어디서 쉬고, 얼마나 끊고, 어떤 톤으로 마칠지'를 결정하거든요.

 

① 부호별 '쉬는 길이' 감각 잡기

부호

효과

쉬는 길이

쉼표 ,

살짝 끊고 이어감

짧게

마침표 .

문장 끝, 톤 내려감

중간

줄바꿈(엔터)

단락 분리, 호흡 리셋

길게

물음표 ?

끝을 올림

중간

느낌표 !

힘이 들어감

중간

말줄임표 …

여운 · 머뭇거림

길게(부드럽게)

하이픈 -

아주 찰나의 끊김

아주 짧게

 

② 하이픈(-) — 저희가 제일 아끼는 비기

쉼표를 찍자니 너무 길게 쉬어서 어색하고, 안 찍자니 발음이 뭉칠 때.
'애매한 틈'을 메우는 게 바로 하이픈입니다.

  • 발음 분리: 쉰-일곱 → '쉬닐곱'으로 붙는 사고 방지

  • 미세 호흡: 자, 그러면- 다음 문장으로 자연스럽게 텀 주기

  • 긴장감 연출: 그건-바로- 살짝 끊으며 호흡 만들기

하이픈 노하우의 원조 격 설명은 실사용자 노하우 정리 글에 더 자세히 있어요. "쉼표 대신 하이픈"이 핵심 한 줄입니다.

 

📌 v3 사용자라면 꼭 알아둘 것: 줄바꿈은 양날의 검
v3는 줄바꿈(단락 분리)마다 보이스가 미세하게 다시 잡히는 특성이 있습니다.
그래서 긴 콘텐츠에서 톤을 일정하게 유지하고 싶다면 줄바꿈을 최소화하고 한 덩어리로 쓰는 게 안전하고,
반대로 장면마다 분위기를 확 바꾸고 싶다면 일부러 줄바꿈을 활용하면 됩니다. 의도에 맞게 골라 쓰세요.

 

③ 정밀한 휴지(쉼) — 모델마다 방법이 완전히 다릅니다 ⚡

"여기서 딱 1초만 멈춰" 같은 정확한 휴지가 필요할 때, 많은 분이 여기서 헷갈립니다.
방법이 쓰는 모델에 따라 완전히 다르거든요. (공식 문서 기준으로 정리합니다)

상황

휴지 넣는 법

비고

v3 모델

[pause] · [short pause] · [long pause]

대괄호 오디오 태그 — v3 전용

v2 · Turbo · Flash

<break time="1.5s" />

초 단위 지정, v3에선 작동 안 함

Studio(웹 편집기)

'휴지(pause) 삽입' 버튼 클릭 → 시간만 설정

텍스트에 직접 안 쳐도 됨, 제일 간편

 

🚨 가장 흔한 실수: v3 대본에 <break> 태그 넣기
v3는 SSML break 태그를 지원하지 않아서 그냥 무시합니다. v3에서 쉬려면 [pause] 태그나, 위 부호표의 말줄임표(…)·대시(—)를 쓰세요.
반대로 v2 계열엔 [pause]가 안 먹으니 <break>를 써야 하고요. 모델부터 확인하는 게 핵심입니다.

참고로 Studio(웹 편집기)에서 작업한다면 태그를 손으로 칠 필요 없이, 편집기의 휴지 삽입 버튼을 누르고 원하는 시간만 정하면 끝이라 가장 편합니다.

※ 어느 방법이든 과용은 금물 — 한 대본에 휴지를 너무 많이 넣으면 오디오가 불안정해질 수 있어요.

 


📋 4. 실전 프롬프트 템플릿 모음 (복붙용)

이론은 충분합니다. 이제 바로 가져다 쓸 수 있는 템플릿을 드릴게요.
대괄호 태그는 v3 기준이고, 일반 부호·하이픈·발음 풀어쓰기는 v2·v3 둘 다 됩니다.

 

① 유튜브 정보성 내레이션

[curious] 여러분, 혹시 이거 아세요?
오늘 알려드릴 내용은-정말 간단하지만, 효과는 확실합니다.
[excited] 자, 그럼 바로 시작해 볼까요!

포인트: 도입은 [curious]로 호기심, 본론 진입은 [excited]로 텐션 업. 하이픈으로 호흡 한 박자.
▶ 권장 모델: Eleven v3

 

② 캐릭터 대사 (감정 연기)

[whispers] 아무한테도 말하면 안 돼…
[nervous] 사실은, 내가 그날 거기 있었어.
[sighs] 이제 와서 후회해도 소용없겠지.

포인트: 짧은 문장 + 강한 감정 태그 = v3의 최강 영역. 캐릭터 더빙·웹툰 더빙에 딱.
▶ 권장 모델: Eleven v3

 

③ 제품 광고 (15초 내외)

[excited] 단 하루! 오늘만 이 가격입니다.
고민은-배송만 늦출 뿐입니다.
[calm] 지금 바로, 챗지피티보다 똑똑한 선택을 해보세요.

포인트: 텐션 → 카피 → 차분한 마무리로 강약 조절. 영어 단어는 한글로 풀어써서 발음 사고 방지.
▶ 권장 모델: Eleven v3

 

④ 차분한 가이드 / 안내 음성

안녕하세요, 고객님.
지금부터 설치 방법을, 차근차근 안내해 드리겠습니다.
먼저 전원 버튼을, 삼 초간 길게 눌러주세요.

포인트: 태그 없이 쉼표만으로 또박또박. 일관성이 중요한 긴 안내문은 v2가 더 안정적입니다.
▶ 권장 모델: Eleven Multilingual v2

 

✅ 프롬프트 작성 체크리스트

  • 감정·효과음 태그를 쓸 거면 → 모델이 v3인지 확인했나?

  • 태그는 영어로, 기본은 문장당 1개로 절제했나?

  • 영어·고유명사·숫자는 풀어쓰거나 하이픈으로 발음을 잡았나?

  • 반복되는 고유명사는 발음 사전에 영어 알파벳으로 등록했나?

  • 긴 콘텐츠인데 톤이 흔들린다면 → 줄바꿈을 줄이거나 v2로 바꿔봤나?

  • 출력 후 미리듣기로 한 번은 들어봤나? (눈으로만 보면 못 잡아요!)

 


❓ FAQ — 프롬프트 자주 묻는 질문

 

Q. [excited] 같은 태그를 넣었는데 그냥 "엑사이티드"라고 읽어버려요. 왜 그럴까요?
지금 쓰는 모델이 v2(Multilingual v2)일 가능성이 큽니다.
오디오 태그는 Eleven v3에서만 연기로 변환되고, v2에서는 글자 그대로 읽습니다. 모델을 v3로 바꾼 뒤 다시 시도해 보세요.

 

Q. 태그는 꼭 영어로 써야 하나요? 한글 [속삭임]은 안 되나요?
한글 태그도 가끔 먹지만, 안정성이 떨어집니다.
v3 태그는 영어를 기준으로 학습돼 있어서 [whispers], [laughs]처럼 영어로 쓰는 걸 강력 추천합니다.
본문 표를 그대로 복사해서 쓰시면 편해요.

 

Q. 숫자나 영어 약어가 자꾸 이상하게 읽히는데, 제일 빠른 해결법은?
한 번 쓰고 말 대본이면 한글로 풀어쓰기(API → 에이피아이)가 가장 빠릅니다.
같은 단어가 반복된다면 발음 교정 사전에 영어 알파벳으로 등록하세요(Alias 칸엔 하이픈 없이 'Eat Sub'처럼).
발음이 붙어 읽힐 땐 본문 텍스트에 하이픈(쉰-일곱)이 특효약입니다. 자세한 건 발음 교정 가이드를 참고하세요.

 

Q. 긴 대본인데 중간중간 목소리 톤이 바뀌어요. 프롬프트로 막을 수 있나요?
v3는 줄바꿈(단락)마다 보이스가 다시 잡히는 특성이 있어서, 줄바꿈을 줄이고 한 덩어리로 입력하면 어느 정도 완화됩니다.
래도 흔들린다면 보이스 일관성이 강한 v2로 바꾸는 게 가장 확실합니다.
모델별 차이는 v3 vs v2 비교 실험에서 직접 들어보실 수 있어요.

 

Q. 감정 태그를 여러 개 넣으면 더 풍부해지나요?
여러 태그를 조합하는 것 자체는 가능합니다.
다만 한 문장에 과하게 쌓으면 톤이 불안정해지거나(속도 변동·잡음) 그냥 무시되는 일이 많아요.
문장당 1개를 기본으로, 꼭 필요한 곳에만 쓰는 게 가장 안전하고 자연스럽습니다.

 


🎁 마치며

오늘 핵심만 다시 정리할게요.

  • 감정·효과음 태그([excited], [laughs])는 v3 전용, 영어로, 기본은 문장당 1개.

  • 발음은 풀어쓰기 → 하이픈 → 발음 사전(Alias는 영어 철자, 하이픈 X) 순으로 해결.

  • 끊어읽기는 부호로, 미세한 호흡은 하이픈으로, 정밀한 휴지는 모델별로(v3=[pause] 태그 · v2=<break> · Studio=휴지 버튼, 과용 금지).

  • 긴 콘텐츠 톤이 흔들리면 줄바꿈을 줄이거나 v2로.

 

일레븐랩스는 결국 '어떻게 조련하느냐'의 싸움입니다.
같은 문장도 프롬프트를 어떻게 쓰느냐에 따라 평범한 낭독이 되기도, 진짜 성우의 연기가 되기도 하죠.

 

위 템플릿 중 하나를 그대로 복사해 일레븐랩스 Text to Speech 입력창에 넣고 미리듣기를 눌러보면,
태그가 연기로 바뀌는 게 1분이면 체감됩니다.
오늘 템플릿과 체크리스트, 즐겨찾기 해두고 대본 쓸 때마다 꺼내 쓰세요.
여러분의 텍스트가 훨씬 살아 있는 목소리로 바뀔 겁니다!

 

다음 글에서 또 더 유익한 꿀팁으로 찾아뵙겠습니다.
Sonetho였습니다 ⚡