일레븐랩스(ElevenLabs) 2년 실사용자의 노하우: 한국어, '이 모델' 안 쓰면 돈 낭비입니다 (v2 vs v3 완벽 비교)

일레븐랩스 한국어는 Multilingual v2 모델을 사용해야 합니다. 세팅 최적화와 하이픈 사용으로 자연스러운 목소리 연기가 가능합니다.

안녕하세요, Sonetho입니다! ⚡

 

지난 글에서 일레븐랩스가 좋다는 건 말씀드렸지만, 막상 직접 써보니 생각대로 안 나와서 답답하셨죠?
"왜 내가 만든 목소리랑 느낌이 다르지?", "왜 문장 끝글자가 자꾸 잘리지?"

 

제가 작년부터 지금까지 수백만 크레딧을 태우며 알아낸 '진짜 한국어 노하우'를 알려드리겠습니다!
단순 매뉴얼에는 없는, 맨땅에 헤딩하며 얻은 실전 꿀팁들이니 꼭 끝까지 읽어보세요~

👉 결론 미리 — 일반 콘텐츠 제작에는 Eleven Multilingual v2 가 가장 안정적입니다. PVC(전문 보이스 클로닝) 학습은 Creator 플랜 이상 필요 — 신규 가입 첫 달 50% 할인(월 $11)으로 시작 가능합니다.


1. 모델(Model) 선택: 무조건 최신이 답은 아니다

많은 분들이 "v2.5나 v3가 최신이니까 제일 좋겠지?"라고 생각하시는데, 반은 맞고 반은 틀립니다.

 

① Eleven Turbo v2.5 (가성비용)

  • 장점: 출력 속도가 엄청 빠르고, 가격이 50% 저렴합니다.
  • 단점: 솔직히 고퀄리티는 아닙니다.
    내가 힘들게 만든 PVC(복제된 목소리) 특유의 톤 앤 매너나 억양을 100% 살리지 못하고 약간 밋밋해집니다.
  • 결론: 단순 낭독이나 테스트용, AI Agent(출력이 빨라야 하는 AI 전화 응대)으로는 OK,
    하지만 '감정 연기'가 필요하다면 비추천.

 

② Eleven Multilingual v2 (에디터 강력 추천 ⭐)

🎙️ 이 모델, 직접 들어보면 바로 압니다

글로 'v2가 좋다'고 백 번 읽는 것보다 같은 문장을 v2.5와 Multilingual v2로 직접 뽑아 비교해 보는 게 가장 빠릅니다. 무료 크레딧으로 한 문장만 넣어 들어보면, 위에서 말한 톤·억양 차이가 왜 '돈값'인지 1분 만에 체감하실 거예요.

🎙️ Text to Speech로 v2 직접 들어보기 →
  • 특징: 제가 가장 애용하는 모델입니다.
  • 이유: PVC의 목소리 톤과 뉘앙스를 가장 완벽하게 구현합니다.
    v2.5보다 비싸지만, 결과물을 들어보면 돈값합니다. 진짜 사람 같은 억양을 원한다면 무조건 이겁니다.

 

③ Eleven v3 (2026년 정식 출시)

  • 특징: 감정 표현력은 미쳤습니다. 진짜 성우가 연기하는 것 같습니다.
  • 치명적 단점: 표현력은 최고지만, 긴 콘텐츠에서는 톤 일관성이 v2보다 흔들릴 수 있습니다.
    • 긴 문장을 시키면 문단마다 목소리가 바뀝니다...;;
    • 문장 맨 끝 한 글자가 뚝 끊기는 오류가 빈번합니다. (잘 뽑혔는데 이러면 매우 열받는 부분...)
  • 결론: 짧은 문장에 '강한 연기'가 필요할 때만 뽑기 하듯이 쓰고, 긴 문서는 피하세요.

2. 세팅값(Settings): 황금 비율은 따로 있다

 

 

세팅값

출력물의 퀄리티를 좌우하는 'Settings'

 

① Stability (안정성)

  • 일반론: 높으면 로봇, 낮으면 사람.
  • 에디터 꿀팁: 저는 보통 낮게(40~60%) 씁니다. 특히 발음이 이상하게 출력될 때 낮춰보세요.
  • AI가 특정 단어를 자꾸 씹거나 뭉개나요?
    오히려 안정성을 30~40%대로 확 낮추면 유연성이 생겨서 오류 나는 발음을 성공하는 경우가 많습니다.
    긴 대본일수록 낮춰야 톤, 억양 등이 자연스럽게 출력됩니다.

 

② Similarity (유사성)

  • 추천 값: 60% 고정.
  • 이유: 너무 높이면(80% 이상) 학습 데이터에 집착해서 억양이 딱딱해집니다.
    60% 정도가 목소리 톤은 유지하면서 연기톤을 살리는 최적의 구간입니다.

 

③ Style Exaggeration (스타일 과장)

  • 기본: 0% (한국어는 0%가 잘 나옴)
  • 예외: 느낌표(!), 물음표(?), 감탄사가 들어가는 짧은 문장에서는 1% ~ 10% 정도만 줘보세요.
    1%만 올려도 느낌이 확 달라집니다. (그 이상은 투머치!)
  • 팁 : 출력물이 클론의 억양과 말투가 강조되어야 하는 경우에는 올려주세요!

 


3. 마침표(.)와 쉼표(,) 그 이상의 비기: '하이픈(-)'

이게 오늘 글의 핵심입니다.
한국어, 특히 숫자 읽을 때 AI가 멍청해질 때가 있죠?

상황: '쉰일곱'을 읽어야 하는데 '쉬닐곱'처럼 붙여 읽거나 호흡이 엉킬 때.
해결: 쉼표(,)를 찍자니 너무 길게 쉬어서 어색하죠? 이럴 때 하이픈(-)을 쓰세요.

 

  • 예시: 쉰-일곱
  • 효과: 아주 찰나의 순간만 쉬어가기 때문에, 발음은 정확해지면서 호흡은 끊기지 않습니다.


"저는 문장이 좀 부자연스럽다 싶으면 쉼표 대신 하이픈(-)을 넣어 튜닝합니다."

 


4. Language Override (언어 수동 설정)? 글쎄...

최근에 생긴 기능인데, 한국어로 설정해도 숫자를 뜬금없이 영문 모를 외국어로 읽는 버그 때문에 만든 것 같습니다.
하지만 써본 결과, 이것도 잘 안 먹힐 때가 많습니다.

 

그냥 Automatic(자동)으로 두시고, 숫자가 튀면 한글로 풀어서 쓰거나 위에서 말한 하이픈 신공을 쓰는 게 정신건강에 이롭습니다.


🤔 "아무리 설정해도 자꾸 엉뚱하게 읽는데요?"

고유명사(브랜드명)나 영어 약어는 세팅값으로 해결이 안 됩니다.
이럴 땐 '발음 교정 사전'에 등록해서 강제로 발음을 고정해야 합니다.

👉 [해결법] AI 발음 강제로 교정하는 법 (클릭)

🎁 마치며

일레븐랩스는 '어떻게 조련하느냐'에 따라 천차만별입니다.
하지만 그 '조련'이 귀찮을 만큼, 결과물의 퀄리티는 대체 불가능한 수준이죠.

 

혹시 아직 무료 버전이라 보이스 클로닝(PVC) 기능을 못 써보셨나요?
지금 신규 회원 50% 할인(Creator 플랜)이 진행 중일 때, 커피값 아껴서 제 노하우대로 한번 세팅해 보세요.

 

일레븐랩스 50% 할인받고 시작하기

(클릭 시 공식 할인 페이지로 이동합니다)

 

다음 글에서는 "일레븐랩스(Elevenlabs) 나만의 AI 성우 만들기 (보이스 클로닝 편)"으로
더 유익한 꿀팁으로 찾아뵙겠습니다!
Sonetho