🌍 ElevenLabs Dubbing v2 핵심 요약
• 90개 이상 언어 자동 더빙: v1의 70여 개에서 대폭 확장
• 원본 연기(performance) 보존: 톤·감정·억양·딜리버리를 다른 언어에도 그대로
• Audio-to-Audio 모델: transcripts 단계 제거, 원본 오디오에 직접 conditioning
안녕하세요, Sonetho입니다. ⚡
2026년 5월 29일, ElevenLabs가 차세대 더빙 모델 Dubbing v2의 정식 출시를 발표했습니다.
지난 5월 27일 Music v2 발표에 이어 두 번째 메이저 출시인데, 이번엔 단순히 언어 수만 늘어난 게 아닙니다.
모델 작동 방식 자체가 달라졌습니다.
v1 vs v2 — 무엇이 달라졌나
두 달 전 정리한 v1 가이드와 비교해보면 한 번에 잡힙니다.
항목 | 이전 (v1) | 새로운 (v2) |
|---|---|---|
모델 방식 | Transcript 기반 | Audio-to-Audio 직접 |
감정·억양 | 대체로 평탄 | 원본 화자 그대로 |
영상 싱크 | 수동 후작업 필요 | Sync-aware 자동 |
보이스 클로닝 | 별도 PVC 학습 필요 | 자동 클로닝 내장 |
지원 언어 | 70개 | 90개 이상 |
표로 확인했듯 v2가 모든 면에서 앞섭니다 — 직접 돌려볼 차례
자동 보이스 클로닝·90개 이상 언어·감정 보존을 Creator 플랜 할인가 $11로 바로 사용해보세요.
Creator 50% 할인가 $11로 v2 더빙 바로 써보기 →
공식 발표 핵심 5가지
1. Performance-aware Dubbing — 원본 연기 보존
공식 문구: "화자의 톤, 감정, 페이싱, 딜리버리, 의도까지 그대로 다른 언어로 옮긴다."
v1까지는 한국어 → 영어 더빙 시 "기계적 영어 낭독"처럼 들리는 경우가 잦았습니다.
v2에서 정말 원본 화자의 감정선이 살아남는지 — 한숨·웃음·끄덕임 같은 비언어 단서까지 — 직접 확인할 예정입니다.
2. Audio-to-Audio 모델 — transcript 단계 제거
공식 문구: "transcripts에 의존하지 않고 원본 오디오에 직접 conditioning한다."
v2의 기술적 핵심입니다.
잡음·BGM이 섞인 원본에서도 화자 분리가 제대로 되는지, 한 영상에 화자 2명 이상일 때 각자 목소리가 따로 유지되는지가 관건.
v1은 이 부분에서 두 사람 목소리가 섞이는 경우가 있었습니다.
3. Sync-aware Translation — 번역된 음성의 시작·끝이 원본 영상과 자동 정렬됩니다.
한국어처럼 음절 수가 영어와 다른 언어에서 입 모양·장면 전환에 얼마나 자연스럽게 맞는지가 관건입니다.
4. 자동 보이스 클로닝 내장 — 별도 voice cloning 설정 없이, 원본 화자의 목소리로 번역된 음성이 자동 생성된다는 주장입니다.
기존 PVC 클로닝(Clip vs Track vs IVC)와 어느 정도 격차가 있을지 직접 비교해볼 예정입니다.
5. 90개 이상 언어 지원 (v1 대비 대폭 확장) — 한국어 출력 품질이 v1 대비 얼마나 자연스러워졌는지, 그리고 한국어 → 일본어 / 한국어 → 베트남어 같은 비-영어 쌍에서도 품질이 유지되는지가 한국 사용자에게 가장 중요한 부분입니다.
7일 한정 — paid plan에 30분 무료 더빙
출시 기념으로 모든 유료 플랜에 더빙 30분이 보너스로 추가됩니다.
별도 신청 없이 자동 적용 — 단, 출시일부터 7일만입니다.
⏳ 7일 보너스는 가입 시점에 자동 적용 — 쿠폰 코드 필요 없습니다
신규 가입이면 Creator 플랜이 $22 → $11(50% 할인), 거기에 더빙 30분 무료까지. 지금 가입하면 둘 다 챙깁니다.
7일 보너스 받고 Creator 50% 할인으로 시작하기 →
💡 7일 보너스와 별개로, 신규 회원 상시 50% 할인을 받는 정확한 방법은 여기 정리해 뒀어요 → 2026년 5월 ElevenLabs 크리에이터 요금제 50% 반값 받는 법
플랜 | 기본 더빙 | + 7일 보너스 | 합계 |
|---|---|---|---|
Free | 10분 (체험) | — | 10분 |
Starter ($5) | 30분 | + 30분 | 60분 |
Creator ($22, 할인가 $11) | 2시간 | + 30분 | 2시간 30분 ← 추천 |
Pro ($99) | 10시간 | + 30분 | 10시간 30분 |
다음 글 예고
위에서 정리한 다섯 가지 핵심을 중점으로 연구하여 다음글에서 결과를 알려드리겠습니다.
그 사이에 직접 들어보고 싶으신 분은 ElevenLabs 공식 페이지에 올라온 샘플 데모로 v2 결과물 톤을 미리 체감해보실 수 있습니다!
📚 함께 읽으면 좋은 글
ElevenLabs Dubbing 완벽 가이드: 영상을 90개 이상 언어로 자동 번역·더빙하는 법
애니메이션 더빙, 싱크로율 99%의 비밀: 3가지 클로닝 방법 완벽 분석 (Clip vs Track vs IVC)
"이 목소리가 AI라고?" 방구석에서 애니메이션 더빙하는 법 (feat. 일레븐랩스 더빙 기능)
🚀 마치며
유튜브 글로벌 진출, 다국어 콘텐츠 확장을 진지하게 고민하시는 분이라면 이번 7일은 안 써볼 이유가 없는 윈도우입니다.
v1 시절엔 "AI 티 나는" 결과물이 부담이었는데, v2는 그 부담을 한 번에 줄여줄 가능성이 보입니다.
※ 위 링크는 Sonetho 공식 제휴 링크입니다.
오늘도 좋은 창작 되세요!
Sonetho ⚡