【Dubbing v2検証】鬼滅の刃でv1と徹底比較!驚愕の進化を遂げたAI音声合成

ElevenLabs Dubbing v2を使用して『鬼滅の刃 無限列車編』を日本語で吹き替えた実体験レビューをお届けします。手作業のダビングスタジオが不要なほど、音色・抑揚・演技まで自動で再現するv2の性能を、クリップごとにクローンを作成していたv1と比較検証。Speaker similarityの設定のコツや、固有名詞の翻訳における注意点(鬼の呼称など)まで、AI吹き替えの実践的なノウハウを徹底解説します。

⚡ 3行でわかる!今回のポイント

吹替スタジオでの緻密な手作業は不要! トーン・抑揚・演技までAIが再現 — v1とは次元の異なるクオリティを実現

• 『鬼滅の刃 無限列車編』を日本語から韓国語へ完全自動吹替した実証レポート

• クリエイターが自分の声そのままで世界へ発信できる時代が到来

こんにちは、Sonetho(イレブンラボ・ラボ)です。⚡

先日のDubbing v2 リリース情報をお伝えした際、「実際に検証してみる」とお約束しましたね。
その約束通り、『鬼滅の刃 無限列車編』の一場面をv2で実際に韓国語吹替してみました。
結論から申し上げますと……正直、凄まじい性能です。かつて足りなかった「あと2%」が埋まったどころか、想像を遥かに超えてきました。

▲ ElevenLabs Dubbing v2 · 韓国語自動吹替 (日本語 → 韓国語) · Speaker similarity 7


かつてのv1、あの苦労はどこへ

以前のアニメ吹替クローニング(Clip vs Track vs IVC)の記事で触れた通り、v1の頃のワークフローは非常に手間がかかるものでした。

  • 自動吹替はシンクが合わず翻訳も不自然で、後編集が必須でした。

  • そのため、吹替スタジオのような環境で音声を一つずつカットし、個別にクローンを作成する必要がありました。

  • 結果として、シーンごとに声のトーンがバラバラになり、同じキャラクターなのに場面によって別人のようになってしまうことも。

  • 学習データが短いクリップ一つに限定されるため、出力結果が予測不能で安定しませんでした

  • 納得いく結果が出るまで何度も再出力を繰り返し、それでもどこか「2%足りない」吹替になりがちでした。

一言で言えば、「AIが吹替をしてくれる」というより「AIをコントロールして自分が吹替作業を行う」感覚に近かったのです。


v2は… 何も準備せずとも「その先」へ

今回のv2には、正直驚かされました。

特別な微調整もしていないのに、たった一回の出力で —

  • 元の話し手の声のトーンと抑揚を完璧に捉え、

  • 演技(感情表現)まで自然に再現してくれます。

  • クリップをカットしてクローンを作っていたあの苦労が、文字通り不要になりました。

v1と比較して劇的な進化を遂げたと言えます。
上の動画でぜひ確認してみてください。かつて指摘されていた「AI特有の不自然さ」が大幅に解消されています。


設定のコツ — Speaker similarity

v2のAdvancedメニューには「Speaker similarity」というスライダーがあります。
これは、吹替後の音声において「元の話し手にどれだけ似せるか」 vs 「翻訳先の言語としてどれだけ自然に聞こえるか」のバランスを調整するものです。

今回は、このデモをデフォルト値の 7 で設定しました。(0〜10の間で調整可能です)

Speaker similarity 7 設定画面

▲ 7に設定 — 翻訳先の言語として自然かつ、元の抑揚も適度に残るバランス

スライダーは両端に振ることも可能です。同じシーンを010で出力してみましたので、実際の吹替結果を比較してみてください。

設定値

結果

0 (自然さを重視)

演技の抑揚が大きく、プロの声優のような響き。
ただし、元の話し手の声質再現度はやや下がる

7 (推奨設定)

自然さと元の抑揚をバランスよく維持(4〜7を推奨)

10 (元声重視)

元の話し手の抑揚に最も近いが、
演技がやや単調で硬くなる傾向

🔊 Speaker similarity 0 — 最も自然な表現

Speaker similarity 0 設定画面

▲ 0に設定 — 翻訳先の言語として最も自然な響き

実際に聞いてみたところ、意外にも「0」の設定が最も自然で高品質でした。
演技のトーンに抑揚があり、まさに専門の声優が演じているかのような感覚です。
「元の話し手と似なくなる」という説明書きとは裏腹に、韓国語吹替としての完成度は0の方が豊かに感じられます。

🔊 Speaker similarity 10 — 元の話し手に最大限寄せる

Speaker similarity 10 設定画面

▲ 10に設定 — 元の話し手の抑揚を強く再現(翻訳先ではやや不自然になる場合も)

逆に10の設定では、演技がどうしても硬くなってしまいました。
元の話し手の抑揚を最大限に追従しようとするあまり、韓国語として聞いたときにトーンが平坦で、少し機械的な印象を与えてしまいます。

🎬 0 vs 10 — 聴き比べ

▲ 同じシーンを0(自然さ優先)と10(元の抑揚優先)で比較 — 演技の違いをチェック

聴き比べるとその差は歴然です。
まとめると、値を低くする(0に近い)ほど翻訳先の言語として演技が豊かで自然になり、
高くする(10)ほど元の抑揚を追うために硬くなる傾向がありました。
そのため、感情表現が重要なコンテンツほど低い値が有利です。
声質や話し方の癖を何よりも維持したい場合のみ、値を上げるのが良いでしょう。
個人的には、コンテンツに合わせて 4〜7の間で微調整することをおすすめします。


注意点 — 固有名詞は人の手で確認を

自動翻訳の品質も想像以上に高いです。ただし、固有名詞は必ず人の目で確認する必要があります。

例えば『鬼滅の刃』において、敵である「鬼」は韓国語版では「혈귀(血鬼)」と訳されます。
しかし、自動翻訳ではこれを韓国の伝承に登場する「도깨비(トッケビ)」と訳してしまうことがありました。😅

意味は通じますが、作品のファンなら違和感を覚えるポイントです。
v2を使っても、翻訳されたテキストをチェックし、固有名詞を修正する工程は依然として不可欠です。
(これは、人間が介入する余地がまだ残されているというポジティブな意味でもあります。)

💡 補足:現在、v2は正式にリリースされていますが、Dubbing Studio機能のさらなるアップデートも継続中です。
今後もより詳細なカスタマイズや翻訳の直接修正がスムーズに行えるようになっていきます。


吹替市場が激変する

これほどのクオリティがボタン一つで手に入るということは、単なる機能アップデートの域を超えています。

  • 既存の吹替市場への影響は避けられません。従来の外注単価や納期と比較すると、その差は歴然です。

  • そして、クリエイターにとっては最高のニュースです。

  • もはや専門の代役や声優に頼らなくても自分の声そのままで世界に届けられる時代になったのです。

YouTubeのグローバル展開や、多言語コンテンツを本気で検討しているなら、v2は「試してみようかな」というレベルを超えて、「使わないと取り残される」必須ツールになりつつあります。


さあ、あなたも試してみましょう

現在、Creator以上のプランで最初の7日間、30分分の吹替を無料(Starterは15分、Freeは1分)で提供しています。
先ほどの『無限列車編』の検証も、この無料枠で十分にテスト可能です。

🎬 Dubbing v2を無料でテストする

※ 上記リンクはSonethoの公式提携リンクです(追加費用は発生しません)。

📚 合わせて読みたい関連記事

ElevenLabs Dubbing v2 リリース! — 90以上の言語で「元の演技そのまま」に吹替

お知らせ · v2 公式発表まとめ

アニメ吹替、シンクロ率99%の秘密:3つのクローニング方法 (Clip vs Track vs IVC)

ElevenLabsのTips · v1の手作業クローニングとの比較

ElevenLabs Dubbing 完璧ガイド:動画を自動翻訳・吹替する方法 (v1)

ElevenLabsのTips · v1ワークフロー

🚀 最後に

v1の頃の「AI特有の違和感」というハードルが、v2で見事に下がりました。
もちろん、固有名詞のチェックなど人間による確認は必要ですが、スタートラインそのものが全く別物になっています。
あなたのチャンネルも、国境を越えて — 自分の声そのままで世界に届けましょう!

今日も素敵なクリエイティブを!
Sonetho ⚡