【Music v2検証第1弾】v1 vs v2 vs Suno v5.5 — 同一歌詞で9曲徹底比較!

ElevenMusic v2のリリースに伴い、v1と比較してどれほど進化したのかを徹底検証します。同一の歌詞と2つのジャンル(Synthwave / Alt Rock)のプロンプトを使用し、v1とv2で生成した楽曲を比較可能な検証パッケージを公開しました。ボーカルの複雑さ、楽器の分離度、ジャンル転換能力という3つの注目ポイントを直接ご確認いただけます。音楽生成AIの性能を詳細に分析したい方に最適な内容です。

「Eleven Music v2アップデート...実際の聴き心地はどれほど変わったのか?」
同じ歌詞と2つのジャンルでEleven Music v1、v2、そしてSuno v5.5を同一条件で生成し、聴き比べてみました。

 

こんにちは、Sonetho(イレブンラボ・ラボ)です。⚡

前回の記事では、ElevenLabsが発表したMusic v2の改善点について解説しました。
本日はお約束通り、実際に生成して聴き比べてみた結果を公開します。
同じ歌詞、同じモード、同じプロンプトを使用し、v1、v2、そして現在の音楽生成AIの基準点であるSuno v5.5を並べてテストしました。

結論から申し上げますと — v1からv2への進化は明白ですが、Suno v5.5との間には依然として差があります。
どのように異なるのか、トラックを聴きながら紐解いていきましょう。

 


🧪 実験設定

  • 歌詞1セット(前回の記事と同じもの — "Lost in the static of a thousand nights…")

  • ジャンル2種:オルタナティブ・インディーロック & シンセウェーブ・エレクトロポップ

  • モデル3種:Eleven Music v1, Eleven Music v2, Suno v5.5

  • モード:Custom(歌詞を直接入力、ジャンルプロンプトを共通適用)

 


🔍 観察ノート:Eleven Musicは「Custom」でも曲の長さを自動調整

歌詞を直接入力したため、曲の長さも歌詞の分量に合わせて決まるものと考えていました。
ところが、ElevenLabsのすべてのミュージックトラックが約3分30秒で一定の長さで出力されました。
ElevenLabsのプロジェクトウィンドウを詳しく確認してみると、モデルが自動的にVerse 1(Aメロ)を反復し、尺を埋めていることがわかりました。

👍 メリット:歌詞が短くても、自動的に「曲らしい」完成された形式で出力されます。短いサビの1行だけでもフル尺の曲が仕上がります。

👎 デメリット:「Custom」=完全な手動構成というわけではありません。モデルが楽曲構成を最後まで強制的に埋めてしまうため、意図せずVerseが繰り返されることがあります。


🎸 ジャンル1:Alternative Rock / Indie Rock

まずはロックジャンル。ドラム・ギター・ベースが混在するダイナミクス表現こそ、モデルの性能差が最も顕著に表れる領域です。

 

① Eleven Music v1

楽曲としての完成度が不足しています。バックグラウンドノイズが目立ち、ボーカルは「ロックシンガー」というよりは一般的な発声に近いです。
最も気になるのはギターのリフ — デジタルアーティファクト特有の音が割れるようなノイズが聞こえます。
プロンプトに driving electric guitars, gritty melodic bass と入れましたが、結果はその意図を活かしきれていません。

 

② Eleven Music v2

ここからは確実に違います。楽器編成がジャンルに合わせて整い、ボーカルもロック調に変化しました。ノイズも大幅に低減されています。
「同じモデルシリーズのv1とv2」と呼ぶには差が大きすぎます。
発表時に強調されていた「improved quality and better adherence to your prompt(品質の向上とプロンプトへの忠実な反映)」は、伊達ではありませんでした。

 

③ Suno v5.5

ただし、Sunoと並べて聴き比べると依然として格差を感じます。
ボーカルのブレス、ギターのダイナミクス、ドラムのパンチ感 — まさに「プロのデモ」レベルです。
Sonethoを運営する立場としても、認めざるを得ません。このジャンルにおいては、まだSunoが一枚上手です。

 


🎹 ジャンル2:Synthwave / Electro-pop

次はシンセベースのエレクトロニックジャンル。ボーカルの洗練度とシンセ音の厚みが比較のポイントです。

 

① Eleven Music v1

シンセサイザーのサウンドが平面的です。80年代のレトロなエレクトロポップを狙いましたが、結果は「安価なデジタルキーボード」に近い質感です。
ボーカルもシンセの上にただ乗っているだけで、馴染んでいません。ミキシングが非常に粗い印象を受けます。

 

② Eleven Music v2

シンセの音の厚み、ドラムマシンのパンチ感、ボーカルの質 — すべてが一段階レベルアップしています。
v1と比較すれば、ようやく「音楽」として聴けるレベルに達しました。シンセとボーカルの調和も自然です。
しかし、まだ完成度は万全とは言えません。

 

③ Suno v5.5

やはりSunoは一歩先を行っています。「初期段階のデモ」と「完成したトラック」 — 今回のテストでv2とSunoを比較するなら、この表現が近いです。
正直に言って、いずれのジャンルでも同様の結果となり少し複雑な気分です。こちらのジャンルにおいても、やはりSunoが一段上です。

 


🇯🇵 [日本の読者の皆様へ] 私の楽曲「Chaotic Chaos」をv1・v2で再現してみました

ここからは、日本語版読者のためのボーナスセクションです。
私が運営する音楽プロジェクトAIVE MUSICの楽曲の一つ、「Chaotic Chaos」 — 原曲はSunoで制作したものですが、当時のスタイルプロンプトと歌詞をそのまま流用し、Eleven Music v1、v2で生成してみました。
同じ入力値に対して、3つのモデルがどれほど異なる結果を出力するのか、比較対象として最適です。

使用したスタイルプロンプト:
Hi-Fi, pristine audio, well-mixed, K-indie pop band, warm acoustic funk, male and female vocal duet,
groove rhythm, relaxed mood. Alternating male and female lead vocals.
Harmonized male and female dual vocals in chorus, rich M/F vocal harmony, synchronized chorus,
gentle airy female vocal tone, smooth male vocal tone, conversational vocal interplay,
funky acoustic guitar, groovy bass, crisp drums. 

① Eleven Music v1

 

② Eleven Music v2

 

③ Suno (原曲)

 

正直に申し上げます — v1、v2バージョンは音楽として聴くには厳しいレベルです…
原曲(Suno)の持つ複雑な構成、ジャンルの混合、ボーカルのキャラクター — どれ一つとして再現できていません。

これはv2を貶める意図ではなく、
「すでに完成された楽曲のディテールを他のモデルで再現することが、音楽生成AIにとってどれほど困難か」を示す好例です。
単純なジャンルプロンプトと歌詞だけでは到達できない領域が確実に存在します。

🎧 マスタリング済みの正式リリース版 & 他のAIVE MUSICの楽曲も

上記のSoundCloudの埋め込みはSunoから出力されたRAWデータで、正式リリース版はマスタリングやEQ調整を経て、Spotify・Apple Musicで配信されています。
「Chaotic Chaos」以外にもAIVE MUSICの楽曲が多数ありますので、ぜひ聴いてみてください。

▶️ 「Chaotic Chaos」をSpotifyで聴く →

🎵 AIVE MUSIC アーティストページ → (他の楽曲もチェック)

💿 自分が作ったAI音楽をSpotify・Apple Musicに配信したいなら?

私が「Chaotic Chaos」をはじめとするAIVE MUSICの曲を配信しているサービスはDistroKidです。AI生成曲も問題なく配信でき、年会費を払えば無制限にリリースできるため、デモの検証用としても非常に便利です。

▶️ DistroKid 7%割引リンク(紹介コード) →

※ 上記リンクからの登録で初年度のサブスクリプション料金が7%割引となり、私にも少額の紹介報酬が入ります。
ご負担にならない範囲でご活用ください。🙏

 


📊 総合評価 — Sonethoの正直な結論

✅ v1 → v2: 明確な進化

ボーカルのトーン、楽器のマッチング、ノイズ低減 — 3つの軸すべてで改善が見られます。
ElevenLabsが掲げた「improved quality and better adherence to your prompt」は、単なるマーケティングコピーではなく、実際の結果として確認できました。

⚠️ vs Suno v5.5: 依然としてある格差

Sunoは音楽生成に特化したモデルとして、依然として一歩先を行っています。
ElevenLabs Musicが肩を並べるには、もう少し時間が必要のようです。 率直に評価することが私たちの役割ですから。

💡 ただし、ElevenLabsの真の強みは音楽単体ではないかもしれません

TTS、音声クローニング、SFX、Studio(オーディオブック・朗読)、そして今回のMusicまで — 同一のエコシステム内でナレーション・効果音・BGM・ボーカルを統合管理できるワークフローこそが、Sunoにはない価値です。
映像制作者やポッドキャスター、オーディオブッククリエイターにとって、この統合性は音楽単体の品質以上に重要になり得ます。
当研究所でも、この統合ワークフローを活用した実例を今後さらに深掘りしていく予定です。

 


🎵 9曲の聴き比べが終わったら — 次はあなたが作る番です

どのモデルが気に入ったとしても、ElevenLabs Music v2は実際に使ってみるのが一番確実です。新規登録の初月50%割引で、同じ歌詞をあなた自身の手で生成してみてください。

ElevenLabs Music v2を実際に使ってみる →

🔮 次回の実験予告:ジャンル転換曲 vs Suno

Music v2が誇るもう一つの機能 — 曲の途中でジャンルが自然に切り替わる能力 — を次回の実験で徹底検証します。

「オペラ → ヘヴィメタル」のような極端なジャンル転換を同じ歌詞でv2とSuno v5.5に投げかけ、
「ジャンル切り替えの自然さ」という難題でどちらがよりスムーズかを比較する予定です。
この機能こそがv2発表のハイライトだったので、最も興味深い検証になりそうです。

ご期待ください!🎬

 


📚 合わせて読みたい記事

 

皆さんが上記の9つのトラックを聴いて感じたことを、ぜひコメント欄で共有してください!
特に「どのモデルが一番好みだったか」が気になります。🎵
Sonetho ⚡