[Đánh giá Music v2] So sánh chi tiết v1 vs v2 vs Suno v5.5 qua 9 bài hát

Sau khi ra mắt ElevenMusic v2, nhiều người dùng thắc mắc liệu chất lượng có thực sự vượt trội so với v1? Chúng tôi đã thực hiện một bài kiểm tra toàn diện bằng cách sử dụng cùng một lời bài hát với 2 phong cách (Synthwave / Alt Rock) để so sánh trực tiếp v1, v2 và Suno v5.5. Hãy cùng khám phá 3 điểm nhấn quan trọng: độ phức tạp của giọng hát, khả năng tách nhạc cụ và hiệu suất chuyển đổi thể loại để thấy rõ sự khác biệt trong phiên bản mới này.

"Bản cập nhật Eleven Music v2... Liệu có thực sự tạo nên sự khác biệt đáng kể về âm thanh?"
Tôi đã đưa cùng một lời bài hát + 2 thể loại nhạc vào Eleven Music v1, v2 và Suno v5.5 trong cùng điều kiện và lắng nghe đối chiếu.

 

Xin chào, đây là Sonetho. ⚡

Trong bài viết trước, chúng ta đã cùng điểm qua những cải tiến của Music v2 mà ElevenLabs vừa công bố.
Hôm nay, đúng như đã hứa, tôi sẽ công bố kết quả trực tiếp sau khi xuất file (bounce) và lắng nghe.
Tôi đã sử dụng cùng một lời bài hát, cùng chế độ, cùng câu lệnh (prompt) cho v1, v2 và cả Suno v5.5 – tiêu chuẩn hiện tại của AI tạo nhạc – để thực hiện bài thử nghiệm này.

Kết luận nhanh nhé — v1 lên v2 là một bước tiến rõ rệt, nhưng so với Suno v5.5 thì vẫn còn một khoảng cách đáng kể.
Hãy cùng phân tích chi tiết qua từng bản nhạc dưới đây.

 


🧪 Thiết lập thử nghiệm

  • 1 bộ lời bài hát (lời bài hát từ bài trước — "Lost in the static of a thousand nights…")

  • 2 thể loại: Alternative Indie Rock & Synthwave Electro-pop

  • 3 mô hình: Eleven Music v1, Eleven Music v2, Suno v5.5

  • Chế độ: Custom (Nhập lời bài hát trực tiếp, áp dụng cùng câu lệnh thể loại)

 


🔍 Ghi chú quan sát: Eleven Music tự động điều chỉnh độ dài bài hát dù đang ở chế độ 'Custom'

Vì đã nhập lời bài hát trực tiếp, tôi cứ ngỡ độ dài bài hát sẽ phụ thuộc vào lượng lời tôi cung cấp.
Tuy nhiên, tất cả các bản nhạc của ElevenLabs đều cho ra thời lượng đồng nhất khoảng 3 phút 30 giây.
Khi kiểm tra cửa sổ dự án của ElevenLabs, tôi nhận ra: Mô hình tự động lặp lại phần Verse 1 để lấp đầy thời lượng bài hát.

👍 Ưu điểm: Ngay cả khi lời bài hát ngắn, nó vẫn tự động hoàn thiện thành một bản nhạc hoàn chỉnh. Chỉ với một câu điệp khúc ngắn cũng có thể tạo thành một bản track đầy đủ.

👎 Nhược điểm: "Custom" không hẳn là hoàn toàn thủ công. Mô hình tự ý áp đặt cấu trúc bài hát cho đến khi kết thúc. Đôi khi các đoạn Verse bị lặp lại một cách không mong muốn.


🎸 Thể loại 1: Alternative Rock / Indie Rock

Đầu tiên là nhạc Rock. Sự kết hợp giữa trống, guitar và bass là nơi thể hiện rõ nhất sự khác biệt giữa các mô hình.

 

① Eleven Music v1

Độ hoàn thiện vẫn còn nhiều thiếu sót. Tiếng ồn nền (background noise) khá rõ, giọng hát nghe giống hát thông thường hơn là chất "Rock".
Điều đáng thất vọng nhất là tiếng guitar riff — nghe như bị rè do lỗi kỹ thuật số (digital artifact).
Dù tôi đã đưa driving electric guitars, gritty melodic bass vào prompt, nhưng kết quả không làm nổi bật được ý đồ này.

 

② Eleven Music v2

Từ đây, sự khác biệt trở nên rõ ràng hơn. Cách phối khí phù hợp với thể loại, giọng hát cũng chuyển sang tone Rock. Tiếng ồn giảm đáng kể.
Sự khác biệt giữa v1 và v2 là rất lớn dù cùng một gia đình mô hình.
Lời khẳng định về "cải thiện chất lượng và độ bám sát câu lệnh" trong thông báo ra mắt quả thực không phải là lời nói suông.

 

③ Suno v5.5

Tuy nhiên, khi nghe đối chiếu với Suno, khoảng cách vẫn hiện hữu.
Hơi thở trong giọng hát, độ động (dynamic) của guitar, sự chắc khỏe của tiếng trống — nghe như một bản "demo chuyên nghiệp".
Nói thẳng thì tôi vẫn phải thừa nhận: Ở thể loại này, Suno vẫn đang dẫn trước khá xa.

 


🎹 Thể loại 2: Synthwave / Electro-pop

Tiếp theo là thể loại điện tử sử dụng synthesizer. Độ trau chuốt của giọng hát và độ dày của âm sắc synth là những tiêu chí so sánh cốt lõi.

 

① Eleven Music v1

Âm thanh synthesizer nghe khá phẳng. Tôi nhắm đến tông màu retro electro-pop thập niên 80 nhưng kết quả lại giống như "bàn phím điện tử" rẻ tiền.
Giọng hát tách biệt hẳn so với phần nhạc nền. Cách hòa âm (mixing) rất rời rạc.

 

② Eleven Music v2

Độ dày của synth, sự mạnh mẽ của trống máy, độ trau chuốt của vocal — tất cả đã cải thiện đáng kể.
So với v1, bản này nghe giống một bài hát thực sự hơn. Sự kết hợp giữa synth và vocal cũng tự nhiên hơn nhiều.
Tuy nhiên, độ hoàn thiện vẫn chưa đạt mức "xuất sắc" so với kỳ vọng.

 

③ Suno v5.5

Dù vậy, Suno vẫn đi trước một bước. "Bản nháp" và "Bản hoàn thiện" — đó là cách mô tả công bằng cho sự so sánh giữa v2 và Suno trong thử nghiệm này.
Thú thật, chúng tôi cũng hơi "ngại" khi kết quả cả hai thể loại đều tương tự nhau. — Ở thể loại này, Suno vẫn đang ở một đẳng cấp cao hơn.

 


🇻🇳 [Dành riêng cho độc giả Việt Nam] Tôi đã thử tái hiện tác phẩm "Chaotic Chaos" bằng v1 và v2

Đây là phần nội dung đặc biệt dành cho độc giả tại Việt Nam.
Trong số các tác phẩm thuộc dự án âm nhạc AIVE MUSIC mà tôi điều hành, có một bài tên là "Chaotic Chaos" — bản gốc được làm bằng Suno. Tôi đã sử dụng đúng các câu lệnh phong cách (style prompt) và lời bài hát lúc đó để thử nghiệm trên Eleven Music v1 và v2.
Đây là ví dụ điển hình để so sánh xem với cùng dữ liệu đầu vào, ba mô hình sẽ tạo ra kết quả khác nhau như thế nào.

Prompt phong cách đã sử dụng:
Hi-Fi, pristine audio, well-mixed, K-indie pop band, warm acoustic funk, male and female vocal duet,
groove rhythm, relaxed mood. Alternating male and female lead vocals.
Harmonized male and female dual vocals in chorus, rich M/F vocal harmony, synchronized chorus,
gentle airy female vocal tone, smooth male vocal tone, conversational vocal interplay,
funky acoustic guitar, groovy bass, crisp drums. 

① Eleven Music v1

 

② Eleven Music v2

 

③ Suno (Bản gốc)

 

Thành thật mà nói — phiên bản v1 và v2 gần như không thể nghe nổi...
Cấu trúc phức tạp, sự pha trộn thể loại và cá tính của giọng hát trong bản gốc (Suno) đều không được tái hiện lại một cách hiệu quả.

Đây không đơn thuần là chỉ trích v2, mà là minh chứng cho thấy: "Khôi phục chi tiết của một bài hát đã hoàn thiện bằng mô hình khác" là một nhiệm vụ khó khăn đến mức nào đối với AI tạo nhạc.
Có những sắc thái mà chỉ với prompt đơn giản + lời bài hát là không thể chạm tới được.

🎧 Các bản phát hành chính thức đã qua mastering & những bản nhạc khác của AIVE MUSIC

Các đoạn nhúng SoundCloud ở trên là file raw từ Suno, còn bản phát hành chính thức đã qua chỉnh sửa mastering và EQ, hiện đang có trên Spotify và Apple Music. Ngoài "Chaotic Chaos", còn nhiều bản nhạc khác của AIVE MUSIC, hãy ghé qua nghe thử nhé.

▶️ Nghe "Chaotic Chaos" trên Spotify →

🎵 Trang nghệ sĩ AIVE MUSIC → (Nghe tất cả các bài)

💿 Bạn muốn tự tay đưa nhạc AI lên Spotify·Apple Music?

Kênh mà tôi dùng để phân phối nhạc AIVE MUSIC (kể cả bài "Chaotic Chaos") lên Spotify·Apple Music·YouTube Music chính là DistroKid. Bạn có thể phân phối nhạc AI hợp lệ mà không lo vi phạm chính sách, và chỉ cần đóng phí thuê bao hàng năm là có thể đăng tải không giới hạn số bài, rất thích hợp để kiểm chứng demo.

▶️ Link giảm giá 7% DistroKid (Mã giới thiệu của tôi) →

※ Nếu đăng ký qua link này, bạn sẽ nhận được ưu đãi giảm giá 7% phí đăng ký năm đầu tiên, và tôi cũng nhận được một khoản hoa hồng nhỏ.
Đừng ngần ngại sử dụng nhé. 🙏

 


📊 Đánh giá tổng quát — Kết luận khách quan từ Sonetho

✅ v1 → v2: Cải thiện rõ rệt

Tông giọng, khả năng phối khí, giảm nhiễu — cả ba yếu tố đều đã được cải thiện chắc chắn.
Những gì ElevenLabs công bố "improved quality and better adherence to your prompt" không chỉ là lời quảng cáo, mà được chứng minh qua kết quả thực tế.

⚠️ vs Suno v5.5: Vẫn còn khoảng cách

Suno vẫn đang dẫn đầu ở mảng mô hình chuyên tạo nhạc.
Có vẻ như ElevenLabs Music cần thêm thời gian để bắt kịp. Lab luôn giữ quan điểm đánh giá trung thực nhất.

💡 Tuy nhiên, sức mạnh thực sự của ElevenLabs có lẽ không chỉ nằm ở mỗi âm nhạc

TTS, nhân bản giọng nói (voice cloning), hiệu ứng âm thanh (SFX), Studio (dành cho sách nói/đọc kể) và giờ là Music — quy trình làm việc (workflow) tích hợp nội dung kể chuyện, hiệu ứng âm thanh, nhạc nền và vocal trong cùng một hệ sinh thái là giá trị mà Suno chưa có.
Đối với những người làm video, podcast, sách nói, tính tích hợp này có thể quan trọng hơn nhiều so với chất lượng âm nhạc đơn thuần.
Trong tương lai, Lab sẽ tiếp tục cập nhật các trường hợp sử dụng quy trình tích hợp này.

 


🎵 Đã nghe xong 9 bản so sánh — giờ là lúc tự mình tạo nhạc

Dù bạn thích mô hình nào đi nữa, cách chính xác nhất vẫn là tự tay trải nghiệm ElevenLabs Music v2. Với ưu đãi giảm 50% trong tháng đầu khi đăng ký mới, hãy thử chạy chính lời bài hát đó bằng đôi tay của bạn.

Tự mình trải nghiệm ElevenLabs Music v2 →

🔮 Thử nghiệm tiếp theo: Chuyển đổi thể loại nhạc vs Suno

Một tính năng khác mà Music v2 tự hào — khả năng chuyển đổi tự nhiên giữa các thể loại nhạc trong cùng một bài — sẽ là trọng tâm kiểm chứng của thí nghiệm tiếp theo.

Chúng tôi sẽ thực hiện những cú chuyển đổi thể loại kịch tính như "Opera → Heavy Metal" với cùng một lời bài hát trên cả v2 và Suno v5.5, để so sánh xem "ai tạo ra sự chuyển đổi thể loại mượt mà hơn".
Đây là tính năng điểm nhấn của bản v2, chắc chắn sẽ là một bài kiểm tra vô cùng thú vị.

Hãy chờ đón nhé! 🎬

 


📚 Bài viết nên đọc thêm

 

Bạn cảm thấy thế nào sau khi nghe thử 9 bản nhạc trên? Hãy chia sẻ cảm nhận của mình trong phần bình luận nhé!
Đặc biệt là "mô hình nào khiến bạn ấn tượng nhất"? 🎵
Sonetho ⚡