"Aktualizacja Eleven Music v2... Czy słychać realną różnicę?"
Przeprowadziliśmy test, używając tego samego tekstu i dwóch gatunków muzycznych w Eleven Music v1, v2 oraz Suno v5.5, aby sprawdzić wyniki w identycznych warunkach.
Witajcie w Sonetho! ⚡
W poprzednim wpisie podsumowaliśmy kluczowe nowości, jakie przynosi Music v2 od ElevenLabs.
Zgodnie z obietnicą, dziś prezentujemy wyniki odsłuchu bezpośredniego. Użyliśmy tego samego tekstu, trybu oraz identycznych promptów, testując zarówno v1 i v2, jak i Suno v5.5, który obecnie wyznacza standardy w branży muzycznego AI.
Krótko mówiąc — przejście z v1 na v2 to wyraźny postęp, jednak w starciu z Suno v5.5 nadal widać różnicę.
Poniżej znajduje się szczegółowa analiza wraz z nagraniami.
🧪 Warunki eksperymentu
Tekst: "Lost in the static of a thousand nights…"
Gatunki: Alternative/Indie Rock oraz Synthwave/Electro-pop
Modele: Eleven Music v1, Eleven Music v2, Suno v5.5
Tryb: Custom (ręczne wprowadzenie tekstu i identyczne prompty gatunkowe)
🔍 Notatki obserwacyjne: Eleven Music i automatyczne dopasowywanie długości w trybie 'Custom'
Wprowadzając tekst ręcznie, spodziewaliśmy się, że długość utworu będzie bezpośrednio wynikać z jego objętości.
Okazało się jednak, że wszystkie utwory z ElevenLabs Music trwały równo 3 minuty i 30 sekund.
Po sprawdzeniu panelu projektu zauważyliśmy, że model samoczynnie powtórzył pierwszą zwrotkę (Verse 1), aby wypełnić czas trwania.
👍 Zaleta: Nawet krótki tekst zostaje automatycznie przekształcony w pełnowymiarowy utwór muzyczny.
👎 Wada: "Custom" w tym wydaniu nie oznacza pełnej kontroli manualnej. Model narzuca strukturę, co może prowadzić do niechcianych powtórzeń zwrotek.
🎸 Gatunek 1: Alternative Rock / Indie Rock
Zaczynamy od rocka. Dynamika współbrzmienia perkusji, gitary i basu najlepiej obnaża różnice między modelami.
① Eleven Music v1
Jakościowo utwór wypada słabo. W tle słychać wyraźny szum, a wokal bardziej przypomina czytanie niż rasowy "wokal rockowy".
Najbardziej przeszkadza riff gitarowy — brzmi, jakby był zniekształcony przez cyfrowe artefakty.
Mimo użycia promptów driving electric guitars i gritty melodic bass, model nie oddał zamierzonego charakteru.
② Eleven Music v2
Tutaj różnica jest znacząca. Instrumentarium jest lepiej poukładane, a wokal zyskał rockową chrypkę. Szum został drastycznie zredukowany.
Różnica między v1 a v2 jest kolosalna.
Obietnice dotyczące "poprawionej jakości i lepszego trzymania się promptu" to w tym przypadku nie tylko marketingowy bełkot.
③ Suno v5.5
Mimo to, przy bezpośrednim porównaniu z Suno widać dystans.
Oddech wokalisty, dynamika gitary, mocna perkusja — brzmi to jak profesjonalne demo.
Jako zespół Sonetho musimy być uczciwi: w tym gatunku Suno wciąż wygrywa.
🎹 Gatunek 2: Synthwave / Electro-pop
Kolejny test: elektronika na bazie syntezatorów. Skupiamy się na czystości wokalu i głębi brzmienia instrumentów.
① Eleven Music v1
Brzmienie syntezatora jest płaskie. Miał być retro electro-pop w klimacie lat 80., a wyszło brzmienie tanich klawiszy cyfrowych.
Wokal zdaje się być „doklejony” do muzyki. Miks pozostawia wiele do życzenia.
② Eleven Music v2
Głębia syntezatorów, uderzenie automatu perkusyjnego i lepszy wokal — wszystko wskoczyło na wyższy poziom.
W porównaniu do v1, brzmi to jak prawdziwa piosenka. Współgranie wokalu z syntezatorami stało się naturalne.
Jednak nadal brakuje nieco ostatecznego szlifu.
③ Suno v5.5
Suno znowu jest o krok przed konkurencją. "Wstępny szkic" kontra "gotowy utwór" — to uczciwie opisuje różnicę między v2 a Suno w tym teście.
Muszę być szczery: w obu przypadkach wnioski są podobne. W tym gatunku Suno wciąż pozostaje liderem.
🇵🇱 [Bonus dla polskich twórców] Odtworzyliśmy utwór "Chaotic Chaos" w wersjach v1 i v2
Ta sekcja jest dedykowana naszym polskim czytelnikom.
Jeden z utworów mojego projektu muzycznego, AIVE MUSIC, zatytułowany "Chaotic Chaos", powstał oryginalnie w Suno. Postanowiłem wykorzystać te same prompty i tekst, aby sprawdzić, jak poradzą sobie modele Eleven Music v1 i v2.
To idealny test typu "jeden do jednego".
Użyty prompt stylu:
Hi-Fi, pristine audio, well-mixed, indie pop band, warm acoustic funk, male and female vocal duet, groove rhythm, relaxed mood. Alternating male and female lead vocals. Harmonized male and female dual vocals in chorus, rich M/F vocal harmony, synchronized chorus, gentle airy female vocal tone, smooth male vocal tone, conversational vocal interplay, funky acoustic guitar, groovy bass, crisp drums.
① Eleven Music v1
② Eleven Music v2
③ Suno (Oryginał)
Szczerze mówiąc — wersje v1 i v2 są na razie nieakceptowalne...
Złożona struktura, miks gatunków i charakter wokalu z oryginału (Suno) całkowicie zniknęły.
To nie tyle krytyka modelu v2, co lekcja pokazująca, że odtworzenie detali istniejącego, skomplikowanego utworu przez inne AI to niezwykle trudne wyzwanie.
Sam prompt gatunkowy i tekst często nie wystarczą, by osiągnąć tak precyzyjny rezultat.
🎧 Oficjalne wersje i reszta twórczości AIVE MUSIC
Powyższe embedy to surowe pliki z modeli AI. Oficjalne, zmasterowane wersje utworów AIVE MUSIC znajdziecie na Spotify i Apple Music.
▶️ Posłuchaj "Chaotic Chaos" na Spotify →
💿 Chcesz publikować własne utwory AI na Spotify, Apple Music czy YouTube Music?
Do dystrybucji utworów AIVE MUSIC używam DistroKid. Jest to platforma w pełni wspierająca muzykę AI, a stała roczna opłata pozwala na publikację nieograniczonej liczby utworów — idealne rozwiązanie do testowania demówek.
▶️ 7% zniżki na DistroKid (mój kod polecający) →
※ Klikając w link, otrzymasz 7% zniżki na pierwszą subskrypcję, a ja otrzymam drobną prowizję, która wspiera działanie Sonetho.
Śmiało korzystajcie! 🙏
📊 Podsumowanie — nasza uczciwa opinia
✅ v1 → v2: Wyraźny skok jakościowy
Barwa wokalu, dobór instrumentów i redukcja szumów — w tych trzech aspektach widać ogromny progres.
Obietnica "improved quality and better adherence to your prompt" została w pełni spełniona.
⚠️ vs Suno v5.5: Nadal widać dystans
Suno pozostaje liderem jako model wyspecjalizowany wyłącznie w generowaniu muzyki.
ElevenLabs Music potrzebuje jeszcze trochę czasu, aby dogonić konkurencję.
💡 Prawdziwa siła ElevenLabs leży w ekosystemie
TTS, klonowanie głosu, efekty dźwiękowe (SFX), Studio (audiobooki) i muzyka — możliwość obsługi narracji, efektów i podkładu w jednym workflow to wartość, której Suno nie posiada.
Dla twórców wideo, podcastów czy audiobooków ta integracja jest ważniejsza niż sama czystość brzmienia muzyki. Będziemy dalej zgłębiać te możliwości.
🎵 Skoro porównanie 9 utworów już za nami — czas stworzyć coś samodzielnie
Niezależnie od tego, który model przypadł Ci do gustu, ElevenLabs Music v2 najlepiej ocenisz, gdy sam go wypróbujesz. Skorzystaj z 50% zniżki w pierwszym miesiącu dla nowych użytkowników i przepuść ten sam tekst przez własne ręce.
Wypróbuj ElevenLabs Music v2 samodzielnie →
🔮 Następny eksperyment: Dynamiczna zmiana gatunku
Music v2 chwali się kolejną funkcją — płynną zmianą gatunku wewnątrz utworu — i to właśnie sprawdzimy w następnym materiale.
Przeprowadzimy porównanie "Opera → Heavy Metal" w obu modelach, testując, który z nich lepiej radzi sobie z tak karkołomnym wyzwaniem.
Będzie to jeden z naszych najciekawszych testów, więc bądźcie czujni! 🎬
📚 Warto przeczytać
Koniecznie dajcie znać w komentarzach, co myślicie po przesłuchaniu tych utworów!
Jestem bardzo ciekaw, który model przypadł Wam do gustu najbardziej. 🎵
Sonetho ⚡