ElevenLabs Music v2: co się aż tak poprawiło? 4 zmiany, które usłyszysz od razu

W maju 2026 r. ElevenLabs zaprezentowało nową generację modelu muzycznego Music v2. Główne ulepszenia obejmują: ① większą kontrolę nad kompozycją, ② wyższą jakość dźwięku, ③ płynne przejścia między gatunkami w jednym utworze oraz ④ stabilniejszą generację wielojęzyczną. Nie ograniczamy się tylko do oficjalnych zapowiedzi – w kolejnym artykule przedstawimy bezpośrednie porównanie v1 vs v2, aby sprawdzić, jak te funkcje sprawdzają się w praktyce.

"Od opery po heavy metal – naturalne przejścia między gatunkami w jednym utworze."
ElevenLabs ogłasza premierę nowej generacji modelu muzycznego: Music v2.

Witajcie w Sonetho! ⚡

27 maja 2026 r. firma ElevenLabs oficjalnie zaprezentowała swój najnowszy model muzyczny – Music v2. To przełomowa aktualizacja, wydana zaledwie cztery miesiące po debiucie Music v1. Według oficjalnych zapewnień jest to "wielki krok naprzód pod względem jakości, możliwości kontroli oraz kreatywności".

Dziś podsumowujemy najważniejsze ulepszenia wprowadzone w wersji v2 oraz przedstawiamy plan testów, które przeprowadzimy w naszym zespole. Wyniki naszych eksperymentów wraz z pakietem utworów demonstracyjnych udostępnimy w kolejnym artykule.

 


🎯 4 filary nowej generacji v2 (według oficjalnej specyfikacji)

 

1. Wysoki poziom sterowalności (Highly Steerable Generation)

Oficjalny komunikat: "Model został zaprojektowany tak, by precyzyjnie reagować na szczegółowe polecenia kreatywne, takie jak szybki rap, skomplikowane frazowanie wokalne czy nagłe zmiany stylu, artykulacji i instrumentarium."

Nasz punkt obserwacji: W v1 szczegółowe prompty często kończyły się efektem "podobnym w klimacie". W v2 sprawdzimy, czy model faktycznie realizuje nasze instrukcje z zegarmistrzowską precyzją.

 

2. Ulepszona jakość dźwięku (Improved Sound by Default)

Oficjalny komunikat: "Poprawiono jakość wokali, aranżacji instrumentów oraz dynamikę wykonania. Rezultaty prosto z modelu brzmią bardziej profesjonalnie (polished), ekspresyjnie i angażująco."

Nasz punkt obserwacji: Sprawdzimy, czy bez konieczności dopracowywania promptów, domyślna jakość v2 przewyższa v1 w bezpośrednim teście porównawczym.

 

3. Przejścia między gatunkami (Genre Transitions)

Oficjalny komunikat: "Model potrafi płynnie łączyć zupełnie różne gatunki w obrębie jednego utworu, np. operę z heavy metalem, utrzymując pełną spójność muzyczną. Bez potrzeby ręcznego cięcia (splicing)."

Nasz punkt obserwacji: Jeśli to prawda, workflow tworzenia muzyki w tle (BGM) zmieni się radykalnie. Przetestujemy, czy te przejścia są rzeczywiście naturalne i pozbawione artefaktów czy nagłych "skoków".

 

4. Generowanie wielojęzyczne (Multilingual Generation)

Oficjalny komunikat: "Zwiększono możliwości generowania muzyki w wielu językach, dzięki czemu teksty, wokale i aranżacje działają znacznie stabilniej w językach ojczystych."

Nasz punkt obserwacji: To kluczowe dla twórców operujących na różnych rynkach. Przetestujemy, czy v2 wyeliminowało problemy z obcym akcentem w języku polskim, które zdarzały się w poprzedniej wersji.

 


💡 Dla kogo ta aktualizacja jest najważniejsza?

Oto nasze przypuszczenia (które zweryfikujemy w testach):

  • Kompozytorzy tworzący dema w stylu Pop/Modern Charts — jeśli narzekaliście na brzmienie wokalu w wersji v1, wyniki testów v2 są właśnie dla Was.

  • Twórcy muzyki do YouTube Shorts/Reels — jeśli obietnica płynnego łączenia gatunków w jednym tracku się sprawdzi, produkcja 30-sekundowych, angażujących podkładów stanie się błyskawiczna.

  • Użytkownicy szukający alternatywy dla Suno/Udio — z planem Creator (22 USD miesięcznie) zyskujecie dostęp do pełnego ekosystemu: PVC, dubbingu, Music v2, Studio oraz agentów w jednym miejscu.

 


🎵 Wypróbuj już teraz (Pierwsze wrażenia)

Model Music v2 jest już dostępny bezpośrednio w aplikacji ElevenMusic. Możecie go przetestować, korzystając ze swoich kredytów.

Przetestuj v2 w ElevenMusic →

 


🔬 Zapowiedź: Wielkie porównanie v1 vs v2

Nie bierzemy obietnic na słowo. W naszym zespole przygotowaliśmy ten sam tekst + ta sama struktura + 3 różne style muzyczne, aby porównać oba modele jeden do jednego.

  • Wspólny tekst w języku angielskim — testujemy realizację znaczników struktury ([Intro], [Verse], [Chorus], [Outro]).

  • 3 gatunki — Synthwave (separacja wokalu), Modern Alt Rock (separacja instrumentów), R&B/Neo-Soul (detale wokalne).

  • 6 utworów — bezpośrednie zestawienie v1 i v2 w identycznych warunkach.

  • Kluczowe kryteria oceny — złożoność wokalu, separacja instrumentów oraz rozpoznawalność struktury utworu.

W następnym wpisie udostępnimy cały pakiet testowy, abyście sami mogli usłyszeć różnicę. 🔔

 


📚 Warto przeczytać

 

Owocnej twórczości!
Sonetho ⚡