Najnowsze Wiadomości (PL)

Zaktualizowane narzędzie Google tworzy trzyminutowe kompozycje muzyczne w aplikacji Gemini

Lyria 3 Pro
Foto: Lyria 3 Pro - Divulgação

Google wypuściło Lyria 3 Pro, zaktualizowaną wersję swojego modelu sztucznej inteligencji, którego zadaniem jest generowanie kompozycji audio i dźwiękowych. Główna zmiana techniczna narzędzia polega na zwiększeniu limitu czasu dla każdego utworu, który w poprzedniej generacji wzrósł z trzydziestu sekund do maksymalnie trzech minut. Nowa funkcja zaspokaja zapotrzebowanie twórców treści i producentów cyfrowych na obszerniejsze i kompletne materiały. Dostęp początkowy następuje stopniowo dla użytkowników, którzy mają opłaconą subskrypcję aplikacji Gemini.

Zwiększeniu długości ścieżek towarzyszy ulepszenie architektury modelu, która teraz z większą precyzją przetwarza polecenia tekstowe w celu ustrukturyzowania kompozycji. Firma zintegrowała technologię z różnymi aspektami swojego ekosystemu korporacyjnego, umożliwiając specjalistom zajmującym się redagowaniem i twórcom oprogramowania korzystanie ze sztucznej inteligencji bezpośrednio w swoich przepływach pracy. Przetwarzanie odbywa się na dedykowanych serwerach, co gwarantuje dostarczenie plików z wokalem, instrumentacją i jakością studyjną w ciągu kilku sekund od wejścia do monitu.

Capacidade rozszerzone przetwarzanie i strukturyzacja dźwięku

Przejście z trzydziestu sekund do trzech minut stanowi znaczący skok obliczeniowy w segmencie generatywnego dźwięku. Lyria 3 Pro udaje się zachować spójność harmoniczną i rytmiczną na całej długości ścieżki, unikając zniekształceń lub strat jakości, które zwykle występują w długich pokoleniach. System analizuje żądanie użytkownika i buduje muzykę warstwa po warstwie, łącząc w zsynchronizowany sposób bity, melodie tła i głosy syntetyczne.

Użytkownicy mają kontrolę nad strukturą utworu za pomocą szczegółowych poleceń tekstowych. Model zawiera szczegółowe instrukcje dotyczące podziału utworu na tradycyjne bloki, takie jak wstęp, zwrotki, łączniki i refreny. Segmentacja Essa ułatwia tworzenie ścieżek zgodnych ze standardami komercyjnymi lub eksperymentalnymi, w zależności od potrzeb projektu. Sztuczna inteligencja dostosowuje przejścia pomiędzy tymi partiami tak, aby zmiana rytmu brzmiała naturalnie dla Twoich uszu.

Testerzy muzyki i wersji beta Produtores zgłosili, że narzędzie skutecznie reaguje na złożone zapytania dotyczące aranżacji i gatunków muzycznych. Można poprosić o miksowanie różnych stylów w tym samym utworze lub zmienić intensywność instrumentów w określonych momentach utworu. Przetwarzanie języka naturalnego przez system przekłada terminy techniczne z teorii muzyki na praktyczne wyniki dźwiękowe, redukując czas spędzony na tworzeniu szkiców lub podkładów.

Integração z ekosystemem aplikacji i usług

Dystrybucja Lyria 3 Pro odbywa się na wielu platformach obsługiwanych przez Google. Na rynku konsumenckim abonenci zaawansowanych planów Gemini uzyskują dostęp do interfejsu tworzenia bezpośrednio za pośrednictwem aplikacji lub przeglądarki. Para dla sektora przedsiębiorstw i rozwoju, firma wypuściła model AI Google na Studio i poprzez API Gemini. Otwartość Essa umożliwia programistom tworzenie aplikacji innych firm, które wykorzystują silnik audio Google do generowania muzyki na żądanie w innych interfejsach.

Korporacje i studia kreatywne Grandes mają dostęp za pośrednictwem Vertex AI, firmowej platformy uczenia maszynowego w chmurze. Model Além został natywnie włączony do Google Vids, aplikacji do edycji wideo przeznaczonej na komputery stacjonarne, oraz ProducerAI, środowiska współpracy do produkcji muzycznej. Obecność narzędzia w tych programach eliminuje konieczność wyszukiwania ścieżek dźwiękowych w zewnętrznych bankach audio.

Wszechstronność modelu służy różnym niszom na rynku rozrywki audiowizualnej i cyfrowej. Szybkie generowanie strukturalnego dźwięku optymalizuje harmonogram projektów wymagających dużej ilości oryginalnego materiału dźwiękowego.

  • Criação ekskluzywnych ścieżek dźwiękowych do filmów instruktażowych i vlogów korporacyjnych.
  • Desenvolvimento winiet i muzyki przejściowej do odcinków podcastów.
  • Geração efektów i dynamicznej muzyki w tle dla sektora gier.
  • Produção materiałów audio na dużą skalę do cyfrowych kampanii reklamowych.

Integracja z już ustalonymi przepływami pracy demonstruje strategię Google polegającą na pozycjonowaniu narzędzi generatywnych jako praktycznych narzędzi. Edytorzy marketingu i wideo Profissionais mogą wybrać pożądany nastrój sceny i uzyskać ścieżkę idealnie dopasowaną do materiału wizualnego.

Bezpieczeństwo Mecanismos i ochrona praw autorskich

Postęp technologii generowania dźwięku wywołuje debaty na temat praw autorskich i niewłaściwego wykorzystania własności intelektualnej. Para Aby złagodzić to ryzyko, Google wdrożył rygorystyczne filtry bezpieczeństwa w Lyria 3 Pro. System blokuje próby klonowania głosów prawdziwych piosenkarzy i uniemożliwia modelowi tworzenie bezpośrednich kopii muzyki chronionej prawem autorskim. Quando użytkownik wpisuje w poleceniu nazwisko znanego artysty, sztuczna inteligencja interpretuje wzmiankę jedynie jako odniesienie do stylu lub gatunku, bez imitowania tożsamości wokalnej danej osoby.

Przyjętym przez firmę środkiem bezpieczeństwa Outra jest zastosowanie SynthID na wszystkich ścieżkach generowanych przez platformę. Technologia Essa osadza niewidzialny i niesłyszalny cyfrowy znak wodny bezpośrednio w widmie audio pliku. Marker jest odporny na edycję, kompresję i zmiany formatu, umożliwiając oprogramowaniu weryfikacyjnemu identyfikację syntetycznego pochodzenia materiału. Inicjatywa ma na celu promowanie przejrzystości w korzystaniu z mediów i zwalczanie dezinformacji lub oszustw związanych z fałszywym dźwiękiem.

Kontrole bezpieczeństwa odbywają się w czasie rzeczywistym podczas szybkiego przetwarzania. Jeśli system wykryje, że żądanie narusza wytyczne dotyczące użytkowania lub próbuje ominąć zabezpieczenia praw autorskich, generowanie zostaje natychmiast zatrzymane. Google utrzymuje zespoły zajmujące się ciągłą aktualizacją tych filtrów, zgodnie z obowiązującymi przepisami dotyczącymi sztucznej inteligencji w różnych krajach.

Impacto na rynku tworzenia treści cyfrowych

Prace nad modelem Lyria 3 Pro obejmowały udział profesjonalnych muzyków, inżynierów dźwięku i producentów w fazie szkolenia modelu. Współpraca techniczna Essa zapewniła, że ​​sztuczna inteligencja zrozumiała niuanse harmonii, progresji akordów i miksowania. Praktycznym rezultatem jest narzędzie dostarczające zbalansowane pliki audio, w których wokale nie nakładają się nieprawidłowo na instrumenty bazowe.

Dostępność kompletnych trzyminutowych kompozycji zmienia dynamikę pracy niezależnych twórców. Profile wideo i media społecznościowe Canais zyskują autonomię w zakresie tworzenia własnych utworów, zmniejszając koszty licencji na muzykę komercyjną. Model pełni funkcję asystenta kompozycji, umożliwiając artystom szybkie testowanie progresji i aranżacji przed nagraniem ostatecznej wersji w studiu z udziałem prawdziwych instrumentów.

Google utrzymuje cykl iteracyjnych aktualizacji modelu w oparciu o ilość danych generowanych przez użytkowników i opinie społeczności programistów. Rozwój mocy przetwarzania dźwięku konsoliduje infrastrukturę firmy w sektorze generatywnej sztucznej inteligencji, konkurując bezpośrednio z innymi platformami nastawionymi na kreatywne rozwiązania dla rynku korporacyjnego i konsumenta końcowego.