Nejnovější Zprávy (CS)

Aktualizovaný nástroj Google vytváří tříminutové hudební kompozice v aplikaci Gemini

Lyria 3 Pro
Foto: Lyria 3 Pro - Divulgação

Google vydala Lyria 3 Pro, aktualizovanou verzi svého modelu umělé inteligence zaměřeného na generování zvuku a zvukových kompozic. Hlavní technická změna nástroje spočívá ve zvýšení časového limitu pro každou stopu, který se z třiceti sekund u předchozí generace dostal až na tři souvislé minuty. Nová funkce uspokojuje poptávku tvůrců obsahu a digitálních producentů po rozsáhlejších a kompletnějších materiálech. K počátečnímu přístupu dochází postupně u uživatelů, kteří mají předplatné aplikace Gemini.

Pokrok v délkách stop doprovází vylepšení architektury modelu, který nyní zpracovává textové příkazy s větší přesností pro strukturování kompozic. Společnost integrovala technologie do různých aspektů svého podnikového ekosystému, což umožňuje profesionálům v oblasti úprav a vývojářům softwaru používat umělou inteligenci přímo ve svých pracovních postupech. Zpracování probíhá na dedikovaných serverech, což zaručuje doručení souborů s vokály, instrumentací a studiovou kvalitou během několika sekund po zadání výzvy.

Capacidade rozšířilo zpracování a strukturování zvuku

Přechod z třiceti sekund na tři minuty představuje významný výpočetní skok v segmentu generativního audia. Lyria 3 Pro dokáže udržet harmonickou a rytmickou koherenci po celé délce stopy, čímž se vyhýbá zkreslení nebo ztrátám kvality, ke kterým obvykle dochází u delších generací. Systém analyzuje požadavek uživatele a vytváří hudbu vrstvu po vrstvě, přičemž synchronizovaným způsobem kombinuje beaty, melodie na pozadí a syntetické hlasy.

Uživatelé mají kontrolu nad strukturou skladby prostřednictvím podrobných textových příkazů. Model obsahuje specifické instrukce pro rozdělení skladby do tradičních bloků, jako jsou úvod, sloky, mosty a sbory. Segmentace Essa usnadňuje vytváření stop, které se řídí komerčními nebo experimentálními standardy, v závislosti na potřebě projektu. Umělá inteligence upravuje přechody mezi těmito částmi tak, aby změna rytmu zněla vašim uším přirozeně.

Hudební a beta testeři Produtores uvedli, že nástroj efektivně reaguje na složité požadavky na hudební aranžmá a žánry. Je možné požádat o míchání různých stylů na stejné stopě nebo změnit intenzitu nástrojů v konkrétních okamžicích skladby. Zpracování přirozeného jazyka systému převádí technické termíny z hudební teorie do praktických zvukových výsledků, čímž zkracuje čas strávený vytvářením skic nebo doprovodných stop.

Integração s ekosystémem aplikací a služeb

Distribuce Lyria 3 Pro probíhá na více platformách spravovaných Google. Na spotřebitelském trhu mají předplatitelé pokročilých plánů Gemini přístup k rozhraní pro vytváření přímo prostřednictvím aplikace nebo prohlížeče. Para podnikový a vývojový sektor, společnost vydala model Google AI na Studio a prostřednictvím Gemini API. Otevřenost Essa umožňuje programátorům vytvářet aplikace třetích stran, které využívají zvukový engine Google ke generování hudby na vyžádání v jiných rozhraních.

Korporace a kreativní studia Grandes mají přístup prostřednictvím Vertex AI, firemní cloudové platformy strojového učení. Model Além byl nativně začleněn do Google Vids, aplikace pro úpravu videa zaměřené na stolní počítače, a ProducerAI, prostředí pro spolupráci pro hudební produkci. Přítomnost nástroje v těchto softwarech eliminuje potřebu hledat zvukové stopy v externích audio bankách.

Všestrannost modelu slouží různým mezerám na trhu audiovizuální a digitální zábavy. Rychlé generování strukturovaného zvuku optimalizuje plán pro projekty, které vyžadují velký objem originálního zvukového materiálu.

  • Criação exkluzivních zvukových stop pro výuková videa a firemní vlogy.
  • Desenvolvimento vinět a přechodové hudby pro epizody podcastů.
  • Geração efektů a dynamické hudby na pozadí pro herní sektor.
  • Produção zvukového materiálu v měřítku pro digitální reklamní kampaně.

Integrace s již zavedenými pracovními postupy demonstruje strategii Google umístit své generativní nástroje jako praktické nástroje. Marketingoví a video editoři Profissionais mohou vytočit požadovanou náladu pro scénu a získat stopu dokonale načasovanou k vizuálnímu materiálu.

Zabezpečení Mecanismos a ochrana autorských práv

Pokrok technologií generování zvuku vyvolává debaty o autorských právech a zneužívání duševního vlastnictví. Para Pro zmírnění těchto rizik implementoval Google do Lyria 3 Pro přísné bezpečnostní filtry. Systém blokuje pokusy o klonování hlasů skutečných zpěváků a zabraňuje modelu produkovat přímé kopie hudby chráněné autorskými právy. Quando uživatel zadá do příkazu jméno slavného umělce, umělá inteligence interpretuje zmínku pouze jako odkaz na styl nebo žánr, aniž by napodobovala hlasovou identitu osoby.

Bezpečnostní opatření Outra přijaté společností je aplikace SynthID na všech stopách generovaných platformou. Technologie Essa vkládá neviditelný a neslyšitelný digitální vodoznak přímo do zvukového spektra souboru. Popisovač odolává úpravám, kompresi nebo změnám formátu, což umožňuje ověřovacímu softwaru identifikovat syntetický původ materiálu. Iniciativa si klade za cíl podporovat transparentnost ve spotřebě médií a bojovat proti dezinformacím nebo podvodům zahrnujícím falešný zvuk.

Bezpečnostní kontroly probíhají v reálném čase během rychlého zpracování. Pokud systém zjistí, že požadavek porušuje pokyny k použití nebo se pokouší obejít ochranu autorských práv, generování se okamžitě zastaví. Google udržuje týmy věnované neustálé aktualizaci těchto filtrů v souladu s aktuálními předpisy o umělé inteligenci v různých zemích.

Impacto na trhu tvorby digitálního obsahu

Vývoj Lyria 3 Pro zahrnoval účast profesionálních hudebníků, zvukařů a producentů během tréninkové fáze modelu. Technická spolupráce Essa zajistila, že umělá inteligence pochopila nuance harmonie, progrese akordů a míchání. Praktickým výsledkem je nástroj, který přináší vyvážené zvukové soubory, kde se zpěv nepřekrývá nesprávně se základními nástroji.

Dostupnost kompletních tříminutových skladeb mění pracovní dynamiku nezávislých tvůrců. Video profily Canais a profily na sociálních sítích získávají autonomii pro produkci vlastních skladeb, čímž se snižují licenční náklady na komerční hudbu. Model funguje jako asistent kompozice a umožňuje umělcům rychle otestovat postup a aranžmá před nahráním finální verze ve studiu se skutečnými nástroji.

Google udržuje cyklus iterativních aktualizací modelu na základě objemu dat generovaných uživateli a zpětné vazby od vývojářských komunit. Rozšíření kapacity zpracování zvuku konsoliduje infrastrukturu společnosti v sektoru generativní umělé inteligence, přímo konkuruje ostatním platformám zaměřeným na kreativní řešení pro korporátní trhy a trhy koncových spotřebitelů.