Siste Nytt (NO)

Oppdatert Google-verktøy lager tre-minutters musikalske komposisjoner i Gemini-appen

Lyria 3 Pro
Foto: Lyria 3 Pro - Divulgação

Google har gitt ut Lyria 3 Pro, en oppdatert versjon av sin kunstige intelligens-modell rettet mot å generere lyd- og lydkomposisjoner. Verktøyets viktigste tekniske endring består i å øke tidsgrensen for hvert spor, som gikk fra tretti sekunder i forrige generasjon til opptil tre sammenhengende minutter. Den nye funksjonen møter et krav fra innholdsskapere og digitale produsenter om mer omfattende og komplett materiale. Innledende tilgang skjer gradvis for brukere som har betalt abonnement på Gemini-applikasjonen.

Fremgangen i sporlengder følger med forbedringer i modellens arkitektur, som nå behandler tekstkommandoer med større presisjon for å strukturere komposisjonene. Selskapet har integrert teknologi i ulike aspekter av bedriftens økosystem, slik at fagfolk og programvareutviklere kan bruke kunstig intelligens direkte i arbeidsflytene sine. Behandlingen foregår på dedikerte servere, noe som garanterer levering av filer med vokal, instrumentering og studiokvalitet innen få sekunder etter at du har gått inn i prompten.

Capacidade utvidet lydbehandling og strukturering

Overgangen fra tretti sekunder til tre minutter representerer et betydelig beregningssprang i det generative lydsegmentet. Lyria 3 Pro klarer å opprettholde harmonisk og rytmisk sammenheng gjennom hele lengden av sporet, og unngår forvrengninger eller tap av kvalitet som vanligvis oppstår i lengre generasjoner. Systemet analyserer brukerens forespørsel og bygger musikken lag for lag, og kombinerer beats, bakgrunnsmelodier og syntetiske stemmer på en synkronisert måte.

Brukere har kontroll over strukturen til sangen gjennom detaljerte tekstkommandoer. Modellen inneholder spesifikke instruksjoner for å dele komposisjonen i tradisjonelle blokker, som introduksjon, vers, broer og refrenger. Essa-segmentering gjør det lettere å lage spor som følger kommersielle eller eksperimentelle standarder, avhengig av prosjektets behov. Kunstig intelligens justerer overgangene mellom disse delene slik at endringen av rytme høres naturlig ut for ørene dine.

Produtores musikk- og betatestere rapporterte at verktøyet reagerer effektivt på komplekse forespørsler om musikalske arrangementer og sjangere. Det er mulig å be om blanding av forskjellige stiler på samme spor eller å endre intensiteten til instrumentene på bestemte øyeblikk i sangen. Systemets naturlige språkbehandling oversetter tekniske termer fra musikkteori til praktiske lydresultater, noe som reduserer tiden brukt på å lage skisser eller backing-spor.

Integração med økosystemet av applikasjoner og tjenester

Distribusjon av Lyria 3 Pro skjer på flere plattformer vedlikeholdt av Google. I forbrukermarkedet får abonnenter på Geminis avanserte planer tilgang til opprettelsesgrensesnittet direkte gjennom appen eller nettleseren. Para bedrifts- og utviklingssektoren, har selskapet gitt ut Google AI-modellen på Studio og gjennom Gemini API. Essa-åpenhet lar programmerere bygge tredjepartsapplikasjoner som bruker Google-lydmotoren til å generere musikk på forespørsel i andre grensesnitt.

Grandes-selskaper og kreative studioer har tilgang via Vertex AI, selskapets skymaskinlæringsplattform. Além-modellen har blitt integrert i Google Vids, den skrivebordsfokuserte videoredigeringsapplikasjonen, og ProducerAI, et samarbeidsmiljø for musikkproduksjon. Tilstedeværelsen av verktøyet i denne programvaren eliminerer behovet for å søke etter lydspor i eksterne lydbanker.

Allsidigheten til modellen tjener forskjellige nisjer i det audiovisuelle og digitale underholdningsmarkedet. Rask generering av strukturert lyd optimerer tidsplanen for prosjekter som krever et stort volum av originalt lydmateriale.

  • Criação med eksklusive lydspor for opplæringsvideoer og bedrifts-vlogger.
  • Desenvolvimento av vignetter og overgangsmusikk for podcast-episoder.
  • Geração av effekter og dynamisk bakgrunnsmusikk for spillsektoren.
  • Produção av lydmateriale i stor skala for digitale reklamekampanjer.

Integrasjon med allerede etablerte arbeidsflyter demonstrerer Googles strategi om å posisjonere sine generative verktøy som praktiske verktøy. Profissionais markedsførings- og videoredigerere kan ringe inn ønsket stemning for en scene og få et spor perfekt timet til det visuelle materialet.

Mecanismos sikkerhet og opphavsrettsbeskyttelse

Fremme av lydgenereringsteknologier reiser debatter om opphavsrett og misbruk av åndsverk. Para For å redusere disse risikoene har Google implementert strenge sikkerhetsfiltre i Lyria 3 Pro. Systemet blokkerer forsøk på å klone ekte sangeres stemmer og hindrer modellen i å produsere direkte kopier av opphavsrettsbeskyttet musikk. Quando en bruker skriver inn navnet på en kjent artist i kommandoen, den kunstige intelligensen tolker omtalen bare som en referanse til stil eller sjanger, uten å imitere personens vokale identitet.

Outra sikkerhetstiltak vedtatt av selskapet er bruken av SynthID på alle spor generert av plattformen. Essa-teknologi legger inn et usynlig og uhørbart digitalt vannmerke direkte i lydspekteret til filen. Markøren motstår redigering, komprimering eller formatendringer, slik at verifiseringsprogramvare kan identifisere den syntetiske opprinnelsen til materialet. Initiativet har som mål å fremme åpenhet i medieforbruk og bekjempe feilinformasjon eller svindel som involverer falsk lyd.

Sikkerhetssjekker skjer i sanntid under rask behandling. Hvis systemet oppdager at forespørselen bryter retningslinjer for bruk eller forsøker å omgå opphavsrettslig beskyttelse, stopper genereringen umiddelbart. Google opprettholder team som er dedikert til å kontinuerlig oppdatere disse filtrene, etter gjeldende regelverk om kunstig intelligens i forskjellige land.

Impacto i markedet for digital innholdsskaping

Utviklingen av Lyria 3 Pro inkluderte deltakelse av profesjonelle musikere, lydteknikere og produsenter under modellens treningsfase. Essa teknisk samarbeid sørget for at den kunstige intelligensen forsto nyanser av harmoni, akkordprogresjon og miksing. Det praktiske resultatet er et verktøy som leverer balanserte lydfiler, der vokalen ikke overlapper feil med basisinstrumentene.

Tilgjengeligheten av komplette tre-minutters komposisjoner endrer arbeidsdynamikken til uavhengige skapere. Canais video- og sosiale medier-profiler får autonomi til å produsere sine egne spor, noe som reduserer lisenskostnadene for kommersiell musikk. Modellen fungerer som en komposisjonsassistent, og lar artister raskt teste progresjoner og arrangementer før de spiller inn den endelige versjonen i studio med ekte instrumenter.

Google opprettholder en syklus med iterative oppdateringer av modellen, basert på datavolumet generert av brukere og tilbakemeldinger fra utviklermiljøer. Utvidelsen av lydbehandlingskapasiteten konsoliderer selskapets infrastruktur i sektoren for generativ kunstig intelligens, og konkurrerer direkte med andre plattformer fokusert på kreative løsninger for bedrifts- og sluttforbrukermarkedet.