News (NO)

Google-oppdateringen utvider musikkskaping med kunstig intelligens til tre minutter lange spor

Lyria 3 Pro
Foto: Lyria 3 Pro - Divulgação

Google har introdusert en ny versjon av sitt AI-baserte lydgenereringsverktøy, som markerer et betydelig fremskritt innen full-track produksjon. Teknologien lar nå brukere utvikle komposisjoner med lengre varighet, og overvinne de tekniske begrensningene som finnes i tidligere utgaver av systemet.

Oppdateringen utvider opprettelseskapasiteten fra bare tretti sekunder til opptil tre sammenhengende minutter med behandlet lyd. Essa mudança atende a uma demanda crescente de produtores de conteúdo e profissionais do setor audiovisual que buscam trilhas sonoras originais e de rápida execução para seus projetos diários.

Tilgang til denne nye funksjonaliteten skjer gradvis, med et første fokus på abonnenter på selskapets premiumplattformer. Systemintegrasjonen dekker flere applikasjoner fra teknologigigantens økosystem, og letter arbeidsflyten til de som allerede bruker disse verktøyene til redigering og kreativ utvikling.

Evne til å forstå strukturelle og detaljerte kommandoer

Den oppdaterte modellen introduserer betydelige forbedringer i måten kunstig intelligens tolker strukturen til en musikalsk komposisjon. Brukere kan spesifisere nøyaktige tekniske elementer gjennom enkle tekstkommandoer, som beskriver nøyaktig hvor rytme- og melodiendringer skal skje.

Denne funksjonaliteten tillater en klar definisjon av introduksjoner, refrenger, vers og broer innenfor samme genererte spor. Verktøyet behandler disse instruksjonene for å levere et resultat som opprettholder lydsammenheng gjennom hele forestillingen, og unngår brå pauser eller frakoblede overganger mellom ulike deler av sangen.

Fagfolk som allerede har testet teknologien, rapporterer et nøyaktig svar på komplekse forespørsler om instrumentale arrangementer og vokalstiler. Avansert prosessering sikrer at lydkvaliteten forblir høy, og leverer tekster og instrumentering som flyter naturlig og passer til den musikalske sjangeren som ble bedt om i den første kommandoen.

Integrasjon med økosystemet av applikasjoner og tjenester

Utvidelsen av tilgangen til verktøyet skjer gjennom plattformer som allerede er etablert i teknologi- og utviklingsmarkedet. Betalte abonnenter på selskapets flaggskip-app er de første som opplever progressiv generasjon av lengre spor direkte på sine mobile enheter og personlige datamaskiner.

Programvareutviklere får også dedikert støtte gjennom spesifikke programmeringsmiljøer og applikasjonsgrensesnitt. Essa teknisk åpenhet gjør det mulig å lage tilpassede løsninger og integrere lydmotoren i tredjepartsapplikasjoner som krever lydgenerering på forespørsel.

Store selskaper og produksjonsstudioer får strukturert bedriftstilgang, noe som muliggjør storskala bruk av teknologien. Aplicativos rettet mot redigering av bedriftsvideoer og samarbeidende musikkproduksjonsplattformer har allerede verktøyet innebygd i sine hovedredigeringsgrensesnitt.

Disse direkte forbindelsene eliminerer behovet for å bytte mellom ulike programmer under den audiovisuelle opprettelsesprosessen. Profesjonelle kan starte et videoprosjekt, be om det ideelle lydsporet for scenen og fullføre redigeringen i det samme digitale arbeidsmiljøet, og optimalisere leveringstiden.

Verktøy for åpenhet og opphavsrettsbeskyttelse

Fremskritt innen lydgenerering ved bruk av kunstig intelligens er ledsaget av strenge tekniske tiltak for å forhindre krenkelse av intellektuelle egenskaper og beskytte arbeidet til menneskelige kunstnere. Selskapet implementerte et avansert filtersystem som virker direkte i tekstkommandobehandlingsfasen, og hindrer modellen i å kopiere eller imitere spesifikke stemmer og stiler til ekte sangere og band. Quando en bruker skriver inn navnet på en kjent artist i forespørselen, systemet blokkerer nøyaktig replikering og bruker informasjonen kun som en fjern referanse til sjanger eller musikalsk atmosfære, og sikrer at det endelige resultatet er et helt nytt verk og fri for direkte plagiering.

I tillegg til forebyggende blokkering, mottar alle komposisjoner generert av plattformen et usynlig digitalt vannmerke innebygd direkte i lydfilen. Essa sporingsteknologi påvirker ikke lydkvaliteten eller lytteopplevelsen, men lar verifiseringsprogramvare umiddelbart identifisere den syntetiske opprinnelsen til materialet. Adopsjonen av denne identifiseringsstandarden møter de økende kravene til åpenhet i det digitale markedet, og sikrer at distribusjonsplattformer, sosiale nettverk og lyttere vet hvordan de klart skiller mellom en sang produsert av et menneske og et spor laget av maskinlæringsalgoritmer.

Praktiske anvendelser i det audiovisuelle markedet

Muligheten til å generere tre sammenhengende minutter med lyd forvandler verktøyets nytte for skapere av digitalt innhold. Produtores av videoer for internett, de ansvarlige for podcaster og uavhengige spillutviklere finner teknologi som et raskt alternativ for å møte den konstante etterspørselen etter originale lydspor uten komplikasjoner med tradisjonell lisensiering.

Smidigheten i opprettelsesprosessen gjør at reklamebyråer kan teste flere varianter av jingler og musikalsk bakgrunn for kampanjer i løpet av få minutter. Essa-fleksibilitet reduserer forhåndskostnader for preproduksjon og tilbyr et større utvalg av kreative alternativer før endelig godkjenning av et kommersielt eller underholdningsprosjekt.

Teknisk utvikling og faglig samarbeid

Utviklingen av den kunstige intelligensmotoren som er ansvarlig for denne nye musikkgenerasjonskapasiteten krevde en kompleks opplæringsprosess, basert på direkte samarbeid med eksperter fra musikkindustrien. Engenheiros av programvare jobbet sammen med profesjonelle musikere, studioprodusenter og musikkteoretikere for å lære algoritmen det grunnleggende om rytme, harmoni, melodi og akkordprogresjon. Esse felles innsats resulterte i en modell som er i stand til å forstå ikke bare grunnleggende musikkteori, men også de emosjonelle og strukturelle nyansene som gjør et spor behagelig for det menneskelige øret. Systemarkitekturen har blitt redesignet for å støtte behandling av lange sekvenser med lyddata uten å miste kohesjon, en betydelig teknisk utfordring innen generativ kunstig intelligens. Kontinuerlig prosessering sikrer at instrumentene opprettholder riktig innstilling og at takten ikke gjennomgår uønskede variasjoner gjennom den tre minutter lange spilletid, og setter en ny standard for stabilitet for kommersielt tilgjengelige automatiserte lydskapingsverktøy.

Uthevede systemfunksjoner

Det nye betjeningsgrensesnittet for kunstig intelligens ble designet for å forenkle tilgangen til avanserte komposisjonsfunksjoner, slik at selv brukere uten formell kunnskap om musikkteori kan oppnå profesjonelle resultater. Systemet behandler en rekke strukturelle parametere som garanterer fullstendig tilpasning av det genererte sporet i henhold til de spesifikke behovene til hvert audiovisuelt prosjekt.

– Definição trenger introer, vers og refrenger via tekstkommandoer.

– Innebygd Suporte for komplekse overganger mellom forskjellige deler av sangen.

– Geração med spor optimalisert for vlogger, podcaster og opplæringsvideoer.

– Processamento samtidig vokal, tekst og instrumentalarrangement.

Tilgjengelighet for allmennheten

Tilgang til musikkgenereringsverktøyet følger en gradvis utgivelsesplan strukturert av teknologiselskapet. Brukere som har aktive abonnementer på de mest avanserte planene i kunstig intelligens-økosystemet kan nå bruke ressursene i henhold til daglige behandlingsgrenser som er etablert for hver kontokategori.

Den kontinuerlige utvidelsen av tjenesten forutsetter inkludering av nye funksjoner og justeringer basert på direkte tilbakemeldinger fra første brukere. Utviklingsteamet overvåker konstant algoritmens ytelse for å avgrense lydkvaliteten og optimalisere serverens responstider mens de oppretter fullførte spor.