Google llança una nova intel·ligència artificial que genera cançons de tres minuts per als subscriptors

    Categories: News (CA)
Lyria 3 Pro

Lyria 3 Pro - Divulgação

El gegant tecnològic nord-americà va anunciar l’expansió de la seva plataforma de generació d’àudio basada en l’aprenentatge automàtic, que permetrà la creació de composicions completes. L’actualització augmenta el límit de temps de les pistes, abans restringits a seccions curtes, per satisfer la demanda dels productors audiovisuals i creadors de continguts. L’accés inicial és per als usuaris dels paquets premium de l’empresa.

El canvi tècnic amplia la capacitat de processament de trenta segons fins a tres minuts continus de música. El canvi estructural Essa té com a objectiu proporcionar bandes sonores originals ràpidament, eliminant llargs períodes de cerca als bancs d’àudio tradicionals. Profissionais l’edició de vídeo, els desenvolupadors de jocs i els productors de podcasts representen el principal públic objectiu d’aquesta nova fase de l’eina.

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

La integració tecnològica es produeix de manera nativa dins de l’ecosistema d’aplicacions de l’empresa. Els subscriptors utilitzen ordres de text directament a les interfícies d’edició que ja formen part de la seva rutina. El processament al núvol garanteix que la generació d’àudio es produeixi sense sobrecarregar el maquinari local, mantenint la fluïdesa durant el muntatge de projectes multimèdia complexos.

Capacitat d’entendre ordres estructurals i detallades

El model actualitzat presenta un avenç en la interpretació de la teoria musical per part de l’algorisme. Els usuaris tenen la capacitat d’especificar elements tècnics precisos mitjançant descripcions de text, indicant els moments exactes dels canvis de tempo, la inserció de nous instruments i les variacions de la melodia.

Aquesta funcionalitat permet construir temes amb introduccions, versos, cors i ponts ben definits. L’eina processa instruccions seqüencials per lliurar un fitxer final que preserva la coherència del so, evitant talls bruscos o transicions artificials entre diferents seccions de la composició generada.

Integració directa amb plataformes d’edició i desenvolupament

L’ampliació de l’accés a l’eina es produeix a través de serveis ja consolidats en el mercat tecnològic. Els subscriptors del pla de pagament experimenten la generació progressiva d’àudio directament als seus dispositius mòbils i ordinadors, sense necessitat d’instal·lar programari addicional de tercers.

Els desenvolupadors de programari reben suport tècnic mitjançant interfícies de programació d’aplicacions dedicades. L’obertura Essa permet la creació de solucions personalitzades i la incorporació del motor d’àudio en sistemes corporatius que requereixen una generació de so a gran escala per a campanyes publicitàries.

Els grans estudis de producció audiovisual accedeixen a un entorn estructurat per a l’ús de la tecnologia. Aplicativos destinats a l’edició de vídeos corporatius ja tenen l’eina integrada als seus panells principals, optimitzant el flux de treball dels equips de postproducció.

Eines de transparència i protecció de la propietat intel·lectual

L’avenç en la generació d’àudio sintètic inclou la implementació de mesures tècniques per evitar la infracció dels drets d’autor. L’empresa va desenvolupar un sistema de filtre que funciona en la fase de processament d’ordres, evitant la còpia de veus i estils específics d’artistes reals.

Quan un usuari introdueix el nom d’un músic famós a la sol·licitud de generació, el sistema bloqueja la rèplica exacta. La informació s’utilitza només com a referència de gènere musical o ambient sonor, assegurant que el resultat és una obra original lliure de plagi directe.

Totes les composicions generades per la plataforma reben una marca d’aigua digital invisible incrustada al fitxer d’àudio. La tecnologia de seguiment Essa no altera la qualitat del so, però permet que el programari de verificació identifiqui l’origen sintètic del material en qüestió de segons.

L’adopció d’aquest estàndard d’identificació respon als requisits de transparència del mercat digital. Plataformas La distribució de música i les xarxes socials poden diferenciar clarament entre una pista produïda per un humà i una composició creada per algorismes d’aprenentatge automàtic.

Aplicacions pràctiques al mercat de la producció audiovisual

La capacitat de generar tres minuts continus d’àudio transforma la dinàmica de treball dels creadors de contingut digital i agències de comunicació. Produtores de vídeos per a Internet i desenvolupadors de jocs independents troben la tecnologia una alternativa eficient per satisfer la demanda de bandes sonores originals. L’ús del sistema elimina les complicacions legals i els costos associats a la llicència tradicional de música amb drets d’autor, accelerant el procés de publicació de materials audiovisuals en diferents plataformes en línia.

L’agilitat en el procés de creació permet als equips de màrqueting provar múltiples variacions de fons musicals per a campanyes publicitàries en un curt espai de temps. La flexibilitat operativa de Essa redueix els costos inicials de preproducció i ofereix un ventall més gran d’opcions creatives abans de l’aprovació final d’un projecte comercial. La possibilitat d’ajustar el to i el ritme de la música segons l’edició visual del vídeo proporciona un nivell de personalització que abans requeria la contractació de compositors dedicats per a cada peça publicitària.

Desenvolupament tècnic i col·laboració amb la indústria discogràfica

L’evolució del motor d’intel·ligència artificial responsable d’aquesta nova capacitat de generació musical va requerir un procés de formació rigorós, basat en la col·laboració directa amb experts de la indústria musical. Engenheiros de programari va treballar juntament amb músics professionals, productors d’estudis i teòrics de la música per ensenyar a l’algoritme els fonaments essencials del ritme, l’harmonia, la melodia i la progressió d’acords. L’esforç conjunt de Esse va donar com a resultat un model capaç d’entendre la teoria musical bàsica i les estructures que fan que una pista estigui cohesionada amb l’oïda humana. L’arquitectura del sistema s’ha redissenyat per donar suport al processament de llargues seqüències de dades d’àudio sense perdre l’estabilitat, cosa que suposa un avenç tècnic en el camp de la intel·ligència artificial generativa. El processament continu garanteix que els instruments mantenen l’afinació correcta i que el ritme no pateix variacions no desitjades al llarg dels tres minuts de joc, establint un nou estàndard per a les eines de creació de so automatitzada disponibles al mercat tecnològic.

Característiques destacades del sistema d’àudio

La nova interfície operativa d’intel·ligència artificial va ser dissenyada per simplificar l’accés a les funcions de composició avançades. El sistema processa una sèrie de paràmetres estructurals que garanteixen una personalització completa de la via generada segons les necessitats específiques de cada projecte, incloent les següents capacitats tècniques:

– Definição necessita intros, versos i cors mitjançant ordres de text directes.

– Suporte incorporat per a transicions complexes entre diferents seccions de la cançó sense trencaments de ritme.

– Geração bandes sonores optimitzades per a vlogs, podcasts i vídeos de formació corporatiu.

– Processamento simultània d’arranjaments instrumentals i elements sonors complementaris en una mateixa pista.

Disponibilitat pública i futures actualitzacions

L’accés a l’eina de generació de música segueix un calendari de llançament gradual estructurat per l’empresa tecnològica. Els usuaris que tinguin subscripcions actives a plans més avançats ara poden utilitzar els recursos segons els límits de processament diaris establerts per a cada categoria de compte.

L’ampliació contínua del servei preveu la inclusió de noves funcionalitats basades en el feedback directe dels primers usuaris. L’equip de desenvolupament supervisa el rendiment de l’algorisme per refinar la qualitat de l’àudio i optimitzar el temps de resposta del servidor durant la creació de la pista.