Google ha presentat una nova versió de la seva eina de generació d’àudio basada en IA, que suposa un avenç significatiu en la producció de pista completa. La tecnologia permet ara als usuaris desenvolupar composicions amb una durada estesa, superant les limitacions tècniques trobades en edicions anteriors del sistema.
L’actualització amplia la capacitat de creació des de només trenta segons fins a tres minuts continus d’àudio processat. Essa mudança atendeu a una demanda creixent de productes de conteúdo i professionals do setor audiovisual que busquem tres sonores originais i de ràpida execució per als seus projectes diaris.
Hi ha pistes més llargues amb Lyria 3 Pro a Gemini!
Des d’experimentar amb diferents estils fins a generar pistes amb transicions complexes, Lyria 3 Pro fa que sigui més fàcil donar vida a la teva visió completa.
S’està llançant avui als usuaris de Google AI Plus, Pro i Ultra.
Més informació 🧵
—Google Gemini (@GeminiApp)25 de març de 2026
L’accés a aquesta nova funcionalitat es fa de manera gradual, amb un enfocament inicial en els subscriptors de les plataformes premium de la companyia. La integració del sistema cobreix múltiples aplicacions de l’ecosistema del gegant tecnològic, facilitant el flux de treball d’aquells que ja utilitzen aquestes eines per a l’edició i el desenvolupament creatiu.
Capacitat d’entendre ordres estructurals i detallades
El model actualitzat introdueix millores substancials en la manera com la intel·ligència artificial interpreta l’estructura d’una composició musical. Els usuaris poden especificar elements tècnics precisos mitjançant ordres de text senzilles, detallant exactament on s’han de produir els canvis de ritme i melodia.
Aquesta funcionalitat permet la definició clara d’introduccions, cors, versos i ponts dins de la mateixa pista generada. L’eina processa aquestes instruccions per oferir un resultat que manté la coherència del so durant tota l’actuació, evitant trencaments bruscos o transicions desconnectades entre diferents parts de la cançó.
Els professionals que ja han provat la tecnologia informen d’una resposta precisa a les demandes complexes sobre arranjaments instrumentals i estils vocals. El processament avançat garanteix que la qualitat de l’àudio es mantingui alta, oferint lletres i instrumentació que flueixen de manera natural i s’adapten al gènere musical sol·licitat a l’ordre inicial.
Integració amb l’ecosistema d’aplicacions i serveis
L’ampliació de l’accés a l’eina es produeix a través de plataformes ja consolidades en el mercat de tecnologia i desenvolupament. Els subscriptors de pagament de l’aplicació insígnia de l’empresa són els primers a experimentar la generació progressiva de pistes més llargues directament als seus dispositius mòbils i ordinadors personals.
Els desenvolupadors de programari també reben suport dedicat mitjançant entorns de programació específics i interfícies d’aplicacions. L’obertura tècnica de Essa permet crear solucions personalitzades i integrar el motor d’àudio en aplicacions de tercers que requereixen la generació de so sota demanda.
Les grans corporacions i els estudis de producció aconsegueixen un accés corporatiu estructurat, que permet l’ús a gran escala de la tecnologia. Aplicativos destinades a editar vídeos corporatius i plataformes de producció musical col·laborativa ja tenen l’eina integrada a les seves interfícies d’edició principals.
Aquestes connexions directes eliminen la necessitat de canviar entre diferents programes durant el procés de creació audiovisual. Els professionals poden iniciar un projecte de vídeo, demanar la banda sonora ideal per a l’escena i acabar l’edició dins del mateix entorn de treball digital, optimitzant el temps de lliurament.
Eines de transparència i protecció dels drets d’autor
Els avenços en la generació d’àudio mitjançant la intel·ligència artificial s’acompanyen de mesures tècniques rigoroses per evitar la infracció de les propietats intel·lectuals i protegir el treball dels artistes humans. L’empresa va implementar un sistema de filtre avançat que actua directament en la fase de processament d’ordres de text, evitant que el model copiï o imiti veus i estils concrets de cantants i bandes reals. Quando un usuari introdueix el nom d’un artista famós a la sol·licitud, el sistema bloqueja la replicació exacta i utilitza la informació només com a referència llunyana de gènere o ambient musical, assegurant que el resultat final és una obra totalment nova i lliure de plagi directe.
A més del bloqueig preventiu, totes les composicions generades per la plataforma reben una marca d’aigua digital invisible incrustada directament al fitxer d’àudio. La tecnologia de seguiment Essa no afecta la qualitat del so ni l’experiència d’escolta, però permet que el programari de verificació identifiqui a l’instant l’origen sintètic del material. L’adopció d’aquest estàndard d’identificació respon a les creixents demandes de transparència en el mercat digital, assegurant que les plataformes de distribució, les xarxes socials i els oients sàpiguen diferenciar clarament entre una cançó produïda per un ésser humà i una pista creada per algorismes d’aprenentatge automàtic.
Aplicacions pràctiques al mercat audiovisual
La capacitat de generar tres minuts continus d’àudio transforma la utilitat de l’eina per als creadors de contingut digital. Produtores de vídeos per a internet, els responsables de podcasts i els desenvolupadors de jocs independents troben la tecnologia una alternativa ràpida per satisfer la demanda constant de bandes sonores originals sense complicacions amb les llicències tradicionals.
L’agilitat en el procés de creació permet a les agències de publicitat provar múltiples variacions de jingles i fons musicals per a campanyes en qüestió de minuts. La flexibilitat Essa redueix els costos inicials de preproducció i ofereix una major varietat d’opcions creatives abans de l’aprovació final d’un projecte comercial o d’entreteniment.
Desenvolupament tècnic i col·laboració professional
L’evolució del motor d’intel·ligència artificial responsable d’aquesta nova capacitat de generació musical va requerir un procés de formació complex, basat en la col·laboració directa amb experts de la indústria musical. Engenheiros de programari va treballar juntament amb músics professionals, productors d’estudis i teòrics de la música per ensenyar a l’algoritme els fonaments essencials del ritme, l’harmonia, la melodia i la progressió d’acords. L’esforç conjunt de Esse va donar com a resultat un model capaç d’entendre no només la teoria musical bàsica, sinó també els matisos emocionals i estructurals que fan que una cançó sigui agradable a l’oïda humana. L’arquitectura del sistema s’ha redissenyat per donar suport al processament de llargues seqüències de dades d’àudio sense perdre la cohesió, un repte tècnic important en l’àmbit de la intel·ligència artificial generativa. El processament continu garanteix que els instruments mantenen l’afinació correcta i que el ritme no pateix variacions no desitjades durant els tres minuts de reproducció, establint un nou estàndard d’estabilitat per a les eines de creació de so automatitzada disponibles comercialment.
Característiques del sistema destacades
La nova interfície operativa d’intel·ligència artificial va ser dissenyada per simplificar l’accés a les funcions de composició avançades, permetent fins i tot als usuaris sense coneixements formals de teoria musical aconseguir resultats professionals. El sistema processa una sèrie de paràmetres estructurals que garanteixen una personalització completa de la pista generada segons les necessitats específiques de cada projecte audiovisual.
– Definição necessita intros, versos i cors mitjançant ordres de text.
– Suporte incorporat per a transicions complexes entre diferents seccions de la cançó.
– Geração de pistes optimitzades per a vlogs, podcasts i vídeos tutorials.
– Processamento veus, lletres i arranjaments instrumentals simultanis.
Disponibilitat per al públic en general
L’accés a l’eina de generació de música segueix un calendari de llançament gradual estructurat per l’empresa tecnològica. Els usuaris que tinguin subscripcions actives als plans més avançats de l’ecosistema d’intel·ligència artificial ara poden utilitzar els recursos segons els límits de processament diaris establerts per a cada categoria de compte.
L’ampliació contínua del servei preveu la inclusió de noves funcionalitats i ajustos basats en el feedback directe dels primers usuaris. L’equip de desenvolupament supervisa constantment el rendiment de l’algoritme per refinar la qualitat de l’àudio i optimitzar els temps de resposta del servidor mentre crea pistes completades.