Dernières Nouvelles (FR)

L’outil Google mis à jour crée des compositions musicales de trois minutes dans l’application Gemini

Lyria 3 Pro
Photo: Lyria 3 Pro - Divulgação

Google a publié le Lyria 3 Pro, une version mise à jour de son modèle d’intelligence artificielle visant à générer des compositions audio et sonores. Le principal changement technique de l’outil consiste à augmenter la limite de temps pour chaque piste, qui est passée de trente secondes dans la génération précédente à trois minutes continues. La nouvelle fonctionnalité répond à une demande des créateurs de contenu et des producteurs numériques pour des documents plus complets et plus complets. L’accès initial s’effectue progressivement pour les utilisateurs disposant d’abonnements payants à l’application Gemini.

L’évolution de la longueur des pistes accompagne les améliorations de l’architecture du modèle, qui traite désormais les commandes de texte avec une plus grande précision pour structurer les compositions. L’entreprise a intégré la technologie dans différents aspects de son écosystème d’entreprise, permettant aux professionnels de l’édition et aux développeurs de logiciels d’utiliser l’intelligence artificielle directement dans leurs flux de travail. Le traitement a lieu sur des serveurs dédiés, ce qui garantit la livraison des fichiers avec voix, instrumentation et qualité studio quelques secondes après la saisie de l’invite.

Traitement et structuration audio étendus Capacidade

Le passage de trente secondes à trois minutes représente un saut informatique significatif dans le segment de l’audio génératif. Le Lyria 3 Pro parvient à maintenir une cohérence harmonique et rythmique sur toute la longueur du morceau, évitant les distorsions ou les pertes de qualité qui se produisent généralement au cours des générations prolongées. Le système analyse la demande de l’utilisateur et construit la musique couche par couche, combinant des rythmes, des mélodies de fond et des voix synthétiques de manière synchronisée.

Les utilisateurs contrôlent la structure de la chanson grâce à des commandes textuelles détaillées. Le modèle comprend des instructions spécifiques pour diviser la composition en blocs traditionnels, tels que l’introduction, les couplets, les ponts et les refrains. La segmentation Essa facilite la création de pistes conformes aux normes commerciales ou expérimentales, en fonction des besoins du projet. L’intelligence artificielle ajuste les transitions entre ces parties afin que le changement de rythme semble naturel à vos oreilles.

Les testeurs musicaux et bêta de Produtores ont signalé que l’outil répond efficacement aux demandes complexes concernant les arrangements et les genres musicaux. Il est possible de demander le mélange de différents styles sur un même morceau ou de changer l’intensité des instruments à des moments précis de la chanson. Le traitement du langage naturel du système traduit les termes techniques de la théorie musicale en résultats sonores pratiques, réduisant ainsi le temps passé à créer des croquis ou des pistes d’accompagnement.

Integração avec l’écosystème d’applications et de services

La distribution de Lyria 3 Pro s’effectue sur plusieurs plates-formes gérées par Google. Sur le marché grand public, les abonnés aux forfaits avancés de Gemini accèdent à l’interface de création directement via l’application ou le navigateur. Para Dans le secteur des entreprises et du développement, la société a publié le modèle d’IA Google sur Studio et via l’API Gemini. L’ouverture du Essa permet aux programmeurs de créer des applications tierces qui utilisent le moteur audio Google pour générer de la musique à la demande dans d’autres interfaces.

Les entreprises et les studios de création Grandes ont accès via Vertex AI, la plateforme cloud d’apprentissage automatique de l’entreprise. Le modèle Além a été intégré nativement à Google Vids, l’application de montage vidéo axée sur le bureau, et à ProducerAI, un environnement collaboratif pour la production musicale. La présence de l’outil dans ces logiciels élimine le besoin de rechercher des bandes sonores dans des banques audio externes.

La polyvalence du modèle sert différentes niches du marché du divertissement audiovisuel et numérique. La génération rapide d’audio structuré optimise le calendrier des projets qui nécessitent un grand volume de matériel sonore original.

  • Criação de bandes sonores exclusives pour les vidéos tutorielles et les vlogs d’entreprise.
  • Desenvolvimento de vignettes et musique de transition pour les épisodes de podcast.
  • Geração d’effets et de musique de fond dynamique pour le secteur du jeu vidéo.
  • Produção de matériel audio à grande échelle pour les campagnes publicitaires numériques.

L’intégration avec des flux de travail déjà établis démontre la stratégie de Google consistant à positionner ses outils génératifs comme des utilitaires pratiques. Les éditeurs marketing et vidéo de Profissionais peuvent créer l’ambiance souhaitée pour une scène et obtenir une piste parfaitement synchronisée avec le matériel visuel.

Sécurité Mecanismos et protection des droits d’auteur

Les progrès des technologies de génération audio soulèvent des débats sur le droit d’auteur et l’utilisation abusive des propriétés intellectuelles. Para Pour atténuer ces risques, Google a implémenté des filtres de sécurité stricts dans Lyria 3 Pro. Le système bloque les tentatives de clonage des voix de vrais chanteurs et empêche le modèle de produire des copies directes de musique protégée par le droit d’auteur. Quando un utilisateur saisit le nom d’un artiste célèbre dans la commande, l’intelligence artificielle interprète la mention uniquement comme une référence au style ou au genre, sans imiter l’identité vocale de la personne.

La mesure de sécurité Outra adoptée par l’entreprise est l’application de SynthID sur toutes les pistes générées par la plateforme. La technologie Essa intègre un filigrane numérique invisible et inaudible directement dans le spectre audio du fichier. Le marqueur résiste à l’édition, à la compression ou aux changements de format, permettant au logiciel de vérification d’identifier l’origine synthétique du matériau. L’initiative vise à promouvoir la transparence dans la consommation des médias et à lutter contre la désinformation ou la fraude impliquant de faux fichiers audio.

Les contrôles de sécurité ont lieu en temps réel lors d’un traitement rapide. Si le système détecte que la demande viole les directives d’utilisation ou tente de contourner les protections des droits d’auteur, la génération s’arrête immédiatement. Google dispose d’équipes dédiées à la mise à jour constante de ces filtres, conformément aux réglementations en vigueur sur l’intelligence artificielle dans différents pays.

Impacto sur le marché de la création de contenus numériques

Le développement du Lyria 3 Pro a nécessité la participation de musiciens professionnels, d’ingénieurs du son et de producteurs pendant la phase de formation du modèle. La collaboration technique Essa a permis à l’intelligence artificielle de comprendre les nuances d’harmonie, de progression d’accords et de mixage. Le résultat pratique est un outil qui fournit des fichiers audio équilibrés, dans lesquels les voix ne se chevauchent pas incorrectement avec les instruments de base.

La disponibilité de compositions complètes de trois minutes modifie la dynamique de travail des créateurs indépendants. Les profils vidéo et de réseaux sociaux Canais gagnent en autonomie pour produire leurs propres morceaux, réduisant ainsi les coûts de licence pour la musique commerciale. Le modèle agit comme un assistant de composition, permettant aux artistes de tester rapidement les progressions et les arrangements avant d’enregistrer la version finale en studio avec de vrais instruments.

Google maintient un cycle de mises à jour itératives du modèle, basé sur le volume de données générées par les utilisateurs et les commentaires des communautés de développeurs. L’expansion de la capacité de traitement audio consolide l’infrastructure de l’entreprise dans le secteur de l’intelligence artificielle générative, en concurrence directe avec d’autres plateformes axées sur des solutions créatives pour les marchés des entreprises et des consommateurs finaux.