O Google lançou o Lyria 3, seu modelo mais avançado de geração de música por inteligência artificial, integrado ao aplicativo Gemini. A ferramenta permite criar faixas de 30 segundos de alta qualidade a partir de prompts de texto ou imagens enviadas pelos usuários. O recurso está disponível em beta desde fevereiro de 2026 para pessoas maiores de 18 anos em vários idiomas, incluindo o português, com foco em democratizar a criação musical mesmo para quem não tem experiência técnica.
O modelo, desenvolvido pela equipe do Google DeepMind, gera músicas completas com vocais, letras originais e instrumentais em diversos gêneros. Usuários descrevem o estilo desejado, como “pop animado com batida eletrônica e voz masculina rouca”, e recebem uma faixa pronta com estrutura coesa. A integração com uploads de fotos ou vídeos possibilita a criação de trilhas que capturam a atmosfera da imagem, ampliando as opções criativas.
O lançamento representa uma evolução significativa em relação às versões anteriores do Lyria. O controle sobre elementos como tempo, fluxo melódico e expressão vocal melhorou, resultando em composições mais naturais e consistentes do início ao fim da faixa. Todas as faixas geradas recebem marca d’água digital SynthID invisível ao ouvido humano, mas detectável por ferramentas específicas para identificar conteúdo criado por IA.
Acesso e requisitos para uso do Lyria 3
A funcionalidade está acessível diretamente no aplicativo Gemini para web e mobile. Usuários precisam ter mais de 18 anos e realizar verificação de idade para começar. O plano gratuito oferece um número limitado de gerações diárias, enquanto assinaturas pagas do Google AI expandem os limites para uso mais frequente.
O processo inicia com a seleção da opção de geração de música no app. Após inserir o prompt ou fazer upload de uma imagem, o sistema processa a solicitação em segundos e entrega a faixa com arte de capa gerada automaticamente por outro modelo de IA do Google. As criações podem ser baixadas em formato de áudio ou compartilhadas em redes sociais.
Melhorias técnicas e controle criativo
O Lyria 3 aprimorou a uniformidade estrutural das músicas, evitando transições abruptas ou desvios no ritmo e no tom vocal. Usuários refinam os resultados especificando detalhes como instrumentos predominantes, andamento ou combinação de gêneros híbridos. Exemplos incluem pedidos de faixas instrumentais puras ou com letras em múltiplos idiomas.
A capacidade de interpretar prompts visuais adiciona uma camada inovadora. Uma foto de paisagem urbana noturna pode gerar uma trilha eletrônica atmosférica, enquanto uma imagem de show ao vivo inspira um rock enérgico. Essas opções incentivam experimentações criativas rápidas.
Limitações e medidas de segurança
As faixas têm duração máxima de 30 segundos, o que as torna ideais para clipes curtos ou ideias iniciais de composição. O modelo inclui filtros que bloqueiam prompts que tentam imitar vozes de artistas específicos ou reproduzir músicas existentes, visando proteger direitos autorais.
O Google enfatiza que o uso comercial das faixas geradas depende das políticas atuais e de regulamentações em evolução. Usuários devem consultar os termos de serviço para entender responsabilidades legais envolvidas na distribuição ou monetização do conteúdo.
Exemplos práticos de aplicação
Criadores utilizam o Lyria 3 para produzir jingles personalizados, trilhas para redes sociais ou protótipos de ideias musicais. Um prompt como “jazz suave com piano e saxofone solo sobre reflexão noturna” resulta em uma peça instrumental coesa. A inclusão de letras automáticas facilita a criação de canções completas a partir de temas pessoais.
A ferramenta também serve para educação musical, permitindo que estudantes explorem estruturas de gêneros variados sem equipamentos caros. Músicos profissionais testam combinações inusitadas para inspirar novas composições.
Integração com outros recursos do Gemini
A geração de arte de capa usa o modelo Nano Banana para criar visuais personalizados que complementam a faixa. Isso facilita o compartilhamento imediato em plataformas digitais. O foco em alta fidelidade garante qualidade de áudio profissional em clipes curtos.
O recurso se alinha à estratégia do Google de expandir capacidades criativas no Gemini. Atualizações futuras podem incluir faixas mais longas ou controles adicionais, conforme feedback dos usuários.