Google anuncia Gemma 4 com licença Apache 2.0 e modelos para dispositivos locais

Gemma 4

Gemma 4 - Google

O Google anunciou nesta quinta-feira a família Gemma 4, composta por novos modelos de inteligência artificial de código aberto com pesos disponíveis. A atualização representa o primeiro grande avanço da linha desde o lançamento da Gemma 3 há mais de um ano. Os desenvolvedores agora contam com licença Apache 2.0, que remove restrições comerciais presentes nas versões anteriores.

Os modelos suportam entrada de texto, áudio e imagem, com janelas de contexto que chegam a 256 mil tokens nas variantes maiores. Eles foram projetados principalmente para execução local em hardware acessível, incluindo GPUs de consumidor e dispositivos móveis. A mudança de licença facilita o uso comercial sem obrigações adicionais impostas pela Google.

Melhorias técnicas em raciocínio e multimodais

Os novos modelos trazem avanços significativos em raciocínio, matemática e follow de instruções quando comparados à geração anterior. Eles incorporam suporte nativo a function calling e geração de saída estruturada em JSON, o que beneficia fluxos de trabalho agenticos.

A capacidade de processamento de código foi otimizada para ambientes offline, alcançando desempenho comparável a serviços em nuvem como Gemini Pro. O suporte a entrada visual permite tarefas como reconhecimento óptico de caracteres e interpretação de gráficos com maior precisão.

  • Variantes incluem modelos Effective 2B e 4B otimizados para baixa latência em smartphones.
  • Colaboração com Qualcomm e MediaTek facilita integração em dispositivos móveis.
  • Modelos maiores rodam em uma única GPU H100 de 80 GB sem quantização.

Variantes de tamanhos e eficiência energética

A família Gemma 4 conta com quatro principais configurações de tamanho. As versões 26B Mixture of Experts e 31B Dense oferecem alto desempenho e rodam em hardware de servidor ou workstation. Já as Effective 2B e 4B priorizam eficiência para execução em edge devices.

O modelo 26B MoE ativa apenas 3,8 bilhões de parâmetros durante inferência, reduzindo latência e consumo de energia. Todas as variantes lidam com mais de 140 idiomas. Os desenvolvedores podem baixar os pesos completos em plataformas como Hugging Face, Kaggle e Ollama.

Disponibilidade imediata em plataformas

Os modelos maiores de 31B e 26B estão disponíveis no AI Studio da Google. As versões leves E4B e E2B podem ser acessadas na AI Edge Gallery. Os pesos completos estão liberados para download imediato em repositórios públicos.

Empresas e pesquisadores podem integrar os modelos em aplicações locais sem custos de API recorrentes. A Google também indicou que as variantes 2B e 4B servirão de base para o próximo Gemini Nano 4 em dispositivos Android.

Impacto da mudança para licença Apache 2.0

A adoção da licença Apache 2.0 elimina as restrições da licença customizada anterior, que incluía políticas de uso proibido atualizáveis unilateralmente. Desenvolvedores ganham maior controle sobre dados e implantações comerciais.

Essa alteração deve estimular a criação de novos projetos na comunidade, conhecida informalmente como Gemmaverse. O foco em execução local reforça a estratégia de oferecer alternativas abertas aos modelos fechados da linha Gemini.

Otimizações para hardware específico

As versões leves foram desenvolvidas em parceria com fabricantes de chips móveis. Elas entregam latência próxima de zero em tarefas cotidianas enquanto mantêm consumo reduzido de bateria. Testes indicam bom desempenho em placas como Raspberry Pi e Jetson Nano.

Os modelos maiores mantêm eficiência mesmo em configuração densa ou MoE. A redução de latência em processamento local representa ganho prático para aplicações que exigem privacidade e resposta rápida sem conexão constante com servidores.

Suporte a múltiplas modalidades de entrada

Além de texto, os modelos processam áudio e imagens de forma nativa. O reconhecimento de fala apresenta melhorias em relação à Gemma 3. A capacidade multimodal abre possibilidades para aplicações que combinam diferentes tipos de dados em tempo real.

Desenvolvedores podem prototipar fluxos agenticos diretamente no AI Core Developer Preview usando as variantes leves. Essas implementações são forward-compatible com o futuro Gemini Nano 4.

A família Gemma 4 reforça o compromisso do Google em oferecer modelos abertos com pesos acessíveis. A combinação de desempenho aprimorado, licença permissiva e suporte a hardware diverso expande as opções para quem busca soluções de IA executáveis localmente.

Veja Também