Tecnologia

Google anuncia Gemma 4 com licença Apache 2.0 e modelos para dispositivos locais

Por Janderson Luiz • 2 de abril de 2026 • 4 min de leitura

WhatsApp Twitter Facebook Seguir no Google E-mail

Foto: Gemma 4 - Google

O Google anunciou nesta quinta-feira a família Gemma 4, composta por novos modelos de inteligência artificial de código aberto com pesos disponíveis. A atualização representa o primeiro grande avanço da linha desde o lançamento da Gemma 3 há mais de um ano. Os desenvolvedores agora contam com licença Apache 2.0, que remove restrições comerciais presentes nas versões anteriores.

Os modelos suportam entrada de texto, áudio e imagem, com janelas de contexto que chegam a 256 mil tokens nas variantes maiores. Eles foram projetados principalmente para execução local em hardware acessível, incluindo GPUs de consumidor e dispositivos móveis. A mudança de licença facilita o uso comercial sem obrigações adicionais impostas pela Google.

Melhorias técnicas em raciocínio e multimodais

Os novos modelos trazem avanços significativos em raciocínio, matemática e follow de instruções quando comparados à geração anterior. Eles incorporam suporte nativo a function calling e geração de saída estruturada em JSON, o que beneficia fluxos de trabalho agenticos.

A capacidade de processamento de código foi otimizada para ambientes offline, alcançando desempenho comparável a serviços em nuvem como Gemini Pro. O suporte a entrada visual permite tarefas como reconhecimento óptico de caracteres e interpretação de gráficos com maior precisão.

Variantes incluem modelos Effective 2B e 4B otimizados para baixa latência em smartphones.
Colaboração com Qualcomm e MediaTek facilita integração em dispositivos móveis.
Modelos maiores rodam em uma única GPU H100 de 80 GB sem quantização.

Variantes de tamanhos e eficiência energética

A família Gemma 4 conta com quatro principais configurações de tamanho. As versões 26B Mixture of Experts e 31B Dense oferecem alto desempenho e rodam em hardware de servidor ou workstation. Já as Effective 2B e 4B priorizam eficiência para execução em edge devices.

O modelo 26B MoE ativa apenas 3,8 bilhões de parâmetros durante inferência, reduzindo latência e consumo de energia. Todas as variantes lidam com mais de 140 idiomas. Os desenvolvedores podem baixar os pesos completos em plataformas como Hugging Face, Kaggle e Ollama.

Disponibilidade imediata em plataformas

Os modelos maiores de 31B e 26B estão disponíveis no AI Studio da Google. As versões leves E4B e E2B podem ser acessadas na AI Edge Gallery. Os pesos completos estão liberados para download imediato em repositórios públicos.

Empresas e pesquisadores podem integrar os modelos em aplicações locais sem custos de API recorrentes. A Google também indicou que as variantes 2B e 4B servirão de base para o próximo Gemini Nano 4 em dispositivos Android.

Impacto da mudança para licença Apache 2.0

A adoção da licença Apache 2.0 elimina as restrições da licença customizada anterior, que incluía políticas de uso proibido atualizáveis unilateralmente. Desenvolvedores ganham maior controle sobre dados e implantações comerciais.

Essa alteração deve estimular a criação de novos projetos na comunidade, conhecida informalmente como Gemmaverse. O foco em execução local reforça a estratégia de oferecer alternativas abertas aos modelos fechados da linha Gemini.

Otimizações para hardware específico

As versões leves foram desenvolvidas em parceria com fabricantes de chips móveis. Elas entregam latência próxima de zero em tarefas cotidianas enquanto mantêm consumo reduzido de bateria. Testes indicam bom desempenho em placas como Raspberry Pi e Jetson Nano.

Os modelos maiores mantêm eficiência mesmo em configuração densa ou MoE. A redução de latência em processamento local representa ganho prático para aplicações que exigem privacidade e resposta rápida sem conexão constante com servidores.

Suporte a múltiplas modalidades de entrada

Além de texto, os modelos processam áudio e imagens de forma nativa. O reconhecimento de fala apresenta melhorias em relação à Gemma 3. A capacidade multimodal abre possibilidades para aplicações que combinam diferentes tipos de dados em tempo real.

Desenvolvedores podem prototipar fluxos agenticos diretamente no AI Core Developer Preview usando as variantes leves. Essas implementações são forward-compatible com o futuro Gemini Nano 4.

A família Gemma 4 reforça o compromisso do Google em oferecer modelos abertos com pesos acessíveis. A combinação de desempenho aprimorado, licença permissiva e suporte a hardware diverso expande as opções para quem busca soluções de IA executáveis localmente.

Veja Tambem em Tecnologia

ROG Xbox Ally X20 Bundle chega com design translúcido e óculos AR para 20 anos de ROG

Jogos mensais do PlayStation Plus Essential chegam em junho com Grounded e Warhammer 40.000 Darktide

Nvidia anuncia chip Rtx Spark para reinventar o Pc e desafiar Intel e Apple

Fortnite Shattered live event acontece nesta sexta com horários por fuso

CEO da Xbox admite erro ao exibir logotipos de PS5 e Switch em evento

MSI lança Claw 8 Ex AI Plus com processador Intel Arc G3 Extreme e bateria de 80Whr

Microsoft revela novos detalhes do Projeto Helix e futuro do Xbox

Apple libera iOS 26.5.1 com correção de carregamento para iPhone Air e linha iPhone 17

RPG gratuito TBH Task Bar Hero alcança pico de 143 mil jogadores no Steam e lidera rankings

iPhone 18 Pro terá câmera com custo 50% maior para Apple por sensor de abertura variável

Dell anuncia novos monitores Alienware com modelo 39 polegadas 5K OLED e opções de 240 Hz

Google libera Android Auto 17.0 com novos recursos de multimídia

VER MAIS EM TECNOLOGIA