Actualités (FR)

Google annonce Gemma 4 avec licence Apache 2.0 et modèles pour appareils locaux

Gemma 4
Photo: Gemma 4 - Google

Google a annoncé ce jeudi la famille Gemma 4, composée de nouveaux modèles d’intelligence artificielle open source avec des poids disponibles. La mise à jour représente la première avancée majeure de la gamme depuis le lancement du Gemma 3 il y a plus d’un an. Les développeurs disposent désormais de la licence Apache 2.0, qui supprime les restrictions commerciales présentes dans les versions précédentes.

Les modèles prennent en charge la saisie de texte, d’audio et d’image, avec des fenêtres contextuelles qui atteignent 256 000 jetons dans les plus grandes variantes. Eles sont principalement conçus pour fonctionner localement sur du matériel abordable, notamment des GPU grand public et des appareils mobiles. Le changement de licence facilite l’utilisation commerciale sans obligations supplémentaires imposées par le Google.

Améliorations techniques en raisonnement et multimodal

Les nouveaux modèles apportent des avancées significatives en matière de raisonnement, de mathématiques et de suivi d’instructions par rapport à la génération précédente. Eles intègrent la prise en charge native des appels de fonctions et de la génération de sorties structurées JSON, ce qui profite aux flux de travail agents.

La capacité de traitement du code a été optimisée pour les environnements hors ligne, atteignant des performances comparables à celles des services cloud tels que Gemini Pro. La prise en charge de la saisie visuelle permet des tâches telles que la reconnaissance optique de caractères et l’interprétation de graphiques avec une plus grande précision.

  • Les variantes incluent les modèles Effective 2B et 4B optimisés pour une faible latence sur les smartphones.
  • La collaboration avec Qualcomm et MediaTek facilite l’intégration sur les appareils mobiles.
  • Les modèles plus grands fonctionnent sur un seul GPU H100 de 80 Go sans quantification.

Variantes de taille et efficacité énergétique

La famille Gemma 4 comprend quatre configurations de tailles principales. Les versions 26B Mixture de Experts et ​​31B Dense offrent des performances élevées et fonctionnent sur du matériel serveur ou poste de travail. Já comme Effective 2B et 4B donnent la priorité à l’efficacité de l’exécution sur les appareils de périphérie.

Le modèle 26B MoE n’active que 3,8 milliards de paramètres lors de l’inférence, réduisant ainsi la latence et la consommation d’énergie. Les variantes Todas gèrent plus de 140 langues. Les développeurs peuvent télécharger les pondérations complètes sur des plateformes telles que Hugging Face, Kaggle et Ollama.

Disponibilité immédiate sur toutes les plateformes

Les modèles 31B et 26B plus grands sont disponibles dans AI Studio et Google. Les versions légères E4B et E2B sont accessibles dans AI Edge Gallery. Les poids complets sont disponibles en téléchargement immédiat à partir des référentiels publics.

Les entreprises et les chercheurs peuvent intégrer les modèles dans des applications locales sans coûts récurrents d’API. Google a également indiqué que les variantes 2B et 4B serviront de base au prochain Gemini Nano 4 sur les appareils Android.

Impact du passage à la licence Apache 2.0

L’adoption de la licence Apache 2.0 élimine les restrictions de la licence personnalisée précédente, qui incluait des politiques de non-utilisation pouvant être mises à jour unilatéralement. Desenvolvedores Obtenez un meilleur contrôle sur les données et les déploiements commerciaux.

Ce changement devrait encourager la création de nouveaux projets dans la communauté, connus officieusement sous le nom de Gemmaverse. L’accent mis sur l’exécution locale renforce la stratégie consistant à proposer des alternatives ouvertes aux modèles fermés de la ligne Gemini.

Optimisations pour du matériel spécifique

Les versions légères ont été développées en partenariat avec des fabricants de puces mobiles. Elas offrent une latence proche de zéro dans les tâches quotidiennes tout en maintenant une consommation de batterie réduite. Testes indique de bonnes performances sur des cartes comme Raspberry Pi et Jetson Nano.

Les modèles plus grands conservent leur efficacité même dans une configuration dense ou MoE. La réduction de la latence dans le traitement local représente un gain pratique pour les applications qui nécessitent une confidentialité et une réponse rapide sans connexion constante aux serveurs.

Prise en charge de plusieurs modalités de saisie

En plus du texte, les modèles traitent nativement l’audio et les images. La reconnaissance vocale s’améliore par rapport au Gemma 3. La capacité multimodale ouvre des possibilités pour les applications combinant différents types de données en temps réel.

Les développeurs peuvent prototyper des flux agentiques directement dans AI Core Developer Preview en utilisant les variantes légères. Les implémentations Essas sont rétrocompatibles avec le futur Gemini Nano 4.

La famille Gemma 4 renforce l’engagement de Google à proposer des modèles ouverts avec des poids accessibles. La combinaison de performances améliorées, de licences permissives et d’une prise en charge matérielle diversifiée élargit les options pour ceux qui recherchent des solutions d’IA exécutables localement.

Veja Tambem em Actualités (FR)