Actualités (FR)

Google lance le modèle Gemini 3 avec un raisonnement avancé et un leadership mondial dans les tests d’IA

Gemini 3
Gemini 3 - Google

Google a annoncé ce mardi (18) l’arrivée du Gemini 3, décrit par la direction de l’entreprise comme son modèle d’intelligence artificielle le plus sophistiqué à ce jour, conçu pour comprendre les nuances et effectuer des tâches avec une autonomie sans précédent. La nouvelle génération de technologie promet de transformer l’interaction numérique en intégrant des capacités multimodales supérieures et un raisonnement logique approfondi directement dans les produits de l’entreprise, du moteur de recherche aux outils de développement de logiciels complexes. La mise à jour marque une nouvelle phase dans la lutte pour la domination de l’IA générative, en se concentrant non seulement sur la réponse aux commandes, mais aussi sur le rôle de partenaire de réflexion.

Principales innovations présentées au lancement :

  • Raisonnement Aprofundado : mode Introdução ou Deep Think pour résoudre des problèmes complexes.
  • Autonomie Agentes : Capacidade a amélioré la planification et l’exécution de tâches en plusieurs étapes.
  • Google Antigravity : plate-forme Nova axée sur les développeurs qui intègre des agents de codage.
  • Performance Recorde : Liderança confirmé au classement LMArena et aux tests académiques.

Progrès du raisonnement logique et des capacités multimodales

La grande différence de Gemini 3 réside dans son architecture de « raisonnement de pointe », qui permet au modèle de traiter les informations avec un plus grand niveau de profondeur que les versions précédentes. Segundo Sundar Pichai, PDG de Google et Alphabet, la technologie a évolué de la simple lecture de texte et d’images à la compréhension du contexte et de l’intention derrière les demandes des utilisateurs, éliminant ainsi le besoin d’invites trop détaillées.

La société a également dévoilé « Gemini 3 Deep Think », un mode de raisonnement amélioré qui a obtenu des scores impressionnants dans des évaluations de haute difficulté, démontrant la capacité à relever des défis qui nécessitent une logique séquentielle et une interprétation de données abstraites.

Les tests de performances indiquent un saut qualitatif significatif par rapport au modèle 2.5 Pro :

  • Score de 1501 Elo dans le Leaderboard de LMArena.
  • Approbation de 91,9% sur le benchmark GPQA Diamond.
  • Précision de 87,6 % sur le Video-MMMU pour une compréhension multimodale.

Nouvelle plateforme Google Antigravity pour les développeurs

Simultanément au lancement du modèle, la plateforme Google Antigravity a été présentée, décrite comme un environnement de développement « agent first ». L’outil permet aux programmeurs d’opérer à un niveau axé sur les tâches, où l’IA passe du simple statut d’assistant de complétion de code à celui de partenaire actif qui planifie et exécute des flux de travail de bout en bout.

Avec un accès direct à l’éditeur, au terminal et au navigateur, les agents Gemini 3 au sein de Antigravity peuvent développer, tester et valider des applications de bout en bout. L’intégration vise à augmenter la productivité en déléguant des processus répétitifs et complexes à l’intelligence artificielle, en maintenant une supervision humaine pour les décisions stratégiques et créatives dans le développement de logiciels.

Intégration directe dans les capacités de recherche et de codage

La mise à jour impacte également directement le consommateur final avec l’implémentation immédiate de Gemini 3 dans le « AI Mode » du Busca du Google.

Pour la première fois, un modèle de cette ampleur est mis à disposition dans le moteur de recherche le jour du lancement, permettant de générer des interfaces dynamiques et des mises en page visuelles immersives en temps réel à partir de requêtes.

De plus, la capacité de « codage dynamique » a été améliorée, permettant au modèle de générer des visualisations Web riches et interactives basées sur des instructions en langage naturel.

Performance supérieure aux tests de mathématiques et de sciences

L’exactitude factuelle et la capacité mathématique ont été des points centraux dans le développement de cette génération.

Le modèle a atteint un nouveau sommet de 23,4 % dans MathArena Apex, établissant un record pour les modèles frontières en résolution mathématique avancée.

Dans des tests de vérification des faits tels que le SimpleQA Verified, le Gemini 3 a atteint 72,1 %, ce qui suggère une réduction des « hallucinations » courantes dans les modèles génératifs.

Ces données renforcent l’utilité de l’outil pour les universitaires et les scientifiques qui ont besoin de fiabilité pour synthétiser de grands volumes de données techniques.

Capacité de planification à long terme

L’un des développements les plus techniques détaillés par l’équipe Google DeepMind est la cohérence des modèles pour les tâches à long terme. Dans les simulations commerciales telles que le benchmark Vending-Bench 2, le Gemini 3 était capable de gérer des opérations virtuelles pendant de longues périodes sans s’écarter de l’objectif initial, ce que les modèles précédents avaient du mal à maintenir. Isso suggère que l’IA peut être utilisée avec une plus grande sécurité pour organiser les flux de travail personnels, tels que la planification des services et la gestion des e-mails, en maintenant la cohérence des actions du début à la fin du processus sous la supervision de l’utilisateur.

Disponibilité et accès immédiat aux ressources

Gemini 3 Pro est désormais disponible pour les développeurs via Google AI Studio et Vertex AI, ainsi que des intégrations de plates-formes tierces.

Pour le grand public, les fonctionnalités commencent à être distribuées aujourd’hui dans les applications Gemini et Busca, avec des fonctionnalités avancées réservées aux abonnés au forfait AI Ultra.

To Top