Actualités (FR)

Google annonce la mise à jour Gemini 3.1 Flash Live dans Gemini Live

Gemini
Gemini - Mehaniq/shutterstock.com

Google a annoncé ce jeudi le Gemini 3.1 Flash Live comme le modèle audio et vocal de la plus haute qualité à ce jour. La version Essa apporte un certain nombre d’améliorations significatives par rapport à Gemini Live et Search Live. Le modèle est désormais disponible en avant-première via l’API Gemini Live sur Google AI Studio. Ele se distingue par une latence plus faible par rapport à la version précédente et une plus grande efficacité dans la reconnaissance des nuances acoustiques telles que le ton et le rythme.

Les développeurs peuvent tester le nouveau modèle immédiatement pour créer des applications avec des conversations multimodales en temps réel. Le Gemini 3.1 Flash Live filtre le bruit de fond avec plus de précision et peut mieux discerner les paroles pertinentes au milieu des sons environnementaux comme la circulation ou la télévision. Além De plus, le système prend en charge plus de 90 langues, ce qui étend la portée des interactions en direct.

  • Reconnaissance améliorée des nuances acoustiques comme la hauteur et le rythme
  • Latence réduite dans les conversations en temps réel
  • Filtrage plus efficace du bruit de fond et des sons environnementaux
  • Prise en charge de plus de 90 langues pour les interactions multimodales

Améliorations techniques du modèle audio

Le nouveau modèle améliore considérablement la capacité de déclencher des outils externes lors de conversations en direct. Ele permet également un meilleur suivi des instructions complexes, maintenant l’agent dans les limites opérationnelles même lorsque les conversations prennent une tournure inattendue. Les changements Essas entraînent des réponses plus fiables et naturelles.

Sur Gemini Live pour les appareils Android et iOS, Flash Live 3.1 offre des réponses plus rapides avec moins de pauses. Le système peut suivre le raisonnement de la conversation deux fois plus tôt. Isso permet des séances de brainstorming plus longues sans perdre le fil de vos pensées.

Gemini Live ajuste dynamiquement la durée et le ton des réponses en fonction du contexte du moment. Usuários rapporte des interactions plus fluides et moins d’interruptions lors de l’utilisation quotidienne. L’intégration avec le nouveau modèle contribue à une expérience globale plus cohérente.

Expansion mondiale de Search Live

Google utilise Gemini 3.1 Flash Live pour lancer Search Live à l’échelle mondiale dans plus de 200 pays. L’extension couvre toutes les langues et tous les emplacements où Modo IA est actuellement disponible. La fonctionnalité permet des conversations interactives avec Busca à partir de Google, y compris l’audio et la vidéo via Google Lens.

Les utilisateurs peuvent désormais effectuer des recherches conversationnelles en temps réel avec une plus grande précision dans différentes régions. Le système traite plus efficacement les requêtes multimodales dans des environnements variés. La disponibilité du Essa étend l’accès aux informations vocales à l’échelle mondiale.

Le Search Live bénéficie directement des améliorations en matière de reconnaissance vocale et de réduction de la latence. Conversas avec la recherche devient plus naturelle et contextualisée. L’intégration audio et vidéo facilite l’interaction dans des scénarios pratiques du quotidien.

Google
Google – daily_creativity/shutterstock.com

Détails sur la langue et le support multimodal

La prise en charge de plus de 90 langues permet des conversations multimodales en temps réel de haute qualité. Le modèle traite mieux les variations régionales de prononciation et d’accents. Isso rend Gemini Live plus accessible aux utilisateurs de différents pays.

Les développeurs disposent d’outils pour créer des expériences personnalisées basées sur le nouveau modèle. L’API facilite l’intégration dans des applications nécessitant des interactions vocales riches. L’accent mis sur une faible latence permet de maintenir le déroulement naturel des conversations.

Applications pratiques au quotidien

Au quotidien, le Gemini Live avec le nouveau modèle répond plus rapidement aux commandes et questions complexes. Le système maintient le contexte pendant des périodes plus longues sans recommencer le raisonnement. Usuários peut explorer des idées en continu pendant des sessions prolongées.

La capacité de filtrer le bruit ambiant améliore les performances dans les endroits très fréquentés ou avec des bruits de fond. Conversas dans des environnements tels que des rues ou des pièces équipées d’un téléviseur, ils deviennent plus lumineux. L’ajustement dynamique du ton et de la durée des réponses s’adapte au style d’interaction.

Avancées dans l’intégration avec des outils externes

Le modèle amélioré déclenche plus efficacement les outils externes pendant les conversations. Ele suit les instructions système de manière plus cohérente, même dans les boîtes de dialogue de branchement. La stabilité du Essa contribue à des résultats plus prévisibles dans les applications pratiques.

Les développeurs et les utilisateurs finaux bénéficient d’interactions plus robustes. Le Gemini Live devient un outil plus fiable pour les tâches impliquant plusieurs étapes. La combinaison de capacités audio avancées et de capacités de raisonnement étendues élargit les possibilités d’utilisation.

Google continue d’investir dans des modèles audio pour rendre les interactions de l’IA plus naturelles. La sortie de Gemini 3.1 Flash Live représente une étape importante dans cette direction. Usuários de Android et iOS peuvent essayer les nouvelles fonctionnalités directement dans l’application Gemini Live.

Atualizações lié à l’écosystème Gemini

L’annonce inclut des améliorations supplémentaires du panneau flottant Gemini Live sur le Android. Les modifications Essas visent à faciliter un accès rapide aux fonctions vocales. L’ensemble des mises à jour renforce l’engagement envers des expériences conversationnelles avancées.

Search Live atteint désormais un public plus large grâce à des capacités audio et vidéo intégrées. L’expansion mondiale démocratise l’accès aux recherches vocales interactives. Usuários dans différentes régions bénéficie d’un outil plus puissant pour les requêtes en temps réel.

Le Gemini 3.1 Flash Live marque une évolution notable dans la qualité audio et vocale des modèles Google. Les améliorations en termes de latence, de filtrage du bruit et de suivi des instructions placent la barre plus haut pour les interactions en direct. La version préliminaire permet aux développeurs d’explorer de nouvelles applications dès maintenant.

To Top