Actualités (FR)

Google lance une nouvelle automatisation avancée Gemini pour les applications de la gamme Pixel 10 et Galaxy S26

Gemini
Photo: Gemini - Mehaniq/shutterstock.com

Google a commencé à publier une nouvelle fonctionnalité d’automatisation des tâches en plusieurs étapes pour l’assistant Gemini sur certains appareils mobiles. La nouvelle fonctionnalité permet à l’intelligence artificielle d’effectuer des actions complexes directement dans des applications tierces, sans avoir besoin d’une intervention manuelle constante de la part du propriétaire du smartphone à chaque clic ou défilement.

La nouvelle fonctionnalité arrive initialement en format bêta et est limitée aux modèles les plus récents du marché de la technologie mobile. Les appareils inclus dans cette première phase de mise en œuvre comprennent les Google Pixel 10, Pixel 10 Pro et Pixel 10 Pro.

Le lancement officiel a eu lieu simultanément sur les marchés Estados Unidos et Coreia, stratégiquement choisis pour tester la stabilité de l’outil dans des scénarios d’utilisation intense avant un lancement mondial. L’activation du système est simple, ne nécessitant qu’une commande vocale détaillée après avoir appuyé longuement sur le bouton latéral de l’appareil.

Exécuter des commandes complexes dans la vie quotidienne

La principale innovation du système réside dans sa capacité à interpréter et exécuter des requêtes qui nécessitent une navigation séquentielle à travers différents écrans, menus et boîtes de dialogue. L’assistant numérique prend temporairement le contrôle de l’interface de l’application choisie pour réaliser des actions pratiques, comme demander un transport privé d’un point à un autre ou commander des repas spécifiques sur des plateformes de livraison.

Pendant le processus d’exécution, l’intelligence artificielle analyse les options disponibles dans l’interface graphique, remplit les formulaires d’adresse et sélectionne les éléments en fonction des préférences historiques de l’utilisateur. Le système dispose d’un verrou de sécurité qui met automatiquement l’opération en pause et demande l’approbation finale à l’écran avant de terminer toute transaction financière ou de confirmer une commande.

Fonctionnement dans un environnement virtuel isolé

Pour garantir l’intégrité des données personnelles, Gemini exécute toutes les automatisations dans une fenêtre virtuelle sécurisée complètement isolée du reste du système d’exploitation du smartphone. La méthode d’encapsulation Esse empêche l’intelligence artificielle d’accéder à des informations non autorisées, de lire des documents privés ou de modifier les paramètres critiques de l’appareil lors de la navigation dans des applications tierces.

L’assistant suit strictement les instructions fournies dans la commande vocale initiale, limitant son action exclusivement au cadre de la tâche demandée par la personne. Si l’utilisateur demande à acheter un expresso, l’outil ouvrira uniquement l’application du café correspondante, ignorant complètement les messages texte, les e-mails professionnels ou les galeries de photos présents dans la mémoire de l’appareil.

L’architecture logicielle développée pour cette fonction permet au processus de se dérouler de manière invisible en arrière-plan ou via une interface translucide superposée à l’écran principal. Isso garantit que le flux normal d’utilisation du téléphone n’est pas brusquement interrompu, permettant à la personne de continuer à lire un article ou à regarder une vidéo pendant le traitement de la commande.

Applications compatibles en phase de test

À ce stade initial de tests publics, la fonctionnalité couvre des catégories spécifiques de services à la demande qui font partie de la routine quotidienne de millions de consommateurs. La prise en charge officielle du lancement inclut des plateformes de livraison de nourriture populaires telles que DoorDash, Grubhub et Uber Eats, ce qui facilite la répétition des commandes de routine avec une seule phrase prononcée.

Dans le secteur de la mobilité urbaine, le système s’intègre nativement aux applications Uber et Lyft pour optimiser les déplacements en ville. L’utilisateur peut simplement saisir la destination souhaitée en langage naturel, et l’assistant se charge d’ouvrir la carte, de saisir l’adresse exacte, de comparer les catégories de véhicules disponibles et de présenter le devis final pour approbation.

Pour l’approvisionnement domestique, l’intégration avec le service Instacart permet l’assemblage rapide de paniers virtuels basés sur des listes de courses précédentes ou des recettes spécifiques. L’intelligence artificielle peut identifier les produits demandés, rechercher les meilleures options dans le catalogue du magasin et même suggérer des substitutions viables si un article spécifique est en rupture de stock dans l’établissement sélectionné.

Sur le marché sud-coréen, la phase bêta englobe des services locaux très demandés pour adapter le modèle linguistique aux différentes cultures de consommation et interfaces régionales. Aplicativos de grande portée dans le pays, tels que Kakao T pour la mobilité et Kaemin pour l’électricité, ont été inclus dans la liste de compatibilité pour garantir que les tests reflètent l’utilisation réelle de la population locale.

Traitement local et optimisation matérielle

L’exclusivité temporaire de la ressource pour les gammes Pixel 10 et Galaxy S26 est due au besoin impératif d’un matériel hautement optimisé pour traiter les modèles d’intelligence artificielle directement sur l’appareil. Les smartphones Esses sont équipés d’unités de traitement neuronal de pointe capables de gérer la charge de calcul massive requise par la navigation autonome dans les applications sans s’appuyer exclusivement sur des serveurs cloud. L’approche de traitement hybride Essa réduit considérablement la latence des réponses de l’assistant et garantit que l’exécution des tâches se déroule sans problème et sans problème, même dans les situations où la connectivité Internet mobile est instable ou lente.

Le partenariat technique entre les fabricants de matériel et l’équipe de développement du système d’exploitation a abouti à une intégration profonde entre l’assistant virtuel et la couche physique des appareils mobiles. L’exécution de tâches localement améliore non seulement la vitesse des automatisations quotidiennes, mais réduit également la consommation de la batterie par rapport aux processus plus anciens qui nécessitaient un transfert constant de paquets de données sur Internet. Le système d’exploitation peut identifier les modèles d’utilisation du propriétaire et allouer dynamiquement les ressources RAM, garantissant ainsi que le téléphone maintient des performances de navigation optimales pendant que l’assistant travaille en silence pour exécuter des commandes complexes en arrière-plan.

Contrôle et suivi continu des actions

Malgré le haut degré d’autonomie accordé à l’intelligence artificielle pour naviguer dans les interfaces, l’architecture du système a été conçue dans le but de garder le propriétaire de l’appareil sous le contrôle absolu de toutes les étapes de l’opération numérique. À tout moment, lors de l’exécution d’une tâche complexe, l’utilisateur reçoit des notifications visuelles et des alertes en temps réel qui détaillent exactement l’action effectuée par l’assistant au cours de cette milliseconde, comme la sélection d’un restaurant spécifique dans le catalogue ou la saisie d’une adresse de livraison dans le formulaire. Si l’outil rencontre une ambiguïté au cours du processus, comme deux succursales du même magasin situées à proximité de l’emplacement cible, il arrête immédiatement le flux d’automatisation et affiche un panneau sur l’écran demandant une clarification verbale ou un appui pour confirmation. Além De plus, il existe un bouton d’annulation d’urgence toujours visible sur l’interface superposée, qui vous permet d’abandonner l’automatisation instantanément, en fermant la fenêtre virtuelle sécurisée et en restituant le contrôle manuel de l’écran. Essa Une surveillance rigoureuse est fondamentale pour éviter les accidents, les envois de véhicules de transport locaux incorrects ou toute action indépendante qui permet de réaliser des transports ou des coûts financiers, garantissant que la technologie est établie comme un facilitateur de rotin et n’importe qui. comme un agent indépendant sans supervision humaine.

Expansion géographique et nouvelles langues

La disponibilité actuelle, limitée sur le marché, des Estados Unidos et Coreia sert de laboratoire en temps réel pour l’amélioration continue des algorithmes de navigation visuelle et de compréhension du contexte. L’expansion de la fonctionnalité à de nouveaux pays et l’inclusion du support pour d’autres langues se feront progressivement au cours des prochains mois, en fonction directement des résultats de stabilité obtenus lors de cette phase de test et de l’adaptation du système aux différentes configurations d’applications régionales.

Changer le paradigme de l’interaction mobile

L’introduction d’agents autonomes capables d’exploiter des interfaces graphiques dans l’écosystème mobile représente une évolution technique significative dans la manière dont les gens interagissent avec leurs smartphones. Le passage de commandes de base basées sur des tapotements répétitifs sur l’écran à des instructions verbales complètes qui génèrent des actions concrètes réduit le temps consacré aux tâches bureaucratiques de la vie numérique quotidienne.

L’accent mis sur le développement d’outils qui exploitent des applications tierces de manière indépendante démontre la maturation des réseaux de neurones appliqués à la consommation et à la productivité. L’objectif technique est que l’assistant soit capable de gérer des routines encore plus complexes et interconnectées dans les futures mises à jour, consolidant ainsi les appareils haut de gamme en véritables centres de commande automatisés pour la vie urbaine.

Veja Tambem em Actualités (FR)