Notizie (IT)

Google lancia la nuova automazione avanzata Gemini per le app sulla gamma Pixel 10 e Galaxy S26

Gemini
Foto: Gemini - Mehaniq/shutterstock.com

Google ha iniziato a rilasciare una nuova funzionalità di automazione delle attività in più passaggi per l’assistente Gemini su dispositivi mobili selezionati. La nuova funzionalità consente all’intelligenza artificiale di eseguire azioni complesse direttamente all’interno di applicazioni di terze parti, senza la necessità di un costante intervento manuale da parte del proprietario dello smartphone per ogni clic o scorrimento.

La novità arriva inizialmente in formato beta ed è riservata ai modelli più recenti e all’avanguardia del mercato della tecnologia mobile. I dispositivi inclusi in questa prima fase di implementazione includono Google Pixel 10, Pixel 10 Pro e Pixel 10 Pro

Il lancio ufficiale è avvenuto contemporaneamente in Estados Unidos e Coreia, mercati scelti strategicamente per testare la stabilità dello strumento in scenari di utilizzo intenso prima di un lancio globale. L’attivazione del sistema è semplice e richiede solo un comando vocale dettagliato dopo aver premuto a lungo il pulsante laterale del dispositivo.

Esecuzione di comandi complessi nella vita di tutti i giorni

La principale innovazione del sistema risiede nella sua capacità di interpretare ed eseguire richieste che richiedono la navigazione sequenziale attraverso diverse schermate, menu e finestre di dialogo. L’assistente digitale prende temporaneamente il controllo dell’interfaccia dell’applicazione scelta per eseguire azioni pratiche, come richiedere il trasporto privato da un punto a un altro o ordinare pasti specifici sulle piattaforme di consegna.

Durante il processo di esecuzione, l’intelligenza artificiale analizza le opzioni disponibili nell’interfaccia grafica, compila moduli di indirizzo e seleziona gli elementi in base alle preferenze storiche dell’utente. Il sistema dispone di un blocco di sicurezza che mette automaticamente in pausa l’operazione e richiede l’approvazione finale sullo schermo prima di completare qualsiasi transazione finanziaria o confermare un ordine.

Funzionamento in un ambiente virtuale isolato

Per garantire l’integrità dei dati personali, Gemini esegue tutte le automazioni all’interno di una finestra virtuale sicura e completamente isolata dal resto del sistema operativo dello smartphone. Il metodo di incapsulamento Esse impedisce all’intelligenza artificiale di accedere a informazioni non autorizzate, leggere documenti privati ​​o modificare le impostazioni critiche del dispositivo durante la navigazione in applicazioni di terze parti.

L’assistente segue scrupolosamente le istruzioni fornite nel comando vocale iniziale, limitando la propria azione esclusivamente all’ambito del compito richiesto dall’individuo. Se l’utente chiede di acquistare un espresso, lo strumento aprirà solo l’app del bar corrispondente, ignorando completamente gli sms, le email di lavoro o le gallerie fotografiche presenti nella memoria del dispositivo.

L’architettura software sviluppata per questa funzione consente che il processo avvenga in modo invisibile in background o attraverso un’interfaccia traslucida sovrapposta allo schermo principale. Isso garantisce che il normale flusso di utilizzo del telefono non venga interrotto bruscamente, consentendo alla persona di continuare a leggere un articolo o guardare un video mentre l’ordine viene elaborato.

Applicazioni compatibili in fase di test

In questa fase iniziale di test pubblico, la funzionalità copre categorie specifiche di servizi on-demand che fanno parte della routine quotidiana di milioni di consumatori. Il supporto ufficiale al lancio include popolari piattaforme di consegna di cibo come DoorDash, Grubhub e Uber Eats, che semplificano la ripetizione degli ordini di routine con una sola frase pronunciata.

Nel settore della mobilità urbana il sistema si integra nativamente con gli applicativi Uber e Lyft per ottimizzare gli spostamenti in città. L’utente può semplicemente inserire la destinazione desiderata in linguaggio naturale e l’assistente si occupa di aprire la mappa, inserire l’indirizzo esatto, confrontare le categorie di veicoli disponibili e presentare il preventivo di prezzo finale per l’approvazione.

Per la fornitura domestica, l’integrazione con il servizio Instacart consente la rapida composizione di carrelli virtuali sulla base delle liste della spesa precedenti o di ricette specifiche. L’intelligenza artificiale può identificare i prodotti richiesti, cercare le migliori opzioni nel catalogo del negozio e persino suggerire valide sostituzioni se un articolo specifico è esaurito presso il punto vendita selezionato.

Nel mercato sudcoreano, la fase beta comprende servizi locali ad alta richiesta per adattare il modello linguistico alle diverse culture dei consumatori e alle interfacce regionali. Aplicativos di ampia portata nel Paese, come Kakao T per la mobilità e Kaemin per l’energia, sono stati inclusi nell’elenco di compatibilità per garantire che i test riflettano l’uso effettivo della popolazione locale.

Elaborazione locale e ottimizzazione dell’hardware

L’esclusività temporanea della risorsa per le linee Pixel 10 e Galaxy S26 è dovuta alla necessità imperativa di hardware altamente ottimizzato per l’elaborazione di modelli di intelligenza artificiale direttamente sul dispositivo. Gli smartphone Esses sono dotati di unità di elaborazione neurale all’avanguardia in grado di gestire l’enorme carico computazionale richiesto dalla navigazione autonoma delle app senza fare affidamento esclusivamente sui server cloud. L’approccio di elaborazione ibrida Essa riduce drasticamente la latenza delle risposte dell’assistente e garantisce che l’esecuzione delle attività avvenga in modo fluido e senza intoppi, anche in situazioni in cui la connettività Internet mobile è instabile o lenta.

La partnership tecnica tra i produttori di hardware e il team di sviluppo del sistema operativo ha portato a una profonda integrazione tra l’assistente virtuale e il livello fisico dei dispositivi mobili. L’esecuzione locale delle attività non solo migliora la velocità delle automazioni quotidiane, ma riduce anche il consumo della batteria rispetto ai processi precedenti che richiedevano il trasferimento costante di pacchetti di dati su Internet. Il sistema operativo è in grado di identificare i modelli di utilizzo del proprietario e allocare dinamicamente le risorse RAM, garantendo che il telefono mantenga le massime prestazioni di navigazione mentre l’assistente lavora silenziosamente per eseguire comandi complessi in background.

Controllo e monitoraggio continui delle azioni

Nonostante l’elevato grado di autonomia concesso all’intelligenza artificiale per navigare tra le interfacce, l’architettura del sistema è stata progettata con l’obiettivo di mantenere il proprietario del dispositivo nell’assoluto controllo di tutte le fasi dell’operazione digitale. In qualsiasi momento, mentre esegue un’attività complessa, l’utente riceve notifiche visive e avvisi in tempo reale che descrivono esattamente quale azione sta intraprendendo l’assistente in quel millisecondo, come selezionare un ristorante specifico dal catalogo o inserire un indirizzo di consegna nel modulo. Se lo strumento incontra un’ambiguità durante il processo, ad esempio due filiali dello stesso negozio situate vicino alla posizione di destinazione, interrompe immediatamente il flusso di automazione e visualizza un pannello sullo schermo che richiede chiarimenti verbali o un tocco per conferma. Além Inoltre, è presente un pulsante di annullamento di emergenza sempre visibile sull’interfaccia in overlay, che consente di interrompere istantaneamente l’automazione, chiudendo la finestra virtuale protetta e restituendo il controllo manuale dello schermo. Essa una rigorosa supervisione è fondamentale per evitare acquisti accidentali, invii di veicoli di trasporto per luoghi errati o qualsiasi altra azione indesiderata che possa generare transazioni o danni finanziari, garantendo che la tecnologia agisca esclusivamente come un facilitatore di rotazioni e non come un agente indipendente senza devida supervisão humana.

Espansione geografica e nuove lingue

L’attuale disponibilità limitata sul mercato di Estados Unidos e Coreia funge da laboratorio in tempo reale per il miglioramento continuo della navigazione visiva e degli algoritmi di comprensione del contesto. L’espansione della funzionalità a nuovi paesi e l’inclusione del supporto per altre lingue avverrà gradualmente nel corso dei prossimi mesi, in diretta dipendenza dei risultati di stabilità ottenuti in questa fase di test e dell’adattamento del sistema ai diversi layout applicativi regionali.

Cambiare il paradigma dell’interazione mobile

L’introduzione di agenti autonomi in grado di gestire interfacce grafiche nell’ecosistema mobile rappresenta un’evoluzione tecnica significativa nel modo in cui le persone interagiscono con i propri smartphone. Il passaggio da comandi di base basati su tocchi ripetitivi sullo schermo a istruzioni verbali complete che generano azioni concrete riduce il tempo dedicato alle attività burocratiche della vita digitale quotidiana.

L’attenzione allo sviluppo di strumenti che gestiscono applicazioni di terze parti in modo indipendente dimostra la maturazione delle reti neurali applicate al consumo e alla produttività. L’aspettativa tecnica è che nei futuri aggiornamenti l’assistente sarà in grado di gestire routine ancora più complesse e interconnesse, consolidando i dispositivi premium come veri e propri centri di comando automatizzati per la vita urbana.