Το Google ξεκίνησε να κυκλοφορεί μια νέα δυνατότητα αυτοματισμού εργασιών πολλαπλών βημάτων για τον βοηθό Gemini σε επιλεγμένες κινητές συσκευές. Η νέα λειτουργικότητα επιτρέπει στην τεχνητή νοημοσύνη να εκτελεί πολύπλοκες ενέργειες απευθείας σε εφαρμογές τρίτων, χωρίς την ανάγκη συνεχούς χειροκίνητης παρέμβασης από τον ιδιοκτήτη του smartphone για κάθε κλικ ή κύλιση.
Η νέα δυνατότητα έρχεται αρχικά σε μορφή beta και περιορίζεται στα πιο πρόσφατα μοντέλα αιχμής στην αγορά κινητής τεχνολογίας. Οι συσκευές που περιλαμβάνονται σε αυτήν την πρώτη φάση υλοποίησης περιλαμβάνουν τα Google Pixel 10, Pixel 10 Pro και Pixel 10 Pro
Η επίσημη κυκλοφορία πραγματοποιήθηκε ταυτόχρονα σε Estados Unidos και Coreia, αγορές που επιλέχθηκαν στρατηγικά για να δοκιμάσουν τη σταθερότητα του εργαλείου σε σενάρια έντονης χρήσης πριν από την παγκόσμια κυκλοφορία. Η ενεργοποίηση του συστήματος είναι απλή, απαιτεί μόνο μια λεπτομερή φωνητική εντολή μετά το πάτημα του πλαϊνού κουμπιού της συσκευής για μεγάλο χρονικό διάστημα.
Εκτέλεση σύνθετων εντολών στην καθημερινή ζωή
Η κύρια καινοτομία του συστήματος έγκειται στην ικανότητά του να ερμηνεύει και να εκτελεί αιτήματα που απαιτούν διαδοχική πλοήγηση μέσω διαφορετικών οθονών, μενού και πλαισίων διαλόγου. Ο ψηφιακός βοηθός αναλαμβάνει τον προσωρινό έλεγχο της διεπαφής της επιλεγμένης εφαρμογής για να πραγματοποιήσει πρακτικές ενέργειες, όπως η αίτηση ιδιωτικής μεταφοράς από το ένα σημείο στο άλλο ή η παραγγελία συγκεκριμένων γευμάτων σε πλατφόρμες παράδοσης.
Κατά τη διαδικασία εκτέλεσης, η τεχνητή νοημοσύνη αναλύει τις διαθέσιμες επιλογές στη γραφική διεπαφή, συμπληρώνει φόρμες διευθύνσεων και επιλέγει στοιχεία με βάση τις ιστορικές προτιμήσεις του χρήστη. Το σύστημα διαθέτει κλείδωμα ασφαλείας που διακόπτει αυτόματα τη λειτουργία και ζητά την τελική έγκριση στην οθόνη πριν ολοκληρώσει οποιαδήποτε οικονομική συναλλαγή ή επιβεβαιώσει μια παραγγελία.
Λειτουργία σε απομονωμένο εικονικό περιβάλλον
Για να εγγυηθεί την ακεραιότητα των προσωπικών δεδομένων, το Gemini εκτελεί όλους τους αυτοματισμούς μέσα σε ένα ασφαλές εικονικό παράθυρο που είναι εντελώς απομονωμένο από το υπόλοιπο λειτουργικό σύστημα του smartphone. Η μέθοδος ενθυλάκωσης Esse αποτρέπει την τεχνητή νοημοσύνη από την πρόσβαση σε μη εξουσιοδοτημένες πληροφορίες, την ανάγνωση ιδιωτικών εγγράφων ή την τροποποίηση κρίσιμων ρυθμίσεων συσκευής κατά την περιήγηση σε εφαρμογές τρίτων.
Ο βοηθός ακολουθεί αυστηρά τις οδηγίες που παρέχονται στην αρχική φωνητική εντολή, περιορίζοντας τη δράση του αποκλειστικά στο εύρος της εργασίας που ζητά το άτομο. Εάν ο χρήστης ζητήσει να αγοράσει έναν εσπρέσο, το εργαλείο θα ανοίξει μόνο την αντίστοιχη εφαρμογή καφέ, αγνοώντας εντελώς τα μηνύματα κειμένου, τα email εργασίας ή τις γκαλερί φωτογραφιών που υπάρχουν στη μνήμη της συσκευής.
Η αρχιτεκτονική λογισμικού που αναπτύχθηκε για αυτήν τη λειτουργία επιτρέπει στη διαδικασία να εμφανίζεται αόρατα στο παρασκήνιο ή μέσω μιας ημιδιαφανούς διεπαφής που βρίσκεται πάνω στην κύρια οθόνη. Το Isso διασφαλίζει ότι η κανονική ροή χρήσης του τηλεφώνου δεν διακόπτεται απότομα, επιτρέποντας στο άτομο να συνεχίσει να διαβάζει ένα άρθρο ή να παρακολουθεί ένα βίντεο κατά την επεξεργασία της παραγγελίας.
Συμβατές εφαρμογές σε δοκιμαστική φάση
Σε αυτό το αρχικό στάδιο των δημόσιων δοκιμών, η λειτουργικότητα καλύπτει συγκεκριμένες κατηγορίες υπηρεσιών κατά παραγγελία που αποτελούν μέρος της καθημερινής ρουτίνας εκατομμυρίων καταναλωτών. Η επίσημη υποστήριξη κυκλοφορίας περιλαμβάνει δημοφιλείς πλατφόρμες παράδοσης φαγητού όπως DoorDash, Grubhub και Uber Eats, καθιστώντας εύκολη την επανάληψη παραγγελιών ρουτίνας με μία μόνο προφορική πρόταση.
Στον τομέα της αστικής κινητικότητας, το σύστημα ενσωματώνεται εγγενώς με τις εφαρμογές Uber και Lyft για τη βελτιστοποίηση της κίνησης στις πόλεις. Ο χρήστης μπορεί απλώς να εισάγει τον επιθυμητό προορισμό σε φυσική γλώσσα και ο βοηθός φροντίζει να ανοίξει τον χάρτη, να εισαγάγει την ακριβή διεύθυνση, να συγκρίνει τις διαθέσιμες κατηγορίες οχημάτων και να παρουσιάσει την τελική εκτίμηση τιμής για έγκριση.
Για εγχώρια προμήθεια, η ενοποίηση με την υπηρεσία Instacart επιτρέπει τη γρήγορη συναρμολόγηση εικονικών καροτσιών αγορών με βάση προηγούμενες λίστες αγορών ή συγκεκριμένες συνταγές. Η τεχνητή νοημοσύνη μπορεί να αναγνωρίσει τα ζητούμενα προϊόντα, να αναζητήσει τις καλύτερες επιλογές στον κατάλογο του καταστήματος και ακόμη και να προτείνει βιώσιμες αντικαταστάσεις εάν ένα συγκεκριμένο προϊόν είναι εκτός αποθέματος στην επιλεγμένη εγκατάσταση.
Στην αγορά της Νότιας Κορέας, η φάση beta περιλαμβάνει τοπικές υπηρεσίες υψηλής ζήτησης για την προσαρμογή του γλωσσικού μοντέλου σε διαφορετικές καταναλωτικές κουλτούρες και περιφερειακές διεπαφές. Aplicativos ευρείας εμβέλειας στη χώρα, όπως Kakao T για κινητικότητα και Kaemin για ισχύ, έχουν συμπεριληφθεί στη λίστα συμβατότητας για να διασφαλιστεί ότι οι δοκιμές αντικατοπτρίζουν την πραγματική χρήση του τοπικού πληθυσμού.
Τοπική επεξεργασία και βελτιστοποίηση υλικού
Η προσωρινή αποκλειστικότητα του πόρου για τις γραμμές Pixel 10 και Galaxy S26 οφείλεται στην επιτακτική ανάγκη για εξαιρετικά βελτιστοποιημένο υλικό για την επεξεργασία μοντέλων τεχνητής νοημοσύνης απευθείας στη συσκευή. Τα smartphone Esses είναι εξοπλισμένα με υπερσύγχρονες μονάδες νευρωνικής επεξεργασίας, ικανές να χειρίζονται το τεράστιο υπολογιστικό φορτίο που απαιτείται από την αυτόνομη πλοήγηση εφαρμογών χωρίς να βασίζονται αποκλειστικά σε διακομιστές cloud. Η υβριδική προσέγγιση επεξεργασίας Essa μειώνει δραστικά τον λανθάνοντα χρόνο των απαντήσεων του βοηθού και διασφαλίζει ότι η εκτέλεση των εργασιών πραγματοποιείται ομαλά και χωρίς προβλήματα, ακόμη και σε καταστάσεις όπου η σύνδεση στο Διαδίκτυο κινητής τηλεφωνίας είναι ασταθής ή αργή.
Η τεχνική συνεργασία μεταξύ των κατασκευαστών υλικού και της ομάδας ανάπτυξης λειτουργικού συστήματος είχε ως αποτέλεσμα τη βαθιά ενοποίηση μεταξύ του εικονικού βοηθού και του φυσικού επιπέδου των κινητών συσκευών. Η εκτέλεση εργασιών τοπικά όχι μόνο βελτιώνει την ταχύτητα των καθημερινών αυτοματισμών, αλλά μειώνει επίσης την κατανάλωση μπαταρίας σε σύγκριση με παλαιότερες διαδικασίες που απαιτούσαν συνεχή μεταφορά πακέτων δεδομένων μέσω Διαδικτύου. Το λειτουργικό σύστημα μπορεί να αναγνωρίσει τα μοτίβα χρήσης του κατόχου και να εκχωρήσει δυναμικά πόρους RAM, διασφαλίζοντας ότι το τηλέφωνο διατηρεί κορυφαία απόδοση περιήγησης ενώ ο βοηθός λειτουργεί αθόρυβα για να εκτελεί περίπλοκες εντολές στο παρασκήνιο.
Συνεχής έλεγχος και παρακολούθηση των ενεργειών
Παρά τον υψηλό βαθμό αυτονομίας που παρέχεται στην τεχνητή νοημοσύνη για την πλοήγηση στις διεπαφές, η αρχιτεκτονική του συστήματος σχεδιάστηκε με στόχο να διατηρεί τον ιδιοκτήτη της συσκευής στον απόλυτο έλεγχο όλων των σταδίων της ψηφιακής λειτουργίας. Ανά πάσα στιγμή κατά την εκτέλεση μιας σύνθετης εργασίας, ο χρήστης λαμβάνει οπτικές ειδοποιήσεις και ειδοποιήσεις σε πραγματικό χρόνο που περιγράφουν ακριβώς τη δράση που κάνει ο βοηθός σε αυτό το χιλιοστό του δευτερολέπτου, όπως η επιλογή ενός συγκεκριμένου εστιατορίου από τον κατάλογο ή η εισαγωγή μιας διεύθυνσης παράδοσης στη φόρμα. Εάν το εργαλείο αντιμετωπίσει μια ασάφεια κατά τη διάρκεια της διαδικασίας, όπως δύο υποκαταστήματα του ίδιου καταστήματος που βρίσκονται κοντά στη θέση-στόχο, διακόπτει αμέσως τη ροή αυτοματισμού και εμφανίζει ένα πλαίσιο στην οθόνη που ζητά προφορική διευκρίνιση ή ένα πάτημα για επιβεβαίωση. Além Επιπλέον, υπάρχει ένα κουμπί ακύρωσης έκτακτης ανάγκης πάντα ορατό στη διεπαφή επικάλυψης, το οποίο σας επιτρέπει να ακυρώσετε τον αυτοματισμό αμέσως, κλείνοντας το ασφαλές εικονικό παράθυρο και επιστρέφοντας τον χειροκίνητο έλεγχο της οθόνης. Essa camada rigorosa de supervisão é fundamental para evitar compras acidentais, envios de veículos de transporte para locais incorretos ou qualquer outra ação indesejada que possa gerar transtornos ou parauízos financequeiros, garantindo facilitador de rotinas e nunca como um agente ανεξάρτητα sem a devida supervisão humana.
Γεωγραφική επέκταση και νέες γλώσσες
Η τρέχουσα περιορισμένη από την αγορά διαθεσιμότητα των Estados Unidos και Coreia χρησιμεύει ως εργαστήριο σε πραγματικό χρόνο για τη συνεχή βελτίωση των αλγορίθμων οπτικής πλοήγησης και κατανόησης περιβάλλοντος. Η επέκταση της δυνατότητας σε νέες χώρες και η συμπερίληψη υποστήριξης για άλλες γλώσσες θα πραγματοποιηθεί σταδιακά τους επόμενους μήνες, άμεσα ανάλογα με τα αποτελέσματα σταθερότητας που λαμβάνονται σε αυτήν τη φάση δοκιμών και την προσαρμογή του συστήματος σε διαφορετικές διατάξεις περιφερειακών εφαρμογών.
Αλλαγή του παραδείγματος αλληλεπίδρασης με κινητά
Η εισαγωγή αυτόνομων πρακτόρων ικανών να λειτουργούν γραφικές διεπαφές στο οικοσύστημα κινητής τηλεφωνίας αντιπροσωπεύει μια σημαντική τεχνική εξέλιξη στον τρόπο με τον οποίο οι άνθρωποι αλληλεπιδρούν με τα smartphone τους. Η μετάβαση από τις βασικές εντολές που βασίζονται σε επαναλαμβανόμενα χτυπήματα στην οθόνη σε ολοκληρωμένες προφορικές οδηγίες που παράγουν συγκεκριμένες ενέργειες μειώνει τον χρόνο που αφιερώνεται σε γραφειοκρατικές εργασίες της καθημερινής ψηφιακής ζωής.
Η εστίαση στην ανάπτυξη εργαλείων που λειτουργούν ανεξάρτητα εφαρμογές τρίτων καταδεικνύει την ωρίμανση των νευρωνικών δικτύων που εφαρμόζονται στην κατανάλωση και την παραγωγικότητα. Η τεχνική προσδοκία είναι ότι ο βοηθός θα είναι σε θέση να διαχειρίζεται ακόμη πιο περίπλοκες και διασυνδεδεμένες ρουτίνες σε μελλοντικές ενημερώσεις, ενοποιώντας συσκευές premium ως πραγματικά αυτοματοποιημένα κέντρα εντολών για την αστική ζωή.

