Η Apple δοκιμάζει τη νέα λειτουργία Siri για την εκτέλεση πολλαπλών φωνητικών εντολών ταυτόχρονα σε συσκευές

Siri

Siri - sdx15 / Shutterstock.com

Ο τεχνολογικός γίγαντας έχει ξεκινήσει τη φάση δοκιμών μιας νέας λειτουργικότητας για τον εικονικό του βοηθό, που επιτρέπει την εκτέλεση πολλαπλών εντολών από μία μόνο φωνητική εντολή. Το εργαλείο αλλάζει τον τρόπο με τον οποίο οι χρήστες αλληλεπιδρούν με τις συσκευές της επωνυμίας, εξαλείφοντας την ανάγκη παύσης μεταξύ διαφορετικών αιτημάτων. Ο πόρος επεξεργάζεται σύνθετες προτάσεις και προσδιορίζει διαφορετικές ενέργειες στο ίδιο αίτημα, εκτελώντας τις διαδοχικά και αυτόματα.

Αυτή η ενημέρωση αποτελεί μέρος ενός μεγαλύτερου πακέτου εκσυγχρονισμού λειτουργικού συστήματος που επικεντρώνεται στη γενετική τεχνητή νοημοσύνη και την επεξεργασία φυσικής γλώσσας. Η αρχιτεκτονική του λογισμικού αναδιαρθρώθηκε για να κατανοήσει το πλαίσιο των συνομιλιών, επιτρέποντας στον βοηθό να διατηρεί προηγούμενα αιτήματα στη μνήμη και να εφαρμόζει αυτές τις πληροφορίες σε επόμενες αλληλεπιδράσεις. Η αλλαγή αντιπροσωπεύει τη μετάβαση από ένα άκαμπτο μοντέλο εντολών σε μια πιο ρευστή διεπαφή συνομιλίας.

सिरी एप्पल – sdx15 / शटरस्टॉक.कॉम

Οι προγραμματιστές της εταιρείας εργάζονται για τη βαθμονόμηση των αλγορίθμων για να διασφαλίσουν ότι η ταυτόχρονη διερμηνεία δεν οδηγεί σε συγκρούσεις εκτέλεσης. Η δυνατότητα αλυσίδας εργασιών απαιτεί ανώτερη επεξεργαστική ισχύ, η οποία κατευθύνει τη διαθεσιμότητα αυτής της λειτουργίας στο πιο πρόσφατο υλικό του κατασκευαστή.

Η εφαρμογή πραγματοποιείται σταδιακά σε δοκιμαστικές εκδόσεις λειτουργικών συστημάτων για κινητές συσκευές και υπολογιστές. Ο κύριος στόχος είναι η βελτίωση της σημασιολογικής κατανόησης πριν από την επίσημη κυκλοφορία στο ευρύ κοινό.

Η νέα οπτική διεπαφή μεταμορφώνει την αλληλεπίδραση με το σύστημα

Ο επανασχεδιασμός του εικονικού βοηθού περιλαμβάνει μια σημαντική οπτική αλλαγή στη γραφική διεπαφή των συσκευών. Το παλιό σφαιρικό εικονίδιο που εμφανίστηκε στο κάτω μέρος της οθόνης κατά την ενεργοποίηση του εργαλείου έχει αντικατασταθεί από ένα φωτεινό περίγραμμα που περιβάλλει ολόκληρη την οθόνη. Η οπτική σηματοδότηση Essa υποδεικνύει ότι το σύστημα ακούει και επεξεργάζεται πληροφορίες, ενσωματώνοντας με πιο οργανικό τρόπο τη χρήση της συσκευής χωρίς να διακόπτει την προβολή της εφαρμογής που είναι ανοιχτή αυτήν τη στιγμή.

Εκτός από την αισθητική αλλαγή, η νέα διεπαφή επιτρέπει την αλληλεπίδραση κειμένου με φυσικό τρόπο, με δύο μόνο αγγίγματα στο κάτω μέρος της οθόνης για να ανοίξει ένα αποκλειστικό πληκτρολόγιο. Ο χρήστης μπορεί να εναλλάσσεται μεταξύ φωνητικών εντολών και να πληκτρολογεί απρόσκοπτα, ανάλογα με το περιβάλλον στο οποίο βρίσκεται. Η φωτεινή άκρη αντιδρά δυναμικά στον τόνο της φωνής και στην πολυπλοκότητα της επεξεργασίας, παρέχοντας άμεση οπτική ανατροφοδότηση σχετικά με την κατάσταση του εν εξελίξει αιτήματος.

Εκτέλεση εργασιών αλυσίδας στη ρουτίνα των χρηστών

Η αλυσιδωτή εκτέλεση εντολών επιτρέπει σε μία μόνο πρόταση να ενεργοποιεί διαφορετικές εφαρμογές και λειτουργίες συστήματος. Ο χρήστης μπορεί να ζητήσει από τον βοηθό να τραβήξει μια φωτογραφία και, στην ίδια πρόταση, να παραγγείλει την αποστολή της εικόνας σε μια συγκεκριμένη επαφή σε μια εφαρμογή ανταλλαγής μηνυμάτων.

Η επεξεργασία χωρίζει την πρόταση σε ξεχωριστές προθέσεις: ενεργοποιεί την κάμερα, καταγράφει τα μέσα, ανοίγει το messenger, εντοπίζει την επαφή και επιβεβαιώνει την αποστολή. Todo Αυτή η ροή συμβαίνει στο παρασκήνιο, απαιτώντας ελάχιστη χειροκίνητη παρέμβαση.

Ένα άλλο πρακτικό παράδειγμα περιλαμβάνει τη διαχείριση προσωπικών πληροφοριών, όπως το να ζητάτε να βρείτε μια συγκεκριμένη διεύθυνση που αναφέρεται σε ένα email και να την προσθέσετε απευθείας σε ένα συμβάν στο ημερολόγιο. Ο βοηθός μεταφέρει δεδομένα μεταξύ της εφαρμογής email και του ημερολογίου αυτόνομα.

Απαιτήσεις υλικού για προηγμένη επεξεργασία

Η εκτέλεση προηγμένων μοντέλων γλώσσας απευθείας στη συσκευή απαιτεί συγκεκριμένα στοιχεία υλικού, τα οποία περιορίζουν την καινοτομία στους πιο πρόσφατους επεξεργαστές της μάρκας. Τα τσιπ πρέπει να περιέχουν μονάδες νευρωνικής επεξεργασίας ικανές να εκτελούν τρισεκατομμύρια λειτουργίες ανά δευτερόλεπτο, διασφαλίζοντας ότι η ερμηνεία πολλαπλών εντολών λαμβάνει χώρα χωρίς αισθητή καθυστέρηση.

Η απαίτηση μνήμης RAM λειτουργεί επίσης ως καθοριστικός παράγοντας για τη λειτουργία του εργαλείου, καθώς τα μοντέλα τεχνητής νοημοσύνης πρέπει να φορτωθούν στην προσωρινή μνήμη για άμεση πρόσβαση. Το Aparelhos των προηγούμενων γενεών δεν θα λάβει πλήρη λειτουργικότητα εντολών αλυσίδας λόγω αυτών των φυσικών αρχιτεκτονικών περιορισμών.

Δείτε Επίσης

Η τοπική επεξεργασία είναι απαραίτητη για τη διατήρηση της αναμενόμενης ταχύτητας απόκρισης στις φωνητικές αλληλεπιδράσεις. Quando ο χρήστης υπαγορεύει μια ακολουθία ενεργειών, το σύστημα πρέπει να αποκωδικοποιήσει τον ήχο, να τον μετατρέψει σε κείμενο, να εντοπίσει τις προθέσεις και να ενεργοποιήσει τις αντίστοιχες διεπαφές προγραμματισμού σε κλάσματα του δευτερολέπτου.

Η εξάρτηση από υλικό προηγμένης τεχνολογίας αντανακλά την υπολογιστική πολυπλοκότητα της αντιμετώπισης της μη δομημένης φυσικής γλώσσας. Η εταιρεία έχει βελτιστοποιήσει τους επεξεργαστές της για να χειρίζεται συγκεκριμένα αυτούς τους φόρτους εργασίας τεχνητής νοημοσύνης με αποδοτικό τρόπο.

Αρχιτεκτονική ασφάλειας και απορρήτου δεδομένων εσωτερικής εγκατάστασης

Η αρχιτεκτονική του συστήματος δίνει προτεραιότητα στην τοπική επεξεργασία πληροφοριών, διασφαλίζοντας ότι τα φωνητικά δεδομένα και οι προσωπικές πληροφορίες που έχουν πρόσβαση κατά τη διάρκεια πολλαπλών εντολών δεν φεύγουν από τη συσκευή. Η σημασιολογική ευρετηρίαση και η εκτέλεση εργασιών πραγματοποιούνται μεμονωμένα στο κύριο τσιπ. Η τεχνική προσέγγιση Essa αποτρέπει την έκθεση ευαίσθητων πληροφοριών, όπως το περιεχόμενο μηνυμάτων ή συναντήσεων ημερολογίου, σε εξωτερικούς διακομιστές κατά την ερμηνεία των παραγγελιών.

Για αιτήματα που απαιτούν μεγαλύτερη υπολογιστική ισχύ, η εταιρεία έχει αναπτύξει μια αποκλειστική υποδομή υπολογιστικού νέφους. Τα δεδομένα που αποστέλλονται σε αυτούς τους διακομιστές υποβάλλονται σε επεξεργασία χωρίς μόνιμη αποθήκευση και με κρυπτογράφηση από άκρο σε άκρο, αποκλείοντας την πρόσβαση τρίτων ή του ίδιου του κατασκευαστή. Η μετάβαση μεταξύ τοπικής επεξεργασίας και cloud πραγματοποιείται αόρατα για τον χρήστη, διατηρώντας πρωτόκολλα ασφαλείας ανεξάρτητα από την πολυπλοκότητα της εντολής που ζητήθηκε.

Βαθμονόμηση αλγορίθμου και έλεγχος ακρίβειας

Οι μηχανικοί λογισμικού εκτελούν μια εξαντλητική σειρά εσωτερικών δοκιμών για να αξιολογήσουν το ποσοστό επιτυχίας του βοηθού όταν αντιμετωπίζουν διφορούμενες οδηγίες ή διπλές εντολές που διατυπώνονται με σύνθετη σύνταξη. Η διαδικασία επικύρωσης περιλαμβάνει την προσομοίωση χιλιάδων καθημερινών σεναρίων όπου η τεχνητή νοημοσύνη πρέπει να αποφασίσει τη σωστή σειρά εκτέλεσης εργασιών και να εντοπίσει πιθανά λογικά σφάλματα πριν ολοκληρώσει την ενέργεια. Η ομάδα ανάπτυξης παρακολουθεί μετρήσεις απόδοσης, όπως ο χρόνος απόκρισης μεταξύ του τέλους της ομιλίας του χρήστη και της αρχής της πρώτης ενέργειας, καθώς και τη ρευστότητα στη μετάβαση μεταξύ των ενεργοποιημένων εφαρμογών. Ο κεντρικός στόχος αυτής της φάσης δοκιμής είναι να εξαλειφθούν περιπτώσεις στις οποίες το σύστημα εκτελεί μόνο το πρώτο μισό της εντολής και αγνοεί το δεύτερο, ένα κοινό πρόβλημα σε προηγούμενες εκδόσεις επεξεργασίας φυσικής γλώσσας. Η βαθμονόμηση των αλγορίθμων πρόθεσης προσαρμόζεται καθημερινά με βάση τις αναφορές σφαλμάτων που δημιουργούνται από συσκευές δοκιμής, διασφαλίζοντας ότι η τελική έκδοση προσφέρει μια συνεπή εμπειρία χωρίς λειτουργικές διακοπές.

Εργαλεία για ανεξάρτητους προγραμματιστές

Η επέκταση πολλαπλών εντολών εξαρτάται από την υιοθέτηση νέων διεπαφών προγραμματισμού εφαρμογών από ανεξάρτητους προγραμματιστές. Ο κατασκευαστής κυκλοφόρησε συγκεκριμένα εργαλεία που επιτρέπουν στους δημιουργούς λογισμικού να χαρτογραφούν τις λειτουργίες των εφαρμογών τους, καθιστώντας τις προσβάσιμες στον βοηθό και ικανό να συνδυαστεί με ενέργειες από άλλα προγράμματα που είναι εγκατεστημένα στη συσκευή.

Σημασιολογική κατανόηση και διόρθωση σε πραγματικό χρόνο

Τα τεχνολογικά θεμέλια του νέου βοηθού στηρίζονται σε μια πλήρως ξαναγραμμένη μηχανή επεξεργασίας φυσικής γλώσσας. Το σύστημα Este δεν βασίζεται πλέον σε προ-προγραμματισμένες φράσεις ή κανόνες ετικέτας για συγκεκριμένες λέξεις για την εκκίνηση μιας ενέργειας. Η σημασιολογική κατανόηση επιτρέπει στον χρήστη να μιλά στην καθομιλουμένη, να τραυλίζει, να διορθώνει τη μέση πρόταση ή να αλλάζει γνώμη και το σύστημα μπορεί να εξαγάγει την τελική πρόθεση και να εκτελέσει σωστά τις πολλαπλές εντολές που ζητήθηκαν.

Essa Η γνωστική ευελιξία αντιπροσωπεύει ένα σημαντικό τεχνικό άλμα στην αλληλεπίδραση ανθρώπου-υπολογιστή. Anteriormente, ένα σφάλμα στη διατύπωση εντολών απαιτούσε από τον χρήστη να ακυρώσει τη λειτουργία και να ξεκινήσει ξανά από την αρχή. Agora, η τεχνητή νοημοσύνη αναλύει το πλαίσιο ολόκληρης της πρότασης πριν ξεκινήσει την αλυσίδα των ενεργειών, προσδιορίζοντας ποιο μέρος της εντολής ακυρώνει την προηγούμενη. Αυτή η ικανότητα προσαρμογής σε πραγματικό χρόνο φέρνει την αλληλεπίδραση με το μηχάνημα πιο κοντά σε μια φυσική ανθρώπινη συνομιλία, μειώνοντας την ανάγκη για ρομποτικές εντολές και αυξάνοντας την αποτελεσματικότητα στη χρήση των εργαλείων του λειτουργικού συστήματος.

Τεχνολογική διαμάχη στον τομέα εικονικών βοηθών

Η ανάπτυξη αυτών των νέων δυνατοτήτων ανταποκρίνεται άμεσα στις προόδους που παρουσιάζονται από ανταγωνιστικές εταιρείες στον τομέα της τεχνολογίας. Η αγορά εικονικών βοηθών έχει υποστεί ταχεία εξέλιξη με την εισαγωγή μοντέλων γλώσσας μεγάλης κλίμακας, καθιστώντας τις παλιές αλληλεπιδράσεις παρωχημένες και επιβάλλοντας μια δομική ενημέρωση στα συστήματα κινητής τηλεφωνίας.

Ο κατασκευαστής επιδιώκει να ανακτήσει χώρο στον τομέα του φωνητικού αυτοματισμού, προσφέροντας βαθιά ενοποίηση που δεν μπορούν να επιτύχουν οι εφαρμογές τρίτων λόγω περιορισμών στο λειτουργικό σύστημα. Το ανταγωνιστικό πλεονέκτημα βασίζεται στον πλήρη έλεγχο του υλικού και του λογισμικού, επιτρέποντας τη βελτιστοποίηση που οδηγεί σε ταχύτερες και ακριβέστερες αποκρίσεις κατά την καθημερινή χρήση.

Δείτε Επίσης