Η νέα δυνατότητα Rambler ενσωματώνει το Gemini Intelligence με το Gboard για να βελτιώσει τη φωνητική υπαγόρευση στο Android

Gemini

Gemini - mundissima/ Shutterstock.com

Το Google προωθεί την ενσωμάτωση της τεχνητής νοημοσύνης στις εγγενείς εφαρμογές του με την προετοιμασία μιας σημαντικής ενημέρωσης για το εικονικό πληκτρολόγιο των smartphone. Η εταιρεία αναπτύσσει το εργαλείο Rambler, ένα σύστημα άνευ προηγουμένου που συνδέεται με το Gemini Intelligence που υπόσχεται να αναδιαρθρώσει τον τρόπο λειτουργίας της φωνητικής υπαγόρευσης. Η νέα δυνατότητα εντοπίστηκε σε εσωτερικά αρχεία της τελευταίας έκδοσης της εφαρμογής για το λειτουργικό σύστημα Android. Η λειτουργία στοχεύει στη διόρθωση ιστορικών σφαλμάτων μεταγραφής και στην παροχή πιο ρευστών και συνεκτικών κειμένων στους χρήστες.

Η ανακάλυψη προέκυψε με βάση τις τεχνικές αναλύσεις του κώδικα εγκατάστασης λογισμικού, μια τυπική διαδικασία για την πρόβλεψη των κυκλοφοριών στον κλάδο της τεχνολογίας. Το Especialistas κατάφερε να ενεργοποιήσει τη διεπαφή χειροκίνητα πριν από την επίσημη ανακοίνωση. Η εμφάνιση της επιλογής στα μενού διαμόρφωσης υποδεικνύει ότι η φάση της εσωτερικής δοκιμής έχει προχωρήσει. Η κυκλοφορία στο κοινό θα πρέπει να γίνει σταδιακά τους επόμενους μήνες, αλλάζοντας τη δυναμική της επικοινωνίας σε κινητές συσκευές και διευκολύνοντας τη ρουτίνα όσων προτιμούν να μιλάνε αντί να πληκτρολογούν.

Το Reverse Engenharia αποκαλύπτει την ενεργοποίηση του συστήματος Rambler στο Android

Η επιβεβαίωση για το στάδιο ανάπτυξης του εργαλείου ήρθε μέσω της εργασίας ανεξάρτητων προγραμματιστών. Η εξειδικευμένη πύλη Android Authority πραγματοποίησε διεξοδική σάρωση του πακέτου δεδομένων της εφαρμογής και βρήκε τις κρυφές εντολές. Οι μηχανικοί εφάρμοσαν τεχνικές αντίστροφης μηχανικής για να αναγκάσουν τη διεπαφή να λειτουργήσει. Η μέθοδος μας επέτρεψε να απεικονίσουμε ακριβώς πώς θα παρουσιαστεί ο πόρος στους τελικούς καταναλωτές στις οθόνες των κινητών τηλεφώνων τους.

Πρακτικές δοκιμές έδειξαν ότι το μενού ρύθμισης φωνής του πληκτρολογίου διαθέτει ήδη την απαραίτητη υποδομή για την υποστήριξη της νέας τεχνολογίας. Οι εσωτερικές οθόνες εμφανίζουν πρωτόγνωρες επιλογές για τον έλεγχο της επεξεργασίας ήχου. Η παρουσία αυτών των γραφικών στοιχείων ενισχύει τη θέση ότι πλησιάζει η παγκόσμια κυκλοφορία. Το Google συχνά εισάγει αυτούς τους κωδικούς σε εκδόσεις beta εβδομάδες ή μήνες πριν από τη μαζική διανομή για να διασφαλίσει τη σταθερότητα του συστήματος.

Η αναγκαστική ενεργοποίηση αποκάλυψε επίσης τις τεχνικές διαδρομές που υιοθέτησε η εταιρεία για τη συγχώνευση του παραδοσιακού πληκτρολογίου με νέα μοντέλα γλώσσας. Η αρχιτεκτονική του λογισμικού δείχνει μια μετάβαση από το παλιό σύστημα αναγνώρισης ομιλίας σε ένα πιο πολύπλοκο νευρωνικό δίκτυο. Η δομική αλλαγή του Essa απαιτεί βαθιές προσαρμογές στον πηγαίο κώδικα του Gboard. Ο στόχος είναι να διασφαλιστεί ότι το εργαλείο λειτουργεί χωρίς να καταναλώνεται υπερβολικά η μπαταρία ή η μνήμη RAM της συσκευής.

Το Voice Tecnologia εξαλείφει τις παύσεις και διορθώνει τη γραμματική δομή

Η κύρια πρόοδος του συστήματος Rambler σε σύγκριση με τις παραδοσιακές μεθόδους υπαγόρευσης είναι η δυνατότητα άμεσης ερμηνείας με βάση τα συμφραζόμενα. Ο χρήστης μπορεί να μιλήσει φυσικά, με παύσεις και διακοπές, ενώ το λογισμικό οργανώνει τις ιδέες. Η τεχνητή νοημοσύνη λειτουργεί ως αναθεωρητής σε πραγματικό χρόνο. Το τελικό κείμενο που δημιουργείται έχει μια λογική και γραμματικά σωστή δομή, χωρίς να απαιτείται μετέπειτα χειροκίνητη επεξεργασία από τον αποστολέα του μηνύματος.

Ο επεξεργαστής φυσικής γλώσσας εκτελεί μια σειρά από αυτόματες διορθώσεις κατά τη λήψη του ήχου. Το σύστημα εκπαιδεύτηκε για να εντοπίζει και να επιλύει τα πιο κοινά προβλήματα στην αυτοσχέδια προφορική επικοινωνία:

  • Remoção γεμάτο κοινούς δισταγμούς στην ομιλία όπως τραυλισμός και επαναλήψεις συλλαβών.
  • Το Eliminação εξαλείφει αυτόματα τους θορύβους του περιβάλλοντος και τις μεγάλες παύσεις μεταξύ των λέξεων.
  • Το Inserção χρειάζεται τελείες, κόμματα και ερωτηματικά για τα συμφραζόμενα.
  • Correção προφορικής και ονομαστικής συμφωνίας χωρίς αλλαγή της αρχικής σημασίας του ξεσπάσματος.
  • Σύνταξη Ajuste για διασφάλιση σαφήνειας κατά την γρήγορη ανάγνωση μηνυμάτων.

Ο αλγόριθμος του Gemini Intelligence βαθμονομεί τις διορθώσεις για να διατηρήσει ανέπαφη την ταυτότητα του αποστολέα. Ο μηχανισμός διατηρεί την τοπική αργκό και συγκεκριμένους όρους από το προσωπικό λεξιλόγιο του χρήστη. Η παρέμβαση της τεχνητής νοημοσύνης εστιάζει αποκλειστικά στον καθαρισμό γλωσσικών ελαττωμάτων και στη συντακτική οργάνωση. Το αποτέλεσμα είναι ένα γραπτό μήνυμα που αντικατοπτρίζει την πρόθεση του λόγου με επαγγελματική ακρίβεια και απόλυτη σαφήνεια.

Το τοπικό Processamento βελτιστοποιεί την ταχύτητα και εγγυάται το απόρρητο για τους χρήστες

Η αρχιτεκτονική του νέου χαρακτηριστικού υποδηλώνει μια σημαντική αλλαγή στον τρόπο με τον οποίο το Google χειρίζεται την επεξεργασία φωνητικών δεδομένων. Τα πλαίσια ελέγχου που βρίσκονται στα εσωτερικά μενού υποδεικνύουν ότι ένα σημαντικό μέρος της λειτουργίας θα πραγματοποιηθεί απευθείας στο υλικό του smartphone. Η τοπική επεξεργασία μειώνει την εξάρτηση από διακομιστές cloud. Το μέτρο εγγυάται μεγαλύτερη ταχύτητα στη μεταγραφή και επιτρέπει τη χρήση του εργαλείου ακόμη και σε περιοχές με ασταθείς συνδέσεις στο διαδίκτυο.

Η εκτέλεση εργασιών τεχνητής νοημοσύνης στην ίδια τη συσκευή ανταποκρίνεται επίσης στις αυξανόμενες απαιτήσεις για απόρρητο και ψηφιακή ασφάλεια. Ο ήχος που υπαγορεύεται από τους χρήστες δεν χρειάζεται να ταξιδεύει μέσω εξωτερικών δικτύων για να μετατραπεί σε κείμενο. Το μοντέλο συμπιεσμένης γλώσσας λειτουργεί εντός του ασφαλούς περιβάλλοντος του συστήματος Android. Η στρατηγική προστατεύει ευαίσθητες πληροφορίες και εταιρικά μηνύματα από υποκλοπές ή διαρροές κατά τη μεταφορά πακέτων δεδομένων.

Η λειτουργία εκτός σύνδεσης εξαρτάται από τη χωρητικότητα των Unidades και Processamento Neural που υπάρχουν στους σύγχρονους επεξεργαστές. Τα πιο πρόσφατα τσιπ που αναπτύχθηκαν για smartphone έχουν πυρήνες αφιερωμένους αποκλειστικά σε υπολογισμούς τεχνητής νοημοσύνης. Το Essa Η εξέλιξη σε υλικό επιτρέπει στο Gboard να εκτελεί σύνθετους αλγόριθμους αναγνώρισης ομιλίας χωρίς να επιβαρύνει την κεντρική μονάδα επεξεργασίας του τηλεφώνου.

Το Google επιταχύνει την ενσωμάτωση του Gemini Intelligence έναντι του ανταγωνισμού

Η ενημέρωση του εικονικού πληκτρολογίου αποτελεί μέρος μιας ευρύτερης κίνησης του γίγαντα αναζήτησης για την εδραίωση του οικοσυστήματος παραγωγής τεχνητής νοημοσύνης του. Το αρχικό σχέδιο αναφέρθηκε διακριτικά τον Μάιο, αλλά η ακριβής μηχανική του πώς λειτουργεί παρέμενε μυστική μέχρι την πρόσφατη ανακάλυψη. Το Gboard αντιπροσωπεύει ένα βασικό στρατηγικό κομμάτι για την εταιρεία, καθώς είναι εγκατεστημένο σε δισεκατομμύρια ενεργές συσκευές σε όλο τον πλανήτη. Το εργαλείο λειτουργεί ως η κύρια διεπαφή εισαγωγής κειμένου στο κινητό περιβάλλον.

Η υλοποίηση του Rambler δημιουργεί ένα άμεσο ανταγωνιστικό πλεονέκτημα έναντι των εγγενών λύσεων που αναπτύχθηκαν από την Apple για το σύστημα iOS. Ο αγώνας για κυριαρχία στα εργαλεία παραγωγικότητας στα smartphone έχει οδηγήσει σε επενδύσεις δισεκατομμυρίων δολαρίων στην έρευνα και την ανάπτυξη. Οι κατασκευαστές κινητών τηλεφώνων που χρησιμοποιούν τροποποιημένες εκδόσεις του Android αντιμετωπίζουν επίσης την πρόκληση να συμβαδίσουν με τον ρυθμό των καινοτομιών που προτείνει η Google. Η τυποποίηση προηγμένων λειτουργιών ενισχύει την αφοσίωση των χρηστών στην πλατφόρμα και αποτρέπει τη μετάβαση σε ανταγωνιστικά συστήματα.

Η βελτίωση της φωνητικής υπαγόρευσης έχει επίσης άμεσο θετικό αντίκτυπο στην ψηφιακή προσβασιμότητα. Το Pessoas με κινητικές αναπηρίες ή δυσκολίες πληκτρολόγησης βασίζεται σε ακριβή εργαλεία μεταγραφής για τη χρήση smartphone. Η ικανότητα του συστήματος να κατανοεί τα συμφραζόμενα και να οργανώνει συγκεχυμένες προτάσεις αυξάνει την τεχνολογική ανεξαρτησία αυτών των χρηστών. Η τεχνητή νοημοσύνη μετατρέπει το πληκτρολόγιο σε ένα περιεκτικό εργαλείο που προσαρμόζεται σε διαφορετικές ανάγκες.

Το αρχικό Expansão δίνει προτεραιότητα στη γραμμή Pixel πριν από τη γενική διανομή

Το πρόγραμμα εκκίνησης για τη νέα έξυπνη υπαγόρευση θα πρέπει να ακολουθεί το ιστορικό μοτίβο ενημερώσεων της εταιρείας της Βόρειας Αμερικής. Η Analistas από την αγορά τεχνολογίας προβλέπει ότι οι συσκευές από τη σειρά Pixel θα λάβουν τη νέα δυνατότητα αποκλειστικά στην αρχή. Ο αρχικός περιορισμός επιτρέπει στους προγραμματιστές να παρακολουθούν την απόδοση του λογισμικού σε ένα αυστηρά ελεγχόμενο περιβάλλον υλικού. Οποιαδήποτε σφάλματα επεξεργασίας μπορούν να διορθωθούν γρήγορα πριν από την κυκλοφορία μεγάλης κλίμακας.

Η επέκταση σε smartphone από άλλους κατασκευαστές θα γίνει σταδιακά μετά την περίοδο σταθεροποίησης του κώδικα. Η επιτυχία του εργαλείου θα εξαρτηθεί από την ικανότητα των επεξεργαστών από διαφορετικές μάρκες να χειρίζονται τον φόρτο εργασίας που απαιτείται από το Gemini Intelligence. Τα παλαιότερα ή τα Aparelhos προδιαγραφών εισόδου ενδέχεται να λαμβάνουν απλουστευμένες εκδόσεις της δυνατότητας, βασιζόμενες περισσότερο στην επεξεργασία cloud παρά στην τοπική εκτέλεση.

Η συνεχής εξέλιξη των μοντέλων γλώσσας υπόσχεται να μετατρέψει το εικονικό πληκτρολόγιο σε έναν πλήρη και προληπτικό βοηθό γραφής. Η τεχνολογία μειώνει τα εμπόδια επικοινωνίας και διευκολύνει την καθημερινή αλληλεπίδραση σε ψηφιακά περιβάλλοντα. Η επένδυση του Google στο σύστημα Rambler δείχνει ότι η παραδοσιακή πληκτρολόγηση θα μοιράζεται όλο και περισσότερο χώρο με διεπαφές που βασίζονται σε φυσικές φωνητικές εντολές και προηγμένη σημασιολογική επεξεργασία.

Δείτε επίσης