Η Google ανακοίνωσε αυτήν την Πέμπτη το Gemini 3.1 Flash Live ως το μοντέλο ήχου και φωνής υψηλότερης ποιότητας μέχρι σήμερα. Η έκδοση Essa ενισχύει μια σειρά από σημαντικές βελτιώσεις σε σχέση με τα Gemini Live και Search Live. Το μοντέλο είναι πλέον διαθέσιμο σε προεπισκόπηση μέσω του Gemini Live API στο Google AI Studio. Το Ele ξεχωρίζει για την προσφορά χαμηλότερης καθυστέρησης σε σύγκριση με την προηγούμενη έκδοση και μεγαλύτερη αποτελεσματικότητα στην αναγνώριση ακουστικών αποχρώσεων όπως ο τόνος και ο ρυθμός.
Οι προγραμματιστές μπορούν να δοκιμάσουν το νέο μοντέλο αμέσως για να δημιουργήσουν εφαρμογές με πολυτροπικές συνομιλίες σε πραγματικό χρόνο. Το Gemini 3.1 Flash Live φιλτράρει τον θόρυβο του περιβάλλοντος με μεγαλύτερη ακρίβεια και μπορεί να διακρίνει καλύτερα τη σχετική ομιλία ανάμεσα σε ήχους περιβάλλοντος όπως η κυκλοφορία ή η τηλεόραση. Além Επιπλέον, το σύστημα υποστηρίζει περισσότερες από 90 γλώσσες, γεγονός που διευρύνει την εμβέλεια των ζωντανών αλληλεπιδράσεων.
- Βελτιωμένη αναγνώριση ακουστικών αποχρώσεων όπως το ύψος και ο ρυθμός
- Μειωμένη καθυστέρηση στις συνομιλίες σε πραγματικό χρόνο
- Πιο αποτελεσματικό φιλτράρισμα του θορύβου περιβάλλοντος και των περιβαλλοντικών ήχων
- Υποστηρίζει περισσότερες από 90 γλώσσες για πολυτροπικές αλληλεπιδράσεις
Τεχνικές βελτιώσεις στο μοντέλο ήχου
Το νέο μοντέλο βελτιώνει σημαντικά την ικανότητα ενεργοποίησης εξωτερικών εργαλείων κατά τη διάρκεια ζωντανών συνομιλιών. Το Ele παρέχει επίσης καλύτερη παρακολούθηση σύνθετων οδηγιών, διατηρώντας τον πράκτορα εντός λειτουργικών ορίων ακόμα και όταν οι συνομιλίες παίρνουν απροσδόκητες στροφές. Οι αλλαγές Essas οδηγούν σε πιο αξιόπιστες και φυσικές αποκρίσεις.
Στο Gemini Live για συσκευές Android και iOS, το Flash Live 3.1 παρέχει ταχύτερες αποκρίσεις με λιγότερες παύσεις. Το σύστημα μπορεί να ακολουθήσει το σκεπτικό της συνομιλίας για δύο φορές την προηγούμενη φορά. Το Isso επιτρέπει μεγαλύτερες συνεδρίες καταιγισμού ιδεών χωρίς να χάνετε το σύνολο των σκέψεών σας.
Το Gemini Live προσαρμόζει δυναμικά τη διάρκεια και τον τόνο των απαντήσεων για να ταιριάζει στο πλαίσιο της στιγμής. Το Usuários αναφέρει πιο ομαλές αλληλεπιδράσεις και λιγότερες διακοπές κατά την καθημερινή χρήση. Η ενσωμάτωση με το νέο μοντέλο συμβάλλει σε μια πιο συνεπή συνολική εμπειρία.
Παγκόσμια επέκταση του Search Live
Το Google χρησιμοποιεί το Gemini 3.1 Flash Live για να κυκλοφορήσει το Search Live παγκοσμίως σε περισσότερες από 200 χώρες. Η επέκταση καλύπτει όλες τις γλώσσες και τις τοποθεσίες όπου το Modo IA είναι επί του παρόντος διαθέσιμο. Η δυνατότητα επιτρέπει διαδραστικές συνομιλίες με το Busca από το Google, συμπεριλαμβανομένου ήχου και βίντεο μέσω του Google Lens.
Οι χρήστες μπορούν πλέον να πραγματοποιούν συνομιλητικές αναζητήσεις σε πραγματικό χρόνο με μεγαλύτερη ακρίβεια σε διαφορετικές περιοχές. Το σύστημα επεξεργάζεται πολυτροπικά ερωτήματα πιο αποτελεσματικά σε ποικίλα περιβάλλοντα. Η διαθεσιμότητα Essa επεκτείνει την πρόσβαση σε φωνητικές πληροφορίες σε παγκόσμια κλίμακα.
Το Search Live επωφελείται άμεσα από βελτιώσεις στην αναγνώριση ομιλίας και τη μείωση του λανθάνοντος χρόνου. Το Conversas με την αναζήτηση γίνεται πιο φυσικό και διαμορφωμένο στα συμφραζόμενα. Η ενσωμάτωση ήχου και βίντεο διευκολύνει την αλληλεπίδραση σε πρακτικά καθημερινά σενάρια.
Λεπτομέρειες σχετικά με τη γλώσσα και την πολυτροπική υποστήριξη
Η υποστήριξη για περισσότερες από 90 γλώσσες επιτρέπει πολυτροπικές συνομιλίες υψηλής ποιότητας σε πραγματικό χρόνο. Το μοντέλο αντιμετωπίζει καλύτερα τις περιφερειακές παραλλαγές στην προφορά και τους τόνους. Το Isso κάνει το Gemini Live πιο προσιτό για χρήστες σε διαφορετικές χώρες.
Οι προγραμματιστές αποκτούν εργαλεία για τη δημιουργία εξατομικευμένων εμπειριών με βάση το νέο μοντέλο. Το API καθιστά εύκολη την ενσωμάτωση σε εφαρμογές που απαιτούν πλούσιες φωνητικές αλληλεπιδράσεις. Η εστίαση στον χαμηλό λανθάνοντα χρόνο βοηθά στη διατήρηση της φυσικής ροής των συνομιλιών.
Πρακτικές εφαρμογές σε καθημερινή χρήση
Στην καθημερινή ζωή, το Gemini Live με το νέο μοντέλο ανταποκρίνεται πιο γρήγορα σε περίπλοκες εντολές και ερωτήσεις. Το σύστημα διατηρεί το πλαίσιο για μεγαλύτερες περιόδους χωρίς επανεκκίνηση της συλλογιστικής. Το Usuários μπορεί να εξερευνά ιδέες συνεχώς κατά τη διάρκεια εκτεταμένων συνεδριών.
Η δυνατότητα φιλτραρίσματος του περιβαλλοντικού θορύβου βελτιώνει την απόδοση σε πολυσύχναστες τοποθεσίες ή με ήχους φόντου. Conversas σε περιβάλλοντα όπως δρόμοι ή δωμάτια με τηλεόραση γίνονται πιο φωτεινά. Η δυναμική προσαρμογή του τόνου και της διάρκειας των απαντήσεων προσαρμόζεται στο στυλ της αλληλεπίδρασης.
Προόδους στην ενοποίηση με εξωτερικά εργαλεία
Το βελτιωμένο μοντέλο ενεργοποιεί τα εξωτερικά εργαλεία πιο αποτελεσματικά κατά τη διάρκεια των συνομιλιών. Το Ele ακολουθεί τις οδηγίες του συστήματος με μεγαλύτερη συνέπεια ακόμη και σε διακλαδώσεις. Η σταθερότητα Essa συμβάλλει σε πιο προβλέψιμα αποτελέσματα σε πρακτικές εφαρμογές.
Οι προγραμματιστές και οι τελικοί χρήστες επωφελούνται από πιο ισχυρές αλληλεπιδράσεις. Το Gemini Live γίνεται πιο αξιόπιστο εργαλείο για εργασίες που περιλαμβάνουν πολλά βήματα. Ο συνδυασμός προηγμένων δυνατοτήτων ήχου και εκτεταμένης λογικής διευρύνει τις δυνατότητες χρήσης.
Το Google συνεχίζει να επενδύει σε μοντέλα ήχου για να κάνει τις αλληλεπιδράσεις AI πιο φυσικές. Η κυκλοφορία του Gemini 3.1 Flash Live αντιπροσωπεύει ένα σημαντικό βήμα προς αυτή την κατεύθυνση. Το Usuários του Android και το iOS μπορούν να δοκιμάσουν τις νέες δυνατότητες απευθείας στην εφαρμογή Gemini Live.
Atualizações που σχετίζεται με το οικοσύστημα Gemini
Η ανακοίνωση περιλαμβάνει πρόσθετες βελτιώσεις στον πλωτό πίνακα Gemini Live στο Android. Οι αλλαγές Essas στοχεύουν στη διευκόλυνση της γρήγορης πρόσβασης στις φωνητικές λειτουργίες. Το σύνολο των ενημερώσεων ενισχύει τη δέσμευση για προηγμένες εμπειρίες συνομιλίας.
Το Search Live προσεγγίζει πλέον ένα ευρύτερο κοινό με ενσωματωμένες δυνατότητες ήχου και βίντεο. Η παγκόσμια επέκταση εκδημοκρατίζει την πρόσβαση σε διαδραστικές φωνητικές αναζητήσεις. Το Usuários σε διαφορετικές περιοχές αποκτά ένα πιο ισχυρό εργαλείο για ερωτήματα σε πραγματικό χρόνο.
Το Gemini 3.1 Flash Live σηματοδοτεί μια αξιοσημείωτη εξέλιξη στην ποιότητα ήχου και φωνής των μοντέλων Google. Οι βελτιώσεις στον λανθάνοντα χρόνο, το φιλτράρισμα θορύβου και οι οδηγίες που ακολουθούν ανεβάζουν τον πήχη για ζωντανές αλληλεπιδράσεις. Η έκδοση προεπισκόπησης επιτρέπει στους προγραμματιστές να εξερευνήσουν νέες εφαρμογές τώρα.

