Οι χρήστες Gemini Live παρατηρούν αλλαγές στις επιλογές φωνής του βοηθού τεχνητής νοημοσύνης Google. Οι αλλαγές περιλαμβάνουν παραλλαγές στον ρυθμό ομιλίας, τον τόνο και ακόμη και τον συνδυασμό τοπικών προφορών κατά τη διάρκεια αλληλεπιδράσεων σε πραγματικό χρόνο. Οι αλλαγές Essas συμβαίνουν συχνά μετά από ενημερώσεις προτύπου, όπως η πρόσφατη έκδοση 3.1 Flash Live, και επηρεάζουν την εμπειρία εξατομικευμένων συνομιλιών.
Πολλές αναφορές υποδεικνύουν ότι οι φωνητικές προεπισκοπήσεις στην εφαρμογή δεν ταιριάζουν με τον πραγματικό ήχο κατά τη χρήση της δυνατότητας Live. Η επιλογή Capella, η οποία παίζει γυναικεία βρετανική προφορά, έχει πιο εμφανείς αλλαγές από την αρχική κυκλοφορία. Outras Οι περιφερειακές φωνές παρουσιάζουν επίσης παρόμοια ζητήματα συνέπειας.
Αλλαγές στον ρυθμό και τον τόνο των φωνών
Οι αλλαγές στον ρυθμό ομιλίας αντιπροσωπεύουν ένα από τα πιο κοινά παράπονα μεταξύ των χρηστών που χρησιμοποιούν διαφορετικές επιλογές φωνής στο Gemini Live. Τα μοτίβα ομιλίας επιβραδύνονται σε διάφορες ρυθμίσεις, ενώ οι υψηλοί τόνοι μειώνονται αισθητά. Σε ορισμένες περιπτώσεις, οι απαντήσεις εναλλάσσονται μεταξύ αυστραλιανής προφοράς και πιο ουδέτερων παραλλαγών της αμερικανικής κατά τη διάρκεια των συνεχιζόμενων συνομιλιών.
Αυτές οι προσαρμογές πραγματοποιούνται σταδιακά μετά την επαναφορά της εφαρμογής, όταν η επιλεγμένη έμφαση παραμένει για μικρό χρονικό διάστημα πριν μετατραπεί σε υβριδική έκδοση. Η εμπειρία μπορεί να γίνει άβολη για όσους αναμένουν συνέπεια στις αλληλεπιδράσεις. Usuários Όσοι έχουν μεγαλύτερες συνομιλίες παρατηρούν αυτές τις μεταβάσεις πιο συχνά.
Σύγκριση μεταξύ προεπισκόπησης και πραγματικής χρήσης του πόρου
Η προεπισκόπηση ήχου που είναι διαθέσιμη στις ρυθμίσεις Gemini Live συχνά διαφέρει από τα αποτελέσματα που λαμβάνονται σε ενεργές συνεδρίες συνομιλίας. Η διαφορά Essa επηρεάζει ιδιαίτερα τις εξατομικευμένες φωνές, οι οποίες χάνουν τα αρχικά χαρακτηριστικά τους με την πάροδο του χρόνου. Τα Relatos που συσσωρεύτηκαν τους τελευταίους μήνες δείχνουν προοδευτική επιδείνωση σε αρκετές διαθέσιμες επιλογές.
- Ο πιο αργός ρυθμός επηρεάζει τη φυσική ροή των αποκρίσεων.
- Οι υψηλοί τόνοι μαλακώνουν, αλλάζοντας την προσωπικότητα της φωνής.
- Μίξεις προφορών εμφανίζονται απρόβλεπτα στους διαλόγους.
- Η προσωρινή επαναφορά της εφαρμογής επαναφέρει εν μέρει την αρχική συμπεριφορά.
Αυτές οι παρατηρήσεις έρχονται σε ένα πλαίσιο συχνών ενημερώσεων στα μοντέλα AI του Google, τα οποία στοχεύουν στη βελτίωση της συνολικής απόδοσης αλλά δημιουργούν παρενέργειες στις φωνές.
Κατασκευάσματα ήχου σε Gemini Live περιόδους σύνδεσης
Τα ηχητικά τεχνουργήματα όπως σκάει, σκάει και σφύριγμα εμφανίζονται σποραδικά κατά τη χρήση του Gemini Live. Οι θόρυβοι Esses δεν συνδέονται άμεσα με αλλαγές φωνής, αλλά αντιπροσωπεύουν ένα άλλο επαναλαμβανόμενο παράπονο στα φόρουμ υποστήριξης της εταιρείας. Η εμφάνιση ποικίλλει ανάλογα με την επιλεγμένη φωνητική επιλογή και δεν επαναλαμβάνεται πάντα με τον ίδιο τρόπο.
Πολλοί χρήστες μπορούν να αναπαράγουν το πρόβλημα σε συγκεκριμένες δοκιμές, ενώ άλλοι παρατηρούν τεχνουργήματα μόνο σε συγκεκριμένες συνθήκες. Η ποιότητα ήχου παραμένει σταθερή στις γρήγορες φωνητικές εντολές ή στη λειτουργία Android Auto ενσωματωμένη με Android Auto στα οχήματα. Η διαφορά Essa υποδηλώνει ότι το πρόβλημα επικεντρώνεται σε μεγαλύτερες περιόδους συνομιλίας ή σε ορισμένα περιβάλλοντα χρήσης.
Συμπεριφορά σε διαφορετικά σενάρια αλληλεπίδρασης
Οι φωνές του Gemini Live διατηρούν μεγαλύτερη σταθερότητα όταν ενεργοποιείται ο βοηθός για σύντομες εντολές ή απλούς φωνητικούς ελέγχους. Ωστόσο, κατά τη διάρκεια βαθύτερων συνομιλιών, οι αλλαγές στον ρυθμό και τον τόνο γίνονται πιο εμφανείς. Η δυνατότητα στα αυτοκίνητα μέσω Android Auto διατηρεί επίσης καλύτερα τα αρχικά χαρακτηριστικά των επιλεγμένων επιλογών.
Το Google έχει λάβει ερωτήματα σχετικά με αυτές τις συμπεριφορές, αν και δεν υπάρχει επίσημη επιβεβαίωση αναγνώρισης ή επιδιορθώσεις σε εξέλιξη αυτήν τη στιγμή. Το Usuários συνεχίζει να δοκιμάζει διαφορετικές διαθέσιμες φωνές, συμπεριλαμβανομένων των Capella, για να προσδιορίσει ποιες εμφανίζουν τις λιγότερες παραλλαγές με την πάροδο του χρόνου.
Διαθέσιμες επιλογές και προσαρμογές εντός εφαρμογής
Το Gemini Live προσφέρει πολλαπλές προσαρμόσιμες φωνές με διακριτές προφορές και τόνους, όπως επιλογές που προσομοιώνουν βρετανικές, ουδέτερες αμερικανικές και άλλες τοπικές παραλλαγές. Οι χρήστες μπορούν να αλλάξουν την επιλογή απευθείας στις ρυθμίσεις της εφαρμογής για να βρουν τη ρύθμιση που ταιριάζει καλύτερα στις μεμονωμένες προτιμήσεις. Η αλλαγή φωνών δεν λύνει πάντα μόνιμα προβλήματα ρυθμού.
- Οι επιλογές περιλαμβάνουν φωνές με χαρακτηριστικά υψηλότερου ή χαμηλότερου τόνου.
- Μερικοί διατηρούν καλύτερα την προφορά που επιλέχθηκε στις αρχικές συνεδρίες.
- Η επαναφορά της εφαρμογής ενδέχεται να αποκαταστήσει προσωρινά την αναμενόμενη συμπεριφορά.
- Οι ενημερώσεις προτύπων επηρεάζουν τη συνολική απόδοση των φωνών.
Αυτά τα χαρακτηριστικά επιτρέπουν μεγαλύτερη προσαρμογή, αλλά οι αναφερόμενες ασυνέπειες υπογραμμίζουν την ανάγκη προσαρμογών από την εταιρεία που είναι υπεύθυνη για την ανάπτυξη.
Εξέλιξη των φωνών στο Gemini Live με την πάροδο του χρόνου
Τους τελευταίους μήνες, πολλές επιλογές φωνής για το Gemini Live έχουν υποστεί τροποποιήσεις που αλλάζουν πτυχές όπως η ταχύτητα ομιλίας και ο συνδυασμός τονισμού. Οι αλλαγές Essas συμπίπτουν με βελτιώσεις σε άλλες πτυχές των μοντέλων τεχνητής νοημοσύνης, συμπεριλαμβανομένης της ταχύτητας απόκρισης και της κατανόησης των συμφραζομένων. Η δυνατότητα συνεχίζει να εξελίσσεται, με ενημερώσεις που στοχεύουν να κάνουν τις αλληλεπιδράσεις πιο ρευστές.
Οι χρήστες που βασίζονται σε συγκεκριμένες φωνές για καθημερινές εργασίες ή προσβασιμότητα βλέπουν άμεσες επιπτώσεις στη χρηστικότητα. Η συνέπεια μεταξύ της προεπισκόπησης ήχου και της πραγματικής εκτέλεσης παραμένει σημείο προσοχής για όσους χρησιμοποιούν τον βοηθό σε παρατεταμένες συνομιλίες. Google συνεχίζει να βελτιώνει το σύστημα, με βάση τα σχόλια που λαμβάνονται σχετικά με την απόδοση των φωνών.

