Google menukar sistem suara dalam aplikasi Gemini Live dan mengubah suai irama loghat serantau
Pengguna pembantu maya Google mula melaporkan ketidakstabilan yang ketara dalam tetapan audio semasa interaksi masa nyata. Pengubahsuaian secara langsung mempengaruhi pengalaman pengguna, mengubah ciri asas pilihan yang dipilih dalam aplikasi.
Masalahnya muncul terutamanya dalam kaden pertuturan, nada tindak balas dan ketekalan loghat serantau. Essas variasi berlaku tanpa diduga, mengubah corak komunikasi sistem kecerdasan buatan semasa dialog berterusan.
Kelemahan menjadi jelas selepas pelaksanaan kemas kini terbaru kepada model bahasa syarikat. Percanggahan antara sampel audio yang ditawarkan dalam tetapan dan bunyi yang dihasilkan semula dalam amalan telah menjadi sasaran utama aduan di forum teknologi yang tertumpu pada peranti mudah alih.
Ketidakkonsistenan bunyi dan pengalaman pengguna
Pilihan suara yang dikenali sebagai Capella, dicirikan oleh loghat wanita British, mempunyai herotan yang paling jelas sejak pelancarannya. Pengguna mendapati bahawa personaliti asal audio hilang dengan cepat selepas beberapa arahan pertama.
Semasa perbualan yang berpanjangan, sistem menunjukkan kesukaran untuk mengekalkan corak serantau yang dipilih oleh individu. Maklum balas pembantu mula bertukar secara autonomi antara aksen Australia dan variasi bahasa Inggeris Amerika yang lebih neutral, mewujudkan pengalaman mendengar yang berpecah-belah dan mengelirukan bagi mereka yang bergantung pada alat untuk tugasan atau kajian harian.
Tingkah laku aplikasi menunjukkan bahawa pemprosesan masa nyata menghadapi kesesakan apabila cuba mengekalkan modulasi suara kompleks yang diperlukan oleh versi baharu model kecerdasan buatan. Quando pengguna melakukan mula semula paksa perisian, aksen asal dipulihkan, tetapi pembetulan ini hanya mempunyai kesan sementara. Após Selepas beberapa minit interaksi berterusan, suara bertukar kembali kepada versi hibrid, menunjukkan bahawa sistem sintesis pertuturan tidak dapat mengekalkan kestabilan dalam sesi yang memerlukan pemprosesan kontekstual yang lebih besar dan respons yang panjang.
- Kelajuan pertuturan berkurangan dengan ketara dalam respons yang kompleks.
- Nada tiga kali ganda asli berkurangan dengan ketara semasa penggunaan.
- Loghat yang berbeza dicampur dalam ayat yang sama secara tidak sengaja.
- Memulakan semula aplikasi hanya menawarkan penyelesaian kepada masalah tersebut.
Artifak audio dalam sesi lanjutan
Sebagai tambahan kepada perubahan dalam identiti vokal, pembantu mula memberikan bunyi yang tidak diingini semasa pengeluaran semula respons. Bunyi Artefatos, seperti pop, pop kecil dan desis latar belakang, muncul secara sporadis semasa sistem memproses dan menyampaikan maklumat yang diminta.
Gangguan akustik ini tidak mempunyai kaitan langsung dengan perubahan aksen, tetapi ia memburukkan persepsi penurunan kualiti perkhidmatan. Kekerapan bunyi sangat berbeza bergantung pada pilihan suara yang diaktifkan dan peranti yang digunakan untuk mengakses platform.
Variasi prestasi mengikut platform
Ujian praktikal menunjukkan bahawa kestabilan audio sangat bergantung pada konteks penggunaan dan persekitaran perkakasan. Comandos Pantas dan objektif, yang memerlukan respons ringkas, jarang mencetuskan jurang irama atau percampuran aksen yang dilaporkan oleh pengguna.
Penyepaduan pembantu dengan sistem automotif, seperti Android Auto, menunjukkan tingkah laku yang sangat baik. Nesses, ciri asal suara yang dipilih dikekalkan dengan lebih berkesan, walaupun dalam interaksi yang memerlukan masa pemprosesan yang lebih lama.
Perbezaan dalam prestasi ini menunjukkan bahawa pengurusan sumber apl mudah alih mungkin mempengaruhi pemaparan audio. Pemampatan data atau peruntukan memori pada telefon pintar nampaknya secara langsung mengganggu keupayaan model untuk mengekalkan kesetiaan vokal.
Pilihan penyesuaian dan pelarasan tersedia
Panel tetapan pembantu menyediakan katalog pelbagai profil vokal untuk penyesuaian. Matlamat syarikat adalah untuk membolehkan setiap individu mencari nada, irama dan aksen yang menjadikan interaksi dengan mesin lebih semula jadi dan menyeronokkan.
Profil terdiri daripada timbre yang lebih serius dan formal kepada pilihan yang lebih bernada tinggi dan santai. Pemilihan dibuat hanya melalui menu utama, di mana sampel audio ringkas dimainkan untuk membantu pengguna dalam memilih.
Memandangkan masalah baru-baru ini, ramai pengguna telah menggunakan strategi untuk sentiasa menukar antara profil ini dalam usaha untuk mencari pilihan yang kurang terdedah kepada kegagalan. Walau bagaimanapun, penukaran suara hanya bertindak sebagai penyelesaian sementara untuk ketidakstabilan sistem.
Punca isu tetap terikat dengan cara perisian memproses bahasa semula jadi dalam masa nyata. Kemas kini berterusan pada pelayan syarikat mempengaruhi gelagat semua pilihan yang tersedia dalam katalog, tanpa mengira nada yang dipilih.
Kesan Kemas Kini Kepintaran Buatan
Perubahan yang tidak diingini dalam gelagat audio bertepatan dengan tempoh pelaksanaan versi baharu model bahasa Google, khususnya peralihan kepada seni bina berfokuskan kelajuan, seperti versi Flash Live. Objektif utama kemas kini ini adalah untuk mengurangkan masa kependaman antara soalan pengguna dan tindak balas mesin yang lebih lancar, dan menjadikan perbualan lebih lancar kepada manusia, menjadikan dialog lebih lancar.
Walau bagaimanapun, pengoptimuman untuk peningkatan kelajuan nampaknya telah menghasilkan kesan sampingan dalam pemaparan sintesis pertuturan. Apabila mengutamakan penghantaran pantas teks yang dijana, sistem audio mungkin menerima paket data secara berpecah-belah, yang akan menjelaskan kehilangan irama, penurunan nada tinggi dan ketidakupayaan untuk mengekalkan aksen serantau yang kompleks semasa perenggan yang sangat panjang.
Kebolehcapaian dan pergantungan pada piawaian yang konsisten
Ketekalan dalam penghasilan semula suara sintetik melangkaui isu keutamaan estetik dan secara langsung mempengaruhi sfera kebolehcapaian digital. Indivíduos orang yang cacat penglihatan, kesukaran membaca atau keadaan neurologi tertentu sering bergantung kepada pembantu maya untuk melayari internet, membaca dokumen dan mengatur rutin harian. Para Bagi penonton ini, kebiasaan dengan nada, kelajuan dan kejelasan suara yang dipilih adalah penting untuk memahami maklumat dengan berkesan. Quando sistem secara tiba-tiba menukar kadennya, memasukkan bunyi atau menukar aksen di tengah ayat, beban kognitif yang diperlukan untuk mentafsir mesej meningkat dengan ketara. Essa Memecahkan jangkaan menukarkan alat yang berguna kepada sumber kekecewaan, menonjolkan keperluan kritikal bagi syarikat teknologi untuk melaksanakan rutin ujian yang lebih ketat yang memfokuskan pada kestabilan audio sebelum mengeluarkan kemas kini kecerdasan buatan kepada orang awam.
Kedudukan dan pemantauan berterusan
Sehingga kini, pembangun perisian tidak mengeluarkan kenyataan rasmi yang memperincikan garis masa untuk pembetulan muktamad anomali vokal ini. Komuniti teknologi terus memantau gelagat aplikasi dengan setiap kemas kini senyap kecil baharu ditolak ke peranti.
Evolusi pemprosesan bahasa semula jadi
Kejuruteraan di sebalik sintesis pertuturan masa nyata mewakili salah satu cabaran terbesar hari ini dalam bidang pembelajaran mesin. Sistem perlu mentafsir teks yang dijana, menggunakan intonasi yang betul berdasarkan konteks dan memaparkan audio serta-merta.
Walaupun terdapat kelemahan semasa dalam irama dan aksen, teknologi perbualan langsung terus maju dengan pesat. Ajustes dalam algoritma pemampatan dan pemprosesan audio akhirnya akan menstabilkan prestasi suara tersuai pada semua platform mudah alih.
Veja Tambem em News (MS)
Penurunan harga PlayStation 5 Pro mempercepatkan jualan runcit digital dan menghapuskan stok global
Kemas kini sistem Apple baharu mengoptimumkan pengurusan tugasan segera untuk pengguna iPhone
Kebocoran butiran perkakasan PlayStation mudah alih baharu dengan grafik unggul kepada Xbox Series S
Oppo secara rasmi melancarkan Find X9 Ultra di seluruh dunia dengan kanta Hasselblad dan bateri yang teguh
Edisi baharu telefon pintar boleh lipat membawa kemasan emas kepada pesaing Sukan Musim Sejuk
Tim Cook mendedahkan prototaip iPhone dan iPod baharu dalam sambutan ulang tahun kelima puluh Apple
Leak mendedahkan Lords of the Fallen dan Sword Art Online dalam katalog PS Plus Essential April
Sistem Android menerima integrasi Gemini Nano 4 asli untuk pemprosesan luar talian pada telefon pintar
Samsung mengemas kini modul QuickStar dan mengembangkan kawalan visual panel dalam antara muka One UI 8.5
Pengilang mengemas kini penderia foto telefon pintar premium dengan fokus pada zum dan kecerdasan buatan
Apple membangunkan iPhone boleh lipat baharu dan menyediakan edisi khas untuk meraikan 20 tahun jenama itu