Google mengumumkan pembaruan Gemini 3.1 Flash Live dalam Gemini Live

Gemini

Gemini - Mehaniq/shutterstock.com

Google Kamis ini mengumumkan Gemini 3.1 Flash Live sebagai model audio dan suara dengan kualitas tertinggi hingga saat ini. Versi Essa meningkatkan sejumlah peningkatan signifikan dibandingkan Gemini Live dan Search Live. Model ini sekarang tersedia dalam pratinjau melalui Gemini Live API di Google AI Studio. Ele menonjol karena menawarkan latensi yang lebih rendah dibandingkan versi sebelumnya dan efektivitas yang lebih besar dalam mengenali nuansa akustik seperti nada dan ritme.

Pengembang dapat segera menguji model baru ini untuk membangun aplikasi dengan percakapan multimodal waktu nyata. Gemini 3.1 Flash Live menyaring kebisingan latar belakang dengan lebih akurat dan dapat membedakan ucapan yang relevan dengan lebih baik di tengah suara lingkungan seperti lalu lintas atau televisi. Além Selain itu, sistem ini mendukung lebih dari 90 bahasa, yang memperluas jangkauan interaksi langsung.

  • Peningkatan pengenalan nuansa akustik seperti nada dan ritme
  • Mengurangi latensi dalam percakapan waktu nyata
  • Penyaringan kebisingan latar belakang dan suara lingkungan yang lebih efektif
  • Mendukung lebih dari 90 bahasa untuk interaksi multimodal

Peningkatan teknis pada model audio

Model baru ini secara signifikan meningkatkan kemampuan untuk memicu alat eksternal selama percakapan langsung. Ele juga memberikan tindak lanjut yang lebih baik terhadap instruksi kompleks, menjaga agen dalam batas operasional bahkan ketika percakapan terjadi secara tidak terduga. Perubahan Essas menghasilkan respons yang lebih andal dan alami.

Pada Gemini Live untuk perangkat Android dan iOS, Flash Live 3.1 memberikan respons lebih cepat dengan jeda lebih sedikit. Sistem dapat mengikuti alasan percakapan dua kali lipat dari sebelumnya. Isso memungkinkan sesi curah pendapat yang lebih lama tanpa kehilangan pemikiran Anda.

Gemini Live secara dinamis menyesuaikan durasi dan nada respons agar sesuai dengan konteks momen. Usuários melaporkan interaksi yang lebih lancar dan lebih sedikit gangguan selama penggunaan sehari-hari. Integrasi dengan model baru berkontribusi pada pengalaman keseluruhan yang lebih konsisten.

Ekspansi global Search Live

Google menggunakan Gemini 3.1 Flash Live untuk meluncurkan Search Live secara global di lebih dari 200 negara. Perluasan ini mencakup semua bahasa dan lokasi di mana Modo IA saat ini tersedia. Fitur ini memungkinkan percakapan interaktif dengan Busca dari Google, termasuk audio dan video melalui Google Lens.

Pengguna kini dapat melakukan penelusuran percakapan real-time dengan akurasi lebih tinggi di berbagai wilayah. Sistem memproses kueri multimodal dengan lebih efisien di berbagai lingkungan. Ketersediaan Essa memperluas akses terhadap informasi suara dalam skala global.

Search Live mendapat manfaat langsung dari peningkatan pengenalan suara dan pengurangan latensi. Conversas dengan penelusuran menjadi lebih natural dan kontekstual. Integrasi audio dan video memfasilitasi interaksi dalam skenario praktis sehari-hari.

Google – daily_creativity/shutterstock.com

Detail tentang dukungan bahasa dan multimodal

Dukungan untuk lebih dari 90 bahasa memungkinkan percakapan multimodal real-time berkualitas tinggi. Model ini menangani variasi pengucapan dan aksen regional dengan lebih baik. Isso menjadikan Gemini Live lebih mudah diakses oleh pengguna di berbagai negara.

Pengembang mendapatkan alat untuk menciptakan pengalaman yang dipersonalisasi berdasarkan model baru. API memudahkan integrasi ke dalam aplikasi yang memerlukan interaksi suara yang kaya. Fokus pada latensi rendah membantu menjaga percakapan tetap mengalir secara alami.

Aplikasi praktis dalam penggunaan sehari-hari

Dalam kehidupan sehari-hari, Gemini Live dengan model baru merespons lebih cepat terhadap perintah dan pertanyaan kompleks. Sistem mempertahankan konteks untuk jangka waktu yang lebih lama tanpa memulai kembali penalaran. Usuários dapat mengeksplorasi ide secara terus menerus selama sesi yang diperpanjang.

Kemampuan untuk menyaring kebisingan lingkungan meningkatkan kinerja di lokasi sibuk atau dengan suara latar belakang. Conversas di lingkungan seperti jalan raya atau ruangan dengan televisi menjadi lebih terang. Penyesuaian nada dan durasi respons yang dinamis menyesuaikan dengan gaya interaksi.

Kemajuan dalam integrasi dengan alat eksternal

Model yang ditingkatkan ini memicu alat eksternal dengan lebih efektif selama percakapan. Ele mengikuti instruksi sistem dengan lebih konsisten bahkan dalam dialog bercabang. Stabilitas Essa berkontribusi terhadap hasil yang lebih dapat diprediksi dalam aplikasi praktis.

Pengembang dan pengguna akhir mendapat manfaat dari interaksi yang lebih kuat. Gemini Live menjadi alat yang lebih andal untuk tugas yang melibatkan banyak langkah. Kombinasi audio tingkat lanjut dan kemampuan penalaran yang diperluas memperluas kemungkinan penggunaan.

Google terus berinvestasi pada model audio untuk membuat interaksi AI lebih alami. Rilis Gemini 3.1 Flash Live merupakan langkah penting ke arah ini. Usuários dari Android dan iOS dapat mencoba fitur baru langsung di aplikasi Gemini Live.

Atualizações terkait dalam ekosistem Gemini

Pengumuman tersebut mencakup peningkatan tambahan pada panel mengambang Gemini Live di Android. Perubahan Essas bertujuan untuk memfasilitasi akses cepat ke fungsi suara. Serangkaian pembaruan memperkuat komitmen terhadap pengalaman percakapan tingkat lanjut.

Search Live kini menjangkau khalayak yang lebih luas dengan kemampuan audio dan video terintegrasi. Ekspansi global mendemokratisasi akses terhadap pencarian suara interaktif. Usuários di berbagai wilayah mendapatkan alat yang lebih canggih untuk kueri waktu nyata.

Gemini 3.1 Flash Live menandai evolusi penting dalam kualitas audio dan suara model Google. Peningkatan dalam latensi, penyaringan kebisingan, dan kepatuhan terhadap instruksi meningkatkan standar interaksi langsung. Rilis pratinjau memungkinkan pengembang untuk mengeksplorasi aplikasi baru sekarang.