Google mengeluarkan kemas kini Gemini dengan lonjakan dalam logik dan penciptaan sistem visual autonomi
Bahagian Google DeepMind membuat rasmi Khamis ini (19) ketibaan lelaran baharu untuk keluarga model kecerdasan buatan utamanya. Kemas kini, yang dipanggil Gemini 3.1 Pro, telah dibangunkan dengan tumpuan keutamaan untuk mengembangkan keupayaan penaakulan yang kompleks, menjanjikan untuk mengatasi had versi sebelumnya dalam tugas yang memerlukan sintesis data dan logik lanjutan.
Pelancaran berlaku pada saat yang strategik untuk sektor teknologi, di mana penjanaan teks mudah memberi laluan kepada permintaan untuk ejen yang mampu melaksanakan aliran kerja yang lengkap. Alat baharu kini tersedia dalam fasa pratonton untuk pembangun dan pelanggan pelan lanjutan, memperkenalkan penambahbaikan ketara dalam pemprosesan pelbagai mod yang terdiri daripada kod pengaturcaraan kepada tafsiran video dan audio.
Pakar menunjukkan bahawa perbezaan dalam versi ini terletak pada seni bina yang dioptimumkan untuk menyelesaikan masalah baharu, menjauhkan diri daripada pergantungan eksklusif pada corak yang dihafal semasa latihan. Teknologi ini direka bentuk untuk melayani kedua-dua pengguna akhir, melalui aplikasi proprietari syarikat dan persekitaran korporat yang memerlukan automasi yang teguh melalui API.
Ujian pengesahan dalaman menunjukkan bahawa model boleh mengekalkan keselarasan dalam rantaian pemikiran yang panjang, satu ciri penting untuk pembangunan agen autonomi berfungsi. Ketersediaan segera bertujuan untuk mempercepatkan penyepaduan keupayaan ini ke dalam produk pihak ketiga dan platform awan syarikat.
Lonjakan prestasi dalam ujian logik
Metrik paling penting yang dibentangkan semasa pengumuman merujuk kepada prestasi pada penanda aras ARC-AGI-2, ujian ketat yang direka untuk menilai keupayaan AI untuk menyelesaikan corak logik yang tidak kelihatan sebelum ini. Gemini 3.1 Pro merekodkan skor 77.1% dalam hal ini, hasil yang mewakili lebih daripada dua kali ganda prestasi yang diperoleh oleh pendahulunya,
Sebagai tambahan kepada evolusi dalam logik abstrak, model itu tertakluk kepada penilaian perbandingan langsung dengan teknologi canggih lain yang terdapat di pasaran. Dalam ujian yang dikenali sebagai “Humanity’s Last Exam”, versi baharu itu mencapai kejayaan 44.4%, mengatasi penyelesaian bersaing yang dibangunkan oleh
Kekonsistenan dalam penaakulan logik ini membolehkan alat digunakan dalam situasi di mana pencarian maklumat mudah tidak mencukupi. Fokus kemas kini adalah untuk memastikan sistem boleh menavigasi masalah pelbagai rupa tanpa kehilangan konteks atau tindak balas halusinasi, meningkatkan bar untuk kebolehpercayaan untuk kegunaan profesional dan akademik.
Autonomi dalam navigasi dan ejen maya
Keupayaan untuk beroperasi sebagai ejen autonomi telah diperluaskan dalam kemas kini ini, dengan hasil yang mengagumkan dalam penanda aras yang mensimulasikan aktiviti profesional sebenar. Dalam ujian APEX-Agents, yang mengukur kecekapan dalam tugas jangka panjang, model itu mencapai markah 33.5%, menunjukkan kebolehan unggul untuk mengurus objektif yang memerlukan beberapa langkah untuk diselesaikan.
Sorotan lain ialah prestasi dalam BrowseComp, penilaian yang tertumpu pada carian internet agenik digabungkan dengan penggunaan alat pengaturcaraan seperti Python. Gemini 3.1 Pro mencapai keberkesanan 85.9%, menunjukkan keupayaan untuk mencari, menapis dan mengekstrak maklumat yang berkaitan daripada web secara autonomi, menyepadukan data ini terus ke dalam aliran kerja.
Untuk menggambarkan keupayaan sistem baharu yang dipertingkatkan, syarikat itu menekankan tiga tonggak asas yang menyokong operasi ejen dalam versi ini:
- Keupayaan untuk mengekalkan fokus pada objektif yang kompleks sepanjang pelaksanaan yang meluas, tanpa penyelewengan daripada tujuan.
- Penyepaduan lancar antara carian web dan pelaksanaan kod untuk pengesahan data masa nyata.
- Keutamaan aliran kerja yang memerlukan penggunaan berbilang alat digital secara serentak secara serentak.
Mencipta sistem visual dan pengekodan
Fleksibiliti model meluas kepada sintesis sistem visual kompleks daripada arahan teks mudah. Demonstrasi teknikal Durante, kecerdasan buatan mampu menjana animasi dalam format SVG yang boleh skala dan ringan, menawarkan alternatif yang cekap kepada format video tradisional untuk antara muka web dan aplikasi mudah alih.
Salah satu contoh praktikal yang ditunjukkan melibatkan penyediaan papan pemuka telemetri masa nyata. Model ini memproses API awam dan data mentah untuk membina, dari awal, antara muka berfungsi yang menggambarkan orbit Estação Espacial Internacional. Proses itu melibatkan segala-galanya daripada mentafsir data input kepada pengekodan antara muka grafik akhir.
Dalam bidang tafsiran kreatif, sistem ini mengubah penerangan sastera klasik kepada produk digital moden. Dengan memproses petikan daripada “The Morro of the Ventos Uivantes”, AI merakam suasana naratif buku itu dan mereka bentuk laman web portfolio kontemporari, menterjemahkan konsep abstrak dan artistik kepada kod boleh laku dan reka bentuk berfungsi.
Alat ini juga menunjukkan kecekapan dalam mencipta pengalaman interaktif dalam tiga dimensi. Foi mempersembahkan simulasi di mana sekumpulan burung maya bertindak balas secara dinamik kepada penjejakan tangan pengguna, membuktikan keupayaan model untuk menyepadukan penglihatan komputer dengan logik animasi yang kompleks.
Butiran mengenai akses dan integrasi korporat
Pengedaran Gemini 3.1 Pro mengikut model berperingkat, mengutamakan pembangun dan pelanggan korporat pada peringkat pertama ini. Versi ini boleh diakses melalui platform seperti AI Studio dan Vertex AI, membolehkan syarikat menguji teknologi dalam persekitaran mereka sendiri dan menyesuaikan produk mereka untuk menggunakan enjin penaakulan baharu.
Untuk pengguna individu, akses telah dikeluarkan kepada pelanggan pelan Google AI Pro dan Ultra, yang telah meningkatkan had penggunaan. Alat ini juga disepadukan dengan NotebookLM, meningkatkan sintesis dokumen dan fungsi penjanaan cerapan untuk pengguna berbayar yang menggunakan platform untuk penyelidikan dan kajian.
Perkara teknikal yang berkaitan ialah penyelenggaraan tetingkap konteks 1 juta token, ciri yang diwarisi daripada generasi sebelumnya siri 3.
Veja Tambem em News (MS)
Penurunan harga PlayStation 5 Pro mempercepatkan jualan runcit digital dan menghapuskan stok global
Kemas kini sistem Apple baharu mengoptimumkan pengurusan tugasan segera untuk pengguna iPhone
Kebocoran butiran perkakasan PlayStation mudah alih baharu dengan grafik unggul kepada Xbox Series S
Oppo secara rasmi melancarkan Find X9 Ultra di seluruh dunia dengan kanta Hasselblad dan bateri yang teguh
Edisi baharu telefon pintar boleh lipat membawa kemasan emas kepada pesaing Sukan Musim Sejuk
Tim Cook mendedahkan prototaip iPhone dan iPod baharu dalam sambutan ulang tahun kelima puluh Apple
Leak mendedahkan Lords of the Fallen dan Sword Art Online dalam katalog PS Plus Essential April
Sistem Android menerima integrasi Gemini Nano 4 asli untuk pemprosesan luar talian pada telefon pintar
Samsung mengemas kini modul QuickStar dan mengembangkan kawalan visual panel dalam antara muka One UI 8.5
Pengilang mengemas kini penderia foto telefon pintar premium dengan fokus pada zum dan kecerdasan buatan
Apple membangunkan iPhone boleh lipat baharu dan menyediakan edisi khas untuk meraikan 20 tahun jenama itu