Divisi Google DeepMind meresmikan Kamis ini (19) kedatangan iterasi baru untuk rangkaian model kecerdasan buatan utamanya. Pembaruan, yang disebut Gemini 3.1 Pro, dikembangkan dengan fokus prioritas pada perluasan kemampuan penalaran yang kompleks, menjanjikan untuk mengatasi keterbatasan versi sebelumnya dalam tugas-tugas yang memerlukan sintesis data dan logika tingkat lanjut.
Peluncuran ini terjadi pada saat yang strategis bagi sektor teknologi, di mana pembuatan teks sederhana memberi jalan bagi permintaan akan agen yang mampu menjalankan alur kerja yang lengkap. Alat baru ini sekarang tersedia dalam tahap pratinjau untuk pengembang dan pelanggan paket tingkat lanjut, memperkenalkan peningkatan signifikan dalam pemrosesan multimodal mulai dari kode pemrograman hingga interpretasi video dan audio.

Para ahli menunjukkan bahwa perbedaan versi ini terletak pada arsitekturnya yang dioptimalkan untuk memecahkan masalah baru, menjauh dari ketergantungan eksklusif pada pola yang dihafal selama pelatihan. Teknologi ini dirancang untuk melayani pengguna akhir, melalui aplikasi milik perusahaan, dan lingkungan perusahaan yang memerlukan otomatisasi yang kuat melalui API.
Uji validasi internal menunjukkan bahwa model tersebut dapat mempertahankan koherensi dalam rantai pemikiran yang panjang, yang merupakan karakteristik penting untuk pengembangan agen otonom fungsional. Ketersediaan segera ini bertujuan untuk mempercepat integrasi kemampuan ini ke dalam produk pihak ketiga dan platform cloud perusahaan.
Lonjakan kinerja dalam tes logika
Metrik paling signifikan yang disajikan selama pengumuman mengacu pada kinerja pada benchmark ARC-AGI-2, sebuah pengujian ketat yang dirancang untuk mengevaluasi kemampuan AI dalam memecahkan pola logis yang sebelumnya tidak terlihat. Gemini 3.1 Pro mencatat skor 77,1% dalam hal ini, hasil yang mewakili lebih dari dua kali lipat kinerja yang diperoleh pendahulunya, the
Selain evolusi dalam logika abstrak, model ini juga mengalami evaluasi komparatif langsung dengan teknologi mutakhir lainnya yang tersedia di pasar. Dalam pengujian yang dikenal sebagai “Humanity’s Last Exam”, versi baru ini mencapai keberhasilan 44,4%, melampaui solusi pesaing yang dikembangkan oleh
Konsistensi dalam penalaran logis ini memungkinkan alat ini diterapkan dalam situasi di mana pengambilan informasi sederhana saja tidak cukup. Fokus dari pembaruan ini adalah untuk memastikan sistem dapat mengatasi berbagai masalah tanpa kehilangan konteks atau tanggapan halusinasi, sehingga meningkatkan standar keandalan untuk penggunaan profesional dan akademis.
Otonomi dalam navigasi dan agen virtual
Kemampuan untuk beroperasi sebagai agen otonom telah diperluas secara signifikan dalam pembaruan ini, dengan hasil yang mengesankan dalam tolok ukur yang mensimulasikan aktivitas profesional nyata. Dalam pengujian APEX-Agents, yang mengukur efisiensi dalam tugas-tugas jangka panjang, model tersebut mencapai angka 33,5%, yang menunjukkan kemampuan unggul dalam mengelola tujuan yang memerlukan beberapa langkah untuk diselesaikan.
Sorotan lainnya adalah kinerja di BrowserComp, sebuah penilaian yang berfokus pada pencarian internet agen yang dikombinasikan dengan penggunaan alat pemrograman seperti Python. Gemini 3.1 Pro mencapai efektivitas 85,9%, menunjukkan kemampuan untuk mencari, memfilter, dan mengekstrak informasi relevan dari web secara mandiri, mengintegrasikan data ini langsung ke dalam alur kerja.
Untuk menggambarkan peningkatan kemampuan sistem baru, perusahaan menyoroti tiga pilar mendasar yang mendukung pengoperasian agen dalam versi ini:
- Kemampuan untuk mempertahankan fokus pada tujuan yang kompleks selama pelaksanaan yang ekstensif, tanpa penyimpangan dari tujuan.
- Integrasi yang lancar antara penelusuran web dan eksekusi kode untuk validasi data waktu nyata.
- Prioritas alur kerja yang memerlukan penggunaan beberapa alat digital secara terkoordinasi secara bersamaan.
Membuat sistem visual dan coding
Fleksibilitas model ini meluas ke sintesis sistem visual yang kompleks dari perintah teks sederhana. Demonstrasi teknis Durante, kecerdasan buatan mampu menghasilkan animasi dalam format SVG yang skalabel dan ringan, menawarkan alternatif yang efisien terhadap format video tradisional untuk antarmuka web dan aplikasi seluler.
Salah satu contoh praktis yang ditunjukkan adalah menyiapkan dasbor telemetri real-time. Model ini memproses API publik dan data mentah untuk membangun, dari awal, antarmuka fungsional yang memvisualisasikan orbit Estação Espacial Internacional. Prosesnya melibatkan segalanya mulai dari menafsirkan data masukan hingga pengkodean antarmuka grafis akhir.
Di bidang interpretasi kreatif, sistem ini mentransformasikan deskripsi sastra klasik menjadi produk digital modern. Dengan memproses kutipan dari “The Morro of the Ventos Uivantes”, AI menangkap suasana naratif buku dan merancang situs web portofolio kontemporer, menerjemahkan konsep abstrak dan artistik ke dalam kode yang dapat dieksekusi dan desain fungsional.
Alat ini juga menunjukkan kompetensi dalam menciptakan pengalaman interaktif dalam tiga dimensi. Foi menyajikan simulasi di mana sekawanan burung virtual merespons secara dinamis pelacakan tangan pengguna, membuktikan kemampuan model untuk mengintegrasikan visi komputer dengan logika animasi yang kompleks.
Detail tentang akses dan integrasi perusahaan
Distribusi Gemini 3.1 Pro mengikuti model terhuyung-huyung, memprioritaskan pengembang dan pelanggan korporat pada tahap pertama ini. Versi ini dapat diakses melalui platform seperti AI Studio dan Vertex AI, yang memungkinkan perusahaan menguji teknologi di lingkungan mereka sendiri dan mengadaptasi produk mereka untuk menggunakan mesin penalaran baru.
Untuk pengguna individu, akses dilepaskan ke pelanggan paket Google AI Pro dan Ultra, yang telah meningkatkan batas penggunaan. Alat ini juga terintegrasi dengan NotebookLM, meningkatkan sintesis dokumen dan fungsi pembuatan wawasan bagi pengguna berbayar yang menggunakan platform ini untuk penelitian dan studi.
Poin teknis yang relevan adalah pemeliharaan jendela konteks 1 juta token, sebuah fitur yang diwarisi dari generasi seri 3 sebelumnya.