Indonésio News

OpenAI meluncurkan model o3 dan o4-mini dengan penalaran gambar dan alat yang canggih

OpenAI
Foto: OpenAI - Novikov Aleksey/ Shutterstock.com

OpenAI meluncurkan model o3 dan o4-mini dengan kemajuan dalam penalaran visual dan penggunaan alat terintegrasi. Perusahaan pada hari Rabu ini mengumumkan peluncuran model seri o baru, yang mewakili kemajuan signifikan dalam kemampuan pemrosesan. O3 menonjol sebagai yang paling bertenaga di jajarannya hingga saat ini, sedangkan o4-mini menawarkan kinerja optimal dengan biaya lebih rendah dan kecepatan lebih tinggi. Model Esses dilatih untuk berpikir lebih lama sebelum merespons, menggabungkan penalaran berantai dengan dukungan berbagai modalitas.

Model memungkinkan integrasi langsung gambar ke dalam proses penalaran. Usuários dapat mengunggah diagram, sketsa, atau papan tulis berkualitas rendah untuk analisis dan manipulasi. Fungsionalitas Essa memperluas aplikasi ke bidang teknis dan kreatif.

Kemampuan utama model-model baru

OpenAI o3 memimpin dalam kinerja di seluruh tolok ukur pengkodean, matematika, sains, dan persepsi visual. Ele mengungguli versi sebelumnya dalam tugas-tugas yang memerlukan pemikiran mendalam dan penggunaan alat asli. Model ini menggabungkan penelusuran web, eksekusi kode dalam Python, analisis file, dan pembuatan gambar dalam aliran tunggal.

O4-mini dirancang untuk efisiensi. Ele mempertahankan tingkat akurasi yang tinggi dalam tugas serupa, tetapi dengan latensi yang lebih rendah dan biaya yang lebih rendah. Versi Essa melayani pengguna yang membutuhkan respons cepat tanpa mengurangi kualitas yang signifikan.

Kedua model mendukung alat lengkap. Incluem navigasi web, analisis file, otomatisasi, dan memori kontekstual untuk interaksi yang lebih konsisten.

Ketersediaan dan akses awal

ChatGPT Plus, Pro dan Team memperoleh akses langsung ke model di pemilih opsi. O3 tampil sebagai pilihan utama untuk tugas-tugas kompleks, sedangkan o4-mini dan varian performa tinggi menggantikan opsi sebelumnya. Rilis API terjadi secara bertahap untuk pengembang.

Pengguna gratis mungkin akan segera merasakan kemampuan terbatas. Perusahaan memprioritaskan peluncuran yang terkendali untuk memastikan stabilitas dan mengumpulkan masukan.

Kemajuan dalam penalaran dengan gambar

OpenAI menyoroti kemampuan “berpikir dengan gambar” sebagai pembeda. Model tidak hanya mendeskripsikan konten visual, namun mengintegrasikan informasi gambar secara langsung ke dalam logika pemecahan masalah. Isso memungkinkan Anda memanipulasi, memotong, atau mengubah elemen visual selama pemrosesan.

Contohnya termasuk analisis diagram teknis atau sketsa manual. Sistem ini mengidentifikasi hubungan spasial dan menerapkan penalaran langkah demi langkah untuk mencapai kesimpulan yang akurat.

Inovasi ini membuka jalan untuk penerapan di bidang teknik, pendidikan, dan penelitian ilmiah. Profissionais dapat mengirimkan diagram alur atau catatan untuk penjelasan rinci atau koreksi.

Performa dalam benchmark dan perbandingan

o3 mencetak rekor baru dalam pengkodean independen dan penilaian matematika tingkat lanjut. Ele menunjukkan keunggulan dalam masalah yang memerlukan beberapa langkah logis dan verifikasi internal. Resultados menunjukkan peningkatan yang signifikan dibandingkan pendahulunya o1 dalam metrik standar.

O4-mini menyeimbangkan kinerja dan efisiensi. Ele mencapai skor mendekati o3 dalam tugas yang dipilih, tetapi dengan konsumsi sumber daya yang jauh lebih rendah. Pengoptimalan Essa membuatnya lebih mudah digunakan dalam skala besar untuk bisnis dan pengembang individu.

Penilaian keamanan menunjukkan bahwa kedua model mempertahankan ketahanan terhadap upaya untuk melewati pembatasan. Eles secara konsisten menolak konten berbahaya.

Integrasi dengan alat dan ekosistem

Model pada dasarnya menggabungkan alat ke dalam penalaran. Isso menyertakan eksekusi kode Python untuk penghitungan kompleks dan pencarian web untuk data terkini. Kombinasi ini memungkinkan Anda memecahkan masalah nyata yang memerlukan banyak sumber dan verifikasi.

Alat seperti analisis file dan pembuatan gambar memperluas kegunaannya. Usuários membuat alur lengkap dalam satu interaksi, mulai dari pencarian hingga melihat hasil.

Perusahaan telah merilis alat pelengkap untuk programmer. Elas memfasilitasi integrasi ke dalam lingkungan pengembangan dan mempercepat alur kerja.

Langkah-langkah dan penilaian keamanan

OpenAI menerapkan kerangka kesiapsiagaan yang diperbarui untuk menilai risiko. Model-model tersebut tidak memenuhi ambang batas yang tinggi dalam kategori-kategori penting seperti kemampuan biologis, keamanan siber, atau pengembangan diri. Tinjauan independen mengkonfirmasi keselarasan yang tepat.

Langkah-langkah tersebut mencakup pengujian ketat untuk menolak konten berbahaya dan perlawanan terhadap jailbreak. Perusahaan terus memantau penggunaan produksi untuk penyesuaian yang diperlukan.