Berita Terbaru (ID)

ChatGPT Images 2.0 hadir dengan penalaran visual dan pembuatan teks yang ditingkatkan

ChatGPT
Foto: ChatGPT - Iryna Imago / Shutterstock.com

Pada hari Selasa, OpenAI merilis ChatGPT Images 2.0, pembaruan pada model pembuatan gambar yang terintegrasi ke dalam chatbot. Sistem yang diberi nama gpt-image-2 ini menghadirkan peningkatan dalam rendering teks, dukungan berbagai bahasa, dan kemampuan untuk membuat komposisi yang lebih kompleks. Usuários dari semua paket ChatGPT sekarang mengakses versi standar.

Peluncurannya berlangsung pada 21 April 2026. Perusahaan menyoroti penyertaan mode “berpikir” yang memungkinkan model menelusuri web, memeriksa detail, dan menghasilkan hingga delapan gambar dari satu perintah. Isso memfasilitasi produksi storyboard, infografis, dan materi dengan tata letak terstruktur. Resolusi mencapai 2K dalam beberapa kasus.

OpenAI menyoroti alasan dan kesetiaan dalam fitur-fitur baru

Model ini sekarang mengikuti instruksi dengan lebih akurat dan mempertahankan elemen yang diminta seperti ikon, antarmuka, dan teks kecil. OpenAI mengutip contoh poster ilmiah, kartu resep, dan slide presentasi sebagai bidang yang dapat dimanfaatkan. Dukungan untuk teks Jepang, Korea, Hindi, dan Bengali juga meningkat.

Desenvolvedores mendapatkan akses melalui API, dengan harga berdasarkan kualitas dan resolusi. Usuários berbayar memiliki kapasitas lebih besar dalam mode lanjutan. Pembaruan ini dilakukan beberapa bulan setelah perbaikan sebelumnya pada sistem pencitraan.

  • Geração dari beberapa gambar yang saling terkait
  • Modo berpikir dengan pencarian web
  • Render teks Melhor dalam berbagai bahasa
  • Suporte dalam proporsi yang bervariasi, dari 3:1 hingga 1:3
  • Resolução hingga 2K pada output yang dipilih

Crítico menunjukkan kelemahan dalam pemahaman fungsional

Gary Marcus, seorang peneliti yang terkenal mempertanyakan kemampuan AI saat ini, menguji sistem baru dengan diagram sepeda. Pada label otomatis, modelnya bingung antara rem belakang dengan tabung kursi dan gigi dengan rem. Label menunjuk ke ruang kosong.

Dalam pengujian yang lebih sulit, Marcus meminta sepeda tandem yang lebih tinggi dari rata-rata, dengan rak bagasi dan tas sadel. Gambar yang dihasilkan menunjukkan permasalahan seperti pemindah gigi (derailleur) belakang yang dimasukkan ke dalam roda, posisi tuas rem yang buruk, dan stang belakang berbentuk sadel. Marcus mengamati bahwa sistem mencocokkan pola visual tanpa memahami fungsi sebenarnya dari bagian-bagiannya.

Especialistas dibandingkan dengan keterbatasan manusia

Marcus menyadari bahwa rata-rata manusia juga akan kesulitan menggambar tandem secara akurat. Namun, mekanik, pengendara sepeda berpengalaman, atau desainer akan mengidentifikasi kesalahan dengan cepat. Contoh tersebut berfungsi untuk mendiskusikan sejauh mana model memahami dunia fisik.

Perdebatan ini terjadi ketika sektor ini merayakan lompatan dalam pencitraan profesional. Testes independen mengonfirmasi peningkatan dalam teks yang mudah dibaca dan tata letak yang padat, namun kasus tertentu masih memperlihatkan kesenjangan dalam penalaran sebab akibat.

Teknik Obrolan Ficha Images 2.0

  • Basis Modelo: gpt-image-2
  • Disponibilidade: semua pengguna ChatGPT
  • Modo Lanjutan: Pelanggan Berbayar
  • Recursos utama: penalaran, banyak keluaran, teks multibahasa
  • Resolução: hingga 2K
  • API: dirilis dengan harga variabel

OpenAI belum mengomentari pengujian Marcus secara publik saat ini. Sistem terus berkembang, dengan pembaruan rutin berdasarkan masukan pengguna.

↓ Continue lendo ↓