Berita Terkini (MS)

Imej ChatGPT 2.0 hadir dengan penaakulan visual dan penjanaan teks yang dipertingkatkan

ChatGPT
Foto: ChatGPT - Iryna Imago / Shutterstock.com

Pada hari Selasa, OpenAI mengeluarkan ChatGPT Images 2.0, kemas kini kepada model penjanaan imej yang disepadukan ke dalam chatbot. Sistem ini, yang dipanggil gpt-image-2, membawa peningkatan dalam pemaparan teks, sokongan untuk berbilang bahasa dan keupayaan untuk mencipta gubahan yang lebih kompleks. Usuários daripada semua rancangan ChatGPT kini mengakses versi standard.

Pelancaran berlangsung pada 21 April 2026. Syarikat itu menyerlahkan kemasukan mod “berfikir” yang membolehkan model mencari di web, menyemak butiran dan menjana sehingga lapan imej daripada satu gesaan. Isso memudahkan penghasilan papan cerita, maklumat grafik dan bahan dengan reka letak berstruktur. Resolusi mencapai 2K dalam beberapa kes.

OpenAI menyerlahkan penaakulan dan kesetiaan dalam ciri baharu

Model kini mengikut arahan dengan lebih tepat dan mengekalkan elemen yang diminta seperti ikon, antara muka dan teks kecil. OpenAI memetik contoh poster saintifik, kad resipi dan slaid pembentangan sebagai bidang keuntungan. Sokongan untuk teks Jepun, Korea, Hindi dan Bengali juga telah bertambah baik.

Desenvolvedores mendapat akses melalui API, dengan harga berdasarkan kualiti dan resolusi. Usuários berbayar mempunyai lebih banyak kapasiti dalam mod lanjutan. Kemas kini datang beberapa bulan selepas penambahbaikan sebelumnya pada sistem pengimejan.

  • Geração berbilang imej yang saling berkaitan
  • Modo berfikir dengan carian web
  • Penyampaian teks Melhor dalam berbilang bahasa
  • Suporte dalam perkadaran yang berbeza-beza, dari 3:1 hingga 1:3
  • Resolução sehingga 2K pada output terpilih

Crítico menunjukkan kelemahan dalam pemahaman fungsi

Gary Marcus, seorang penyelidik yang terkenal kerana mempersoalkan keupayaan AI semasa, menguji sistem baharu dengan gambar rajah basikal. Dalam label automatik, model itu mengelirukan brek belakang dengan tiub tempat duduk dan gear dengan brek. Label menunjuk ke ruang kosong.

Dalam ujian yang lebih sukar, Marcus meminta basikal tandem yang lebih tinggi daripada purata, dengan rak bagasi dan beg pelana. Imej yang dijana menimbulkan masalah seperti pemindah lari belakang yang dimasukkan ke dalam roda, tuas brek yang tidak baik dan bar hendal belakang berbentuk pelana. Marcus memerhatikan bahawa sistem sepadan dengan corak visual tanpa memahami fungsi sebenar bahagian tersebut.

Especialistas bandingkan dengan batasan manusia

Marcus menyedari bahawa rata-rata manusia juga akan menghadapi kesukaran melukis tandem dengan tepat. Walau bagaimanapun, mekanik, penunggang basikal berpengalaman atau pereka bentuk akan mengenal pasti ralat dengan cepat. Contoh tersebut berfungsi untuk membincangkan sejauh mana model memahami dunia fizikal.

Perdebatan berlaku ketika sektor ini meraikan lonjakan dalam pengimejan profesional. Testes bebas mengesahkan keuntungan dalam teks yang boleh dibaca dan reka letak padat, tetapi kes tertentu masih mendedahkan jurang dalam penaakulan sebab-akibat.

Ficha ChatGPT Teknik Images 2.0

  • Pangkalan Modelo: gpt-image-2
  • Disponibilidade: semua pengguna ChatGPT
  • Modo Advanced: Pelanggan Berbayar
  • Recursos utama: penaakulan, berbilang output, teks berbilang bahasa
  • Resolução: sehingga 2K
  • API: dikeluarkan dengan harga berubah-ubah

OpenAI belum mengulas secara terbuka tentang ujian Marcus pada masa ini. Sistem ini terus berkembang, dengan kemas kini tetap berdasarkan maklum balas pengguna.

↓ Continue lendo ↓