Ultimele Știri (RO)

ChatGPT Images 2.0 vine cu raționament vizual și generare îmbunătățită de text

ChatGPT
Foto: ChatGPT - Iryna Imago / Shutterstock.com

Marți, OpenAI a lansat ChatGPT Images 2.0, o actualizare a modelului de generare de imagini integrat în chatbot. Sistemul, numit gpt-image-2, aduce îmbunătățiri în redarea textului, suport pentru mai multe limbi și capacitatea de a crea compoziții mai complexe. Usuários din toate planurile ChatGPT accesează acum versiunea standard.

Lansarea a avut loc pe 21 aprilie 2026. Compania a evidențiat includerea unui mod „think” care permite modelului să caute pe web, să verifice detalii și să genereze până la opt imagini dintr-un singur prompt. Isso facilitează producerea de storyboard-uri, infografice și materiale cu un aspect structurat. Rezoluția ajunge la 2K în unele cazuri.

OpenAI evidențiază raționamentul și fidelitatea în noile funcții

Modelul urmează acum instrucțiunile cu mai multă acuratețe și păstrează elementele solicitate, cum ar fi pictogramele, interfețele și textul mic. OpenAI a citat exemple de postere științifice, carduri cu rețete și diapozitive de prezentare ca zone de câștig. S-a îmbunătățit și suportul pentru textele în japoneză, coreeană, hindi și bengaleză.

Desenvolvedores obține acces prin API, cu prețuri bazate pe calitate și rezoluție. Usuários plătite au mai multă capacitate în modul avansat. Actualizarea vine la câteva luni după îmbunătățirile anterioare aduse sistemului de imagistică.

  • Geração de mai multe imagini interconectate
  • Modo gândind cu căutarea pe web
  • Redarea textului Melhor în mai multe limbi
  • Suporte în proporții variate, de la 3:1 la 1:3
  • Resolução până la 2K la ieșirile selectate

Crítico subliniază defecte în înțelegerea funcțională

Gary Marcus, un cercetător cunoscut pentru că pune sub semnul întrebării capacitățile actuale de AI, a testat noul sistem cu diagrame de biciclete. Într-o etichetă automată, modelul a confundat frâna spate cu tubul scaunului și treapta de viteză cu frână. O etichetă indică un spațiu gol.

Într-un test mai dificil, Marcus a cerut o bicicletă tandem mai înaltă decât media, cu portbagaj și sacoșe. Imaginea generată a prezentat probleme precum un schimbător spate introdus în roată, o pârghie de frână prost poziționată și un ghidon spate în formă de șa. Marcus a observat că sistemul se potrivește tiparelor vizuale fără a înțelege funcția reală a pieselor.

Especialistas se compară cu limitările umane

Marcus a recunoscut că omul mediu ar avea, de asemenea, dificultăți să deseneze tandemul cu precizie. Cu toate acestea, mecanicii, bicicliștii experimentați sau designerii ar identifica rapid erorile. Exemplul servește pentru a discuta măsura în care modelul înțelege lumea fizică.

Dezbaterea are loc pe măsură ce sectorul celebrează salturile în imagistica profesională. Testes independent a confirmat câștiguri în textul lizibil și aspectul dens, dar cazurile specifice expun încă lacune în raționamentul cauzal.

Ficha Tehnica ChatGPT Images 2.0

  • Baza Modelo: gpt-image-2
  • Disponibilidade: toți utilizatorii ChatGPT
  • Modo Advanced: abonați plătiți
  • Recursos principal: raționament, ieșiri multiple, text multilingv
  • Resolução: până la 2K
  • API: lansat cu prețuri variabile

OpenAI nu a comentat public în acest moment testarea Marcus. Sistemul continuă să evolueze, cu actualizări regulate bazate pe feedback-ul utilizatorilor.

↓ Continue lendo ↓