ChatGPT Images 2.0 arriveert met visuele redenering en verbeterde tekstgeneratie

ChatGPT

ChatGPT - Iryna Imago / Shutterstock.com

Dinsdag heeft OpenAI ChatGPT Images 2.0 uitgebracht, een update van het beeldgeneratiemodel dat in de chatbot is geïntegreerd. Het systeem, genaamd gpt-image-2, brengt verbeteringen in de tekstweergave, ondersteuning voor meerdere talen en de mogelijkheid om complexere composities te maken. Usuários van alle ChatGPT-abonnementen heeft nu toegang tot de standaardversie.

De lancering vond plaats op 21 april 2026. Het bedrijf benadrukte de toevoeging van een “denk” -modus waarmee het model op internet kan zoeken, details kan controleren en tot acht afbeeldingen kan genereren vanuit één enkele prompt. Isso faciliteert de productie van storyboards, infographics en materialen met een gestructureerde lay-out. De resolutie bereikt in sommige gevallen 2K.

OpenAI benadrukt redenering en trouw in nieuwe functies

Het model volgt de instructies nu nauwkeuriger en behoudt de gevraagde elementen zoals pictogrammen, interfaces en kleine tekst. OpenAI noemde voorbeelden van wetenschappelijke posters, receptkaarten en presentatiedia’s als winstpunten. Ondersteuning voor Japanse, Koreaanse, Hindi en Bengaalse teksten is ook verbeterd.

Desenvolvedores krijgt toegang via API, met prijzen gebaseerd op kwaliteit en resolutie. Betaalde Usuários hebben meer capaciteit in de geavanceerde modus. De update komt maanden na eerdere verbeteringen aan het beeldvormingssysteem.

  • Geração van meerdere onderling gerelateerde afbeeldingen
  • Modo denken met zoeken op internet
  • Melhor tekstweergave in meerdere talen
  • Suporte in verschillende verhoudingen, van 3:1 tot 1:3
  • Resolução tot 2K op geselecteerde uitgangen

https://twitter.com/OpenAI/status/2046670978890276918?ref_src=twsrc%5Etfw

Crítico wijst op tekortkomingen in het functionele begrip

Gary Marcus, een onderzoeker die bekend staat om het in twijfel trekken van de huidige AI-mogelijkheden, testte het nieuwe systeem met fietsdiagrammen. Op een automatisch label verwarde het model de achterrem met zitbuis en de versnelling met rem. Een label wees naar lege ruimte.

In een moeilijkere test vroeg Marcus om een ​​groter dan gemiddelde tandem, met bagagerek en zadeltassen. Het gegenereerde beeld bracht problemen met zich mee, zoals een achterderailleur die in het wiel was geplaatst, een slecht geplaatste remhendel en een zadelvormig achterstuur. Marcus merkte op dat het systeem visuele patronen matcht zonder de werkelijke functie van de onderdelen te begrijpen.

Especialistas is te vergelijken met menselijke beperkingen

Marcus besefte dat de gemiddelde mens ook moeite zou hebben met het nauwkeurig tekenen van de tandem. Monteurs, ervaren fietsers of ontwerpers zouden fouten echter snel opmerken. Het voorbeeld dient om te bespreken in hoeverre het model de fysieke wereld begrijpt.

Het debat vindt plaats terwijl de sector sprongen in professionele beeldvorming viert. Onafhankelijke Testes bevestigde winst op het gebied van leesbare tekst en compacte lay-outs, maar specifieke gevallen leggen nog steeds hiaten in de causale redenering bloot.

Ficha ChatGPT-techniek Images 2.0

  • Modelo-basis: gpt-image-2
  • Disponibilidade: alle ChatGPT-gebruikers
  • Modo Geavanceerd: betaalde abonnees
  • Recursos hoofd: redenering, meerdere uitgangen, meertalige tekst
  • Resolução: tot 2K
  • API: uitgebracht met variabele prijzen

OpenAI heeft op dit moment geen publiekelijk commentaar gegeven op de Marcus-tests. Het systeem blijft evolueren, met regelmatige updates op basis van gebruikersfeedback.