ChatGPT Images 2.0 bietet visuelle Argumentation und verbesserte Textgenerierung

Beatriz

em 28 April 2026

Am Dienstag veröffentlichte OpenAI ChatGPT Images 2.0, ein Update des im Chatbot integrierten Bildgenerierungsmodells. Das System mit dem Namen gpt-image-2 bringt Verbesserungen bei der Textwiedergabe, Unterstützung für mehrere Sprachen und die Möglichkeit, komplexere Kompositionen zu erstellen. Usuários aller ChatGPT-Pläne greifen jetzt auf die Standardversion zu.

Der Start erfolgte am 21. April 2026. Das Unternehmen hob die Integration eines „Think“-Modus hervor, der es dem Modell ermöglicht, das Internet zu durchsuchen, Details zu überprüfen und bis zu acht Bilder aus einer einzigen Eingabeaufforderung zu generieren. Isso erleichtert die Erstellung von Storyboards, Infografiken und Materialien mit strukturiertem Layout. Die Auflösung erreicht in einigen Fällen 2K.

OpenAI hebt Argumentation und Treue bei neuen Funktionen hervor

Das Modell folgt Anweisungen jetzt genauer und behält angeforderte Elemente wie Symbole, Schnittstellen und kleinen Text bei. OpenAI nannte Beispiele für wissenschaftliche Poster, Rezeptkarten und Präsentationsfolien als Gewinnbereiche. Auch die Unterstützung für japanische, koreanische, hindi- und bengalische Texte wurde verbessert.

Desenvolvedores erhält Zugriff über die API, wobei die Preise auf Qualität und Auflösung basieren. Bezahlte Usuários verfügen über mehr Kapazität im erweiterten Modus. Das Update kommt Monate nach früheren Verbesserungen des Bildgebungssystems.

Geração mehrerer miteinander verbundener Bilder
Modo Denken mit Websuche
Melhor Textwiedergabe in mehreren Sprachen
Suporte in unterschiedlichen Anteilen, von 3:1 bis 1:3
Resolução bis zu 2K an ausgewählten Ausgängen

https://twitter.com/OpenAI/status/2046670978890276918?ref_src=twsrc%5Etfw

Crítico weist auf Mängel im Funktionsverständnis hin

Gary Marcus, ein Forscher, der dafür bekannt ist, aktuelle KI-Fähigkeiten in Frage zu stellen, testete das neue System mit Fahrraddiagrammen. In einer automatischen Beschriftung verwechselte das Modell Hinterradbremse mit Sitzrohr und Gangschaltung mit Bremse. Ein Etikett wies auf leeren Raum hin.

In einem schwierigeren Test verlangte Marcus ein überdurchschnittlich großes Tandemfahrrad mit Gepäckträger und Satteltaschen. Das erzeugte Bild zeigte Probleme wie ein im Rad eingesetztes Schaltwerk, einen schlecht positionierten Bremshebel und einen sattelförmigen hinteren Lenker. Marcus beobachtete, dass das System visuelle Muster abgleicht, ohne die tatsächliche Funktion der Teile zu verstehen.

Especialistas im Vergleich zu menschlichen Einschränkungen

Marcus erkannte, dass auch der durchschnittliche Mensch Schwierigkeiten haben würde, das Tandem genau zu zeichnen. Allerdings würden Mechaniker, erfahrene Radfahrer oder Konstrukteure Fehler schnell erkennen. Das Beispiel dient dazu, zu diskutieren, inwieweit das Modell die physische Welt versteht.

Die Debatte findet statt, während die Branche Fortschritte in der professionellen Bildgebung feiert. Das unabhängige Testes bestätigte Fortschritte bei der Lesbarkeit von Texten und dichten Layouts, bestimmte Fälle weisen jedoch immer noch Lücken in der kausalen Argumentation auf.

Ficha ChatGPT-Technik Images 2.0

Modelo-Basis: gpt-image-2
Disponibilidade: alle ChatGPT-Benutzer
Modo Advanced: Bezahlte Abonnenten
Recursos main: Argumentation, mehrere Ausgaben, mehrsprachiger Text
Resolução: bis zu 2K
API: mit variabler Preisgestaltung veröffentlicht

OpenAI hat die Marcus-Tests derzeit nicht öffentlich kommentiert. Das System wird ständig weiterentwickelt und regelmäßig auf Grundlage des Benutzerfeedbacks aktualisiert.

ChatGPT Images 2.0 llega con razonamiento visual y generación de texto mejorada »

« ChatGPT Images 2.0 arrives with visual reasoning and improved text generation

Tags: ChatGPT-Bilder 2.0gpt-image-2-VorlageOpenAI-Bildgenerierungvisuelles Denken KI