Am Dienstag veröffentlichte OpenAI ChatGPT Images 2.0, ein Update des im Chatbot integrierten Bildgenerierungsmodells. Das System mit dem Namen gpt-image-2 bringt Verbesserungen bei der Textwiedergabe, Unterstützung für mehrere Sprachen und die Möglichkeit, komplexere Kompositionen zu erstellen. Usuários aller ChatGPT-Pläne greifen jetzt auf die Standardversion zu.
Der Start erfolgte am 21. April 2026. Das Unternehmen hob die Integration eines „Think“-Modus hervor, der es dem Modell ermöglicht, das Internet zu durchsuchen, Details zu überprüfen und bis zu acht Bilder aus einer einzigen Eingabeaufforderung zu generieren. Isso erleichtert die Erstellung von Storyboards, Infografiken und Materialien mit strukturiertem Layout. Die Auflösung erreicht in einigen Fällen 2K.
OpenAI hebt Argumentation und Treue bei neuen Funktionen hervor
Das Modell folgt Anweisungen jetzt genauer und behält angeforderte Elemente wie Symbole, Schnittstellen und kleinen Text bei. OpenAI nannte Beispiele für wissenschaftliche Poster, Rezeptkarten und Präsentationsfolien als Gewinnbereiche. Auch die Unterstützung für japanische, koreanische, hindi- und bengalische Texte wurde verbessert.
Desenvolvedores erhält Zugriff über die API, wobei die Preise auf Qualität und Auflösung basieren. Bezahlte Usuários verfügen über mehr Kapazität im erweiterten Modus. Das Update kommt Monate nach früheren Verbesserungen des Bildgebungssystems.
- Geração mehrerer miteinander verbundener Bilder
- Modo Denken mit Websuche
- Melhor Textwiedergabe in mehreren Sprachen
- Suporte in unterschiedlichen Anteilen, von 3:1 bis 1:3
- Resolução bis zu 2K an ausgewählten Ausgängen
https://twitter.com/OpenAI/status/2046670978890276918?ref_src=twsrc%5Etfw
Crítico weist auf Mängel im Funktionsverständnis hin
Gary Marcus, ein Forscher, der dafür bekannt ist, aktuelle KI-Fähigkeiten in Frage zu stellen, testete das neue System mit Fahrraddiagrammen. In einer automatischen Beschriftung verwechselte das Modell Hinterradbremse mit Sitzrohr und Gangschaltung mit Bremse. Ein Etikett wies auf leeren Raum hin.
In einem schwierigeren Test verlangte Marcus ein überdurchschnittlich großes Tandemfahrrad mit Gepäckträger und Satteltaschen. Das erzeugte Bild zeigte Probleme wie ein im Rad eingesetztes Schaltwerk, einen schlecht positionierten Bremshebel und einen sattelförmigen hinteren Lenker. Marcus beobachtete, dass das System visuelle Muster abgleicht, ohne die tatsächliche Funktion der Teile zu verstehen.
Especialistas im Vergleich zu menschlichen Einschränkungen
Marcus erkannte, dass auch der durchschnittliche Mensch Schwierigkeiten haben würde, das Tandem genau zu zeichnen. Allerdings würden Mechaniker, erfahrene Radfahrer oder Konstrukteure Fehler schnell erkennen. Das Beispiel dient dazu, zu diskutieren, inwieweit das Modell die physische Welt versteht.
Die Debatte findet statt, während die Branche Fortschritte in der professionellen Bildgebung feiert. Das unabhängige Testes bestätigte Fortschritte bei der Lesbarkeit von Texten und dichten Layouts, bestimmte Fälle weisen jedoch immer noch Lücken in der kausalen Argumentation auf.
Ficha ChatGPT-Technik Images 2.0
- Modelo-Basis: gpt-image-2
- Disponibilidade: alle ChatGPT-Benutzer
- Modo Advanced: Bezahlte Abonnenten
- Recursos main: Argumentation, mehrere Ausgaben, mehrsprachiger Text
- Resolução: bis zu 2K
- API: mit variabler Preisgestaltung veröffentlicht
OpenAI hat die Marcus-Tests derzeit nicht öffentlich kommentiert. Das System wird ständig weiterentwickelt und regelmäßig auf Grundlage des Benutzerfeedbacks aktualisiert.

