ChatGPT Images 2.0 пристига с визуална логика и подобрено генериране на текст

Beatriz

em 28 април 2026

Във вторник OpenAI пусна ChatGPT Images 2.0, актуализация на модела за генериране на изображения, интегриран в чатбота. Системата, наречена gpt-image-2, носи подобрения в изобразяването на текст, поддръжка за множество езици и възможност за създаване на по-сложни композиции. Usuários от всички планове на ChatGPT вече имат достъп до стандартната версия.

Стартирането се състоя на 21 април 2026 г. Компанията подчерта включването на режим „мислене“, който позволява на модела да търси в мрежата, да проверява подробности и да генерира до осем изображения от една подкана. Isso улеснява производството на разкадровки, инфографики и материали със структурирано оформление. Разделителната способност достига 2K в някои случаи.

OpenAI подчертава логика и вярност в новите функции

Сега моделът следва инструкциите по-точно и запазва исканите елементи като икони, интерфейси и малък текст. OpenAI цитира примери за научни плакати, карти с рецепти и презентационни слайдове като области на печалба. Поддръжката за текстове на японски, корейски, хинди и бенгалски също е подобрена.

Desenvolvedores получава достъп чрез API, с цени, базирани на качество и резолюция. Платените Usuários имат повече капацитет в разширен режим. Актуализацията идва месеци след предишни подобрения на системата за изображения.

Geração на множество взаимосвързани изображения
Modo мислене с уеб търсене
Melhor изобразяване на текст на множество езици
Suporte в различни пропорции, от 3:1 до 1:3
Resolução до 2K на избрани изходи

https://twitter.com/OpenAI/status/2046670978890276918?ref_src=twsrc%5Etfw

Crítico посочва недостатъци във функционалното разбиране

Gary Marcus, изследовател, известен с това, че поставя под съмнение настоящите възможности на AI, тества новата система с велосипедни диаграми. В автоматичен етикет моделът обърка задната спирачка с тръбата на седалката и предавката със спирачката. Етикет сочеше празно пространство.

При по-труден тест Marcus поиска по-висок от средния тандемен велосипед, с багажник и дисаги. Генерираното изображение показва проблеми като заден дерайльор, вкаран в колелото, лошо позициониран спирачен лост и седловидно задно кормило. Marcus наблюдава, че системата съответства на визуални модели, без да разбира действителната функция на частите.

Especialistas сравнете с човешките ограничения

Marcus разбра, че средният човек също би имал затруднения да начертае точно тандема. Въпреки това, механици, опитни колоездачи или дизайнери биха идентифицирали грешките бързо. Примерът служи за обсъждане на степента, до която моделът разбира физическия свят.

Дебатът се провежда, докато секторът празнува скокове в професионалните изображения. Независим Testes потвърди печалби в четлив текст и плътни оформления, но конкретни случаи все още разкриват пропуски в причинно-следствените разсъждения.

Ficha ChatGPT техника Images 2.0

База Modelo: gpt-image-2
Disponibilidade: всички потребители на ChatGPT
Modo Advanced: Платени абонати
Основен Recursos: разсъждения, множество изходи, многоезичен текст
Resolução: до 2K
API: пуснат с променливо ценообразуване

Към момента OpenAI не е коментирал публично тестването на Marcus. Системата продължава да се развива с редовни актуализации въз основа на отзивите на потребителите.

Imej ChatGPT 2.0 hadir dengan penaakulan visual dan penjanaan teks yang dipertingkatkan »

« ChatGPT Images 2.0 帶來視覺推理和改進的文本生成

Tags: ChatGPT изображения 2.0визуално разсъждение AIГенериране на изображения на OpenAIшаблон gpt-image-2