Във вторник OpenAI пусна ChatGPT Images 2.0, актуализация на модела за генериране на изображения, интегриран в чатбота. Системата, наречена gpt-image-2, носи подобрения в изобразяването на текст, поддръжка за множество езици и възможност за създаване на по-сложни композиции. Usuários от всички планове на ChatGPT вече имат достъп до стандартната версия.
Стартирането се състоя на 21 април 2026 г. Компанията подчерта включването на режим „мислене“, който позволява на модела да търси в мрежата, да проверява подробности и да генерира до осем изображения от една подкана. Isso улеснява производството на разкадровки, инфографики и материали със структурирано оформление. Разделителната способност достига 2K в някои случаи.
OpenAI подчертава логика и вярност в новите функции
Сега моделът следва инструкциите по-точно и запазва исканите елементи като икони, интерфейси и малък текст. OpenAI цитира примери за научни плакати, карти с рецепти и презентационни слайдове като области на печалба. Поддръжката за текстове на японски, корейски, хинди и бенгалски също е подобрена.
Desenvolvedores получава достъп чрез API, с цени, базирани на качество и резолюция. Платените Usuários имат повече капацитет в разширен режим. Актуализацията идва месеци след предишни подобрения на системата за изображения.
- Geração на множество взаимосвързани изображения
- Modo мислене с уеб търсене
- Melhor изобразяване на текст на множество езици
- Suporte в различни пропорции, от 3:1 до 1:3
- Resolução до 2K на избрани изходи
https://twitter.com/OpenAI/status/2046670978890276918?ref_src=twsrc%5Etfw
Crítico посочва недостатъци във функционалното разбиране
Gary Marcus, изследовател, известен с това, че поставя под съмнение настоящите възможности на AI, тества новата система с велосипедни диаграми. В автоматичен етикет моделът обърка задната спирачка с тръбата на седалката и предавката със спирачката. Етикет сочеше празно пространство.
При по-труден тест Marcus поиска по-висок от средния тандемен велосипед, с багажник и дисаги. Генерираното изображение показва проблеми като заден дерайльор, вкаран в колелото, лошо позициониран спирачен лост и седловидно задно кормило. Marcus наблюдава, че системата съответства на визуални модели, без да разбира действителната функция на частите.
Especialistas сравнете с човешките ограничения
Marcus разбра, че средният човек също би имал затруднения да начертае точно тандема. Въпреки това, механици, опитни колоездачи или дизайнери биха идентифицирали грешките бързо. Примерът служи за обсъждане на степента, до която моделът разбира физическия свят.
Дебатът се провежда, докато секторът празнува скокове в професионалните изображения. Независим Testes потвърди печалби в четлив текст и плътни оформления, но конкретни случаи все още разкриват пропуски в причинно-следствените разсъждения.
Ficha ChatGPT техника Images 2.0
- База Modelo: gpt-image-2
- Disponibilidade: всички потребители на ChatGPT
- Modo Advanced: Платени абонати
- Основен Recursos: разсъждения, множество изходи, многоезичен текст
- Resolução: до 2K
- API: пуснат с променливо ценообразуване
Към момента OpenAI не е коментирал публично тестването на Marcus. Системата продължава да се развива с редовни актуализации въз основа на отзивите на потребителите.

