Nejnovější Zprávy (CS)

ChatGPT Images 2.0 přichází s vizuálním uvažováním a vylepšeným generováním textu

ChatGPT
Foto: ChatGPT - Iryna Imago / Shutterstock.com

V úterý OpenAI vydala ChatGPT Images 2.0, aktualizaci modelu generování obrázků integrovaného do chatbota. Systém s názvem gpt-image-2 přináší vylepšení ve vykreslování textu, podporu více jazyků a možnost vytvářet složitější kompozice. Usuários všech plánů ChatGPT nyní přistupuje ke standardní verzi.

Uvedení na trh proběhlo 21. dubna 2026. Společnost vyzdvihla zahrnutí režimu „myšlení“, který umožňuje modelu prohledávat web, kontrolovat detaily a generovat až osm obrázků z jediné výzvy. Isso usnadňuje výrobu storyboardů, infografiky a materiálů se strukturovaným rozložením. Rozlišení v některých případech dosahuje 2K.

OpenAI zdůrazňuje uvažování a věrnost v nových funkcích

Model se nyní přesněji řídí pokyny a zachovává požadované prvky, jako jsou ikony, rozhraní a malý text. OpenAI uvedla příklady vědeckých plakátů, karet receptů a prezentačních snímků jako oblasti zisku. Zlepšila se také podpora japonských, korejských, hindských a bengálských textů.

Desenvolvedores získat přístup přes API, s cenami založenými na kvalitě a rozlišení. Placené Usuários mají v pokročilém režimu větší kapacitu. Aktualizace přichází měsíce po předchozích vylepšeních zobrazovacího systému.

  • Geração více vzájemně souvisejících obrázků
  • Modo myšlení s vyhledáváním na webu
  • Melhor vykreslování textu ve více jazycích
  • Suporte v různých poměrech, od 3:1 do 1:3
  • Resolução až 2K na vybraných výstupech

Crítico poukazuje na nedostatky ve funkčním porozumění

Gary Marcus, výzkumník známý tím, že zpochybňuje současné schopnosti umělé inteligence, testoval nový systém pomocí diagramů jízdních kol. V automatickém štítku si model spletl zadní brzdu se sedlovou trubkou a převod s brzdou. Štítek ukazoval na prázdné místo.

V náročnějším testu požádal Marcus o vyšší než průměrný tandemový motocykl s nosičem zavazadel a sedlovými brašnami. Vygenerovaný obrázek představoval problémy jako zadní přehazovačka zasunutá do kola, špatně umístěná brzdová páčka a zadní řídítka ve tvaru sedla. Marcus zjistil, že systém odpovídá vizuálním vzorům, aniž by chápal skutečnou funkci dílů.

Especialistas ve srovnání s lidskými omezeními

Marcus rozpoznal, že průměrný člověk by měl také potíže s přesným nakreslením tandemu. Mechanici, zkušení cyklisté nebo konstruktéři by však chyby identifikovali rychle. Příklad slouží k diskusi o tom, do jaké míry model rozumí fyzickému světu.

Debata se odehrává v době, kdy tento sektor slaví skoky v profesionálním zobrazování. Nezávislý Testes potvrdil zisky v čitelném textu a hustém rozložení, ale konkrétní případy stále odhalují mezery v kauzálním uvažování.

Ficha ChatGPT Technika Images 2.0

  • Základna Modelo: gpt-image-2
  • Disponibilidade: všichni uživatelé ChatGPT
  • Modo Advanced: Placení předplatitelé
  • Recursos hlavní: zdůvodnění, více výstupů, vícejazyčný text
  • Resolução: až 2K
  • API: uvolněno s variabilní cenou

OpenAI v tuto chvíli veřejně nekomentovala testování Marcus. Systém se neustále vyvíjí a pravidelně se aktualizuje na základě zpětné vazby od uživatelů.

↓ Continue lendo ↓