Legfrissebb Hírek (HU)

A ChatGPT Images 2.0 vizuális érveléssel és továbbfejlesztett szöveggenerálással érkezik

ChatGPT
Foto: ChatGPT - Iryna Imago / Shutterstock.com

Kedden az OpenAI kiadta a ChatGPT Images 2.0-t, a chatbotba integrált képgeneráló modell frissítését. A gpt-image-2 nevű rendszer továbbfejleszti a szöveg megjelenítését, több nyelv támogatását és összetettebb kompozíciók létrehozásának lehetőségét. Az összes ChatGPT-csomag Usuários mostantól hozzáfér a szabványos verzióhoz.

A bevezetésre 2026. április 21-én került sor. A vállalat kiemelte a „gondolkodó” mód beépítését, amely lehetővé teszi a modell számára, hogy keressen az interneten, ellenőrizze a részleteket, és egyetlen promptból akár nyolc képet is generáljon. Az Isso megkönnyíti a storyboardok, infografikák és anyagok készítését strukturált elrendezéssel. A felbontás egyes esetekben eléri a 2K-t.

Az OpenAI kiemeli az érvelést és a hűséget az új funkciókban

A modell mostantól pontosabban követi az utasításokat, és megőrzi a kért elemeket, például az ikonokat, felületeket és kis szövegeket. Az OpenAI a tudományos poszterekre, receptkártyákra és prezentációs diákra hivatkozott, mint hasznos területeket. A japán, koreai, hindi és bengáli szövegek támogatása is javult.

Az Desenvolvedores API-n keresztül fér hozzá, az árak minőségen és felbontáson alapulnak. A fizetős Usuários több kapacitással rendelkezik speciális módban. A frissítés hónapokkal a képalkotó rendszer korábbi fejlesztései után érkezik.

  • Több egymással összefüggő kép Geração
  • Modo gondolkodás webes kereséssel
  • Melhor szövegmegjelenítés több nyelven
  • Suporte változó arányban, 3:1 és 1:3 között
  • Resolução 2K-ig a kiválasztott kimeneteken

Az Crítico rámutat a funkcionális megértés hibáira

Gary Marcus, a jelenlegi AI-képességek megkérdőjelezéséről ismert kutató kerékpáros diagramokkal tesztelte az új rendszert. Az automatikus címkén a modell összekeverte a hátsó féket az üléscsővel és a sebességváltót a fékkel. Egy címke üres helyre mutatott.

Egy nehezebb teszten az Marcus egy átlagosnál magasabb tandem kerékpárt kért, csomagtartóval és nyeregtáskákkal. A keletkezett kép olyan problémákat mutatott fel, mint a kerékbe illesztett hátsó váltó, a rosszul elhelyezett fékkar és a nyereg alakú hátsó kormány. Az Marcus megfigyelte, hogy a rendszer a vizuális mintákhoz illeszkedik anélkül, hogy megértené az alkatrészek tényleges funkcióját.

Az Especialistas összehasonlítható az emberi korlátokkal

Az Marcus felismerte, hogy az átlagembernek is nehézségei támadnának pontosan megrajzolni a tandemet. A szerelők, tapasztalt kerékpárosok vagy tervezők azonban gyorsan felismerik a hibákat. A példa arra szolgál, hogy megvitassuk, milyen mértékben érti a modell a fizikai világot.

A vita akkor zajlik, amikor az ágazat a professzionális képalkotás terén elért ugrásokat ünnepli. A független Testes megerősítette, hogy javult az olvasható szöveg és a sűrű elrendezés, de bizonyos esetekben még mindig hiányosságok mutatkoznak az ok-okozati összefüggésekben.

Ficha ChatGPT technika Images 2.0

  • Modelo alap: gpt-image-2
  • Disponibilidade: minden ChatGPT-felhasználó
  • Modo Haladó: Fizetett előfizetők
  • Recursos fő: érvelés, több kimenet, többnyelvű szöveg
  • Resolução: akár 2K
  • API: változó árazású kiadás

Az OpenAI jelenleg nem kommentálta nyilvánosan az Marcus tesztelését. A rendszer folyamatosan fejlődik, a felhasználói visszajelzések alapján rendszeres frissítésekkel.

↓ Continue lendo ↓