Siste Nytt (NO)

ChatGPT Images 2.0 kommer med visuell resonnement og forbedret tekstgenerering

ChatGPT
Foto: ChatGPT - Iryna Imago / Shutterstock.com

Tirsdag ga OpenAI ut ChatGPT Images 2.0, en oppdatering til bildegenereringsmodellen integrert i chatboten. Systemet, kalt gpt-image-2, gir forbedringer i tekstgjengivelse, støtte for flere språk og muligheten til å lage mer komplekse komposisjoner. Usuários av alle ChatGPT-planer har nå tilgang til standardversjonen.

Lanseringen fant sted 21. april 2026. Selskapet fremhevet inkluderingen av en “tenk”-modus som lar modellen søke på nettet, sjekke detaljer og generere opptil åtte bilder fra en enkelt forespørsel. Isso forenkler produksjonen av storyboards, infografikk og materialer med en strukturert layout. Oppløsningen når 2K i noen tilfeller.

OpenAI fremhever resonnement og troskap i nye funksjoner

Modellen følger nå instruksjoner mer nøyaktig og bevarer forespurte elementer som ikoner, grensesnitt og liten tekst. OpenAI nevnte eksempler på vitenskapelige plakater, oppskriftskort og presentasjonslysbilder som gevinstområder. Støtte for japanske, koreanske, hindi og bengalske tekster er også forbedret.

Desenvolvedores får tilgang via API, med priser basert på kvalitet og oppløsning. Betalt Usuários har mer kapasitet i avansert modus. Oppdateringen kommer måneder etter tidligere forbedringer av bildesystemet.

  • Geração av flere sammenhengende bilder
  • Modo-tenkning med nettsøk
  • Melhor tekstgjengivelse på flere språk
  • Suporte i varierende proporsjoner, fra 3:1 til 1:3
  • Resolução opptil 2K på utvalgte utganger

Crítico påpeker feil i funksjonsforståelse

Gary Marcus, en forsker kjent for å stille spørsmål ved nåværende AI-evner, testet det nye systemet med sykkeldiagrammer. I en automatisk etikett forvekslet modellen bakbrems med seterør og gir med brems. En etikett pekte på tom plass.

I en vanskeligere test ba Marcus om en høyere enn gjennomsnittet tandemsykkel, med bagasjebrett og salvesker. Bildet som ble generert presenterte problemer som en bakgir satt inn i hjulet, en dårlig plassert bremsespak og et sadelformet bakstyre. Marcus observerte at systemet samsvarer med visuelle mønstre uten å forstå den faktiske funksjonen til delene.

Especialistas sammenligne med menneskelige begrensninger

Marcus erkjente at det gjennomsnittlige mennesket også ville ha problemer med å tegne tandem nøyaktig. Imidlertid vil mekanikere, erfarne syklister eller designere raskt identifisere feil. Eksemplet tjener til å diskutere i hvilken grad modellen forstår den fysiske verden.

Debatten finner sted mens sektoren feirer sprang i profesjonell bildebehandling. Uavhengige Testes bekreftet gevinster i lesbar tekst og tette layouter, men spesifikke tilfeller avslører fortsatt hull i årsaksgrunnlaget.

Ficha ChatGPT-teknikk Images 2.0

  • Modelo base: gpt-image-2
  • Disponibilidade: alle ChatGPT-brukere
  • Modo Avansert: Betalte abonnenter
  • Recursos main: resonnement, flere utganger, flerspråklig tekst
  • Resolução: opptil 2K
  • API: utgitt med variabel prising

OpenAI har foreløpig ikke kommentert Marcus-testingen offentlig. Systemet fortsetter å utvikle seg, med regelmessige oppdateringer basert på tilbakemeldinger fra brukere.

↓ Continue lendo ↓