News (DA)

OpenAI lancerer o3- og o4-mini-modeller med avanceret billedbegrundelse og værktøjer

OpenAI
Foto: OpenAI - Novikov Aleksey/ Shutterstock.com

OpenAI lancerer o3 og o4-mini modeller med fremskridt inden for visuel ræsonnement og brug af integrerede værktøjer. Virksomheden annoncerede i onsdags lanceringen af ​​de nye modeller i o-serien, som repræsenterer et betydeligt fremskridt inden for behandlingsmuligheder. O3 skiller sig ud som den mest kraftfulde i serien til dato, mens o4-mini tilbyder optimeret ydeevne til lavere omkostninger og større hastighed. Esses-modeller blev trænet til at tænke længere, før de reagerede, og inkorporerede kæderæsonering med understøttelse af flere modaliteter.

Modeller tillader direkte integration af billeder i ræsonnementsprocessen. Usuários kan uploade diagrammer, skitser eller whiteboards i lav kvalitet til analyse og manipulation. Essa-funktionalitet udvider applikationer til tekniske og kreative områder.

Nøgleegenskaber ved de nye modeller

OpenAI o3 fører i ydeevne på tværs af benchmarks for kodning, matematik, videnskab og visuel perception. Ele overgår tidligere versioner i opgaver, der kræver udvidet tænkning og brug af native værktøjer. Modellen kombinerer websøgning, kodeeksekvering i Python, filanalyse og billedgenerering i enkeltstrømme.

O4-mini er designet til effektivitet. Ele opretholder et højt niveau af nøjagtighed i lignende opgaver, men med reduceret latenstid og lavere omkostninger. Essa-versionen tjener brugere, der har brug for hurtige svar uden at gå på kompromis med væsentlig kvalitet.

Begge modeller understøtter komplette værktøjer. Incluem webnavigation, filanalyse, automatiseringer og kontekstuel hukommelse for mere ensartede interaktioner.

Tilgængelighed og indledende adgang

ChatGPT Plus, Pro og Team fik øjeblikkelig adgang til modellerne i indstillingsvælgeren. O3 fremstår som hovedvalget til komplekse opgaver, mens o4-mini og højtydende varianter erstatter tidligere muligheder. API-udgivelsen sker gradvist for udviklere.

Gratis brugere kan snart opleve begrænsede muligheder. Virksomheden prioriterer kontrolleret udrulning for at sikre stabilitet og indsamle feedback.

Fremskridt i ræsonnement med billeder

OpenAI fremhæver evnen til at “tænke med billeder” som en differentiator. Modeller beskriver ikke kun visuelt indhold, men integrerer billedinformation direkte i problemløsningslogik. Isso giver dig mulighed for at manipulere, beskære eller transformere visuelle elementer under behandlingen.

Eksempler omfatter analyse af tekniske diagrammer eller manuelle skitser. Systemet identificerer rumlige relationer og anvender trin-for-trin-ræsonnementer for at nå præcise konklusioner.

Denne innovation åbner muligheder for anvendelser inden for teknik, uddannelse og videnskabelig forskning. Profissionais kan indsende rutediagrammer eller noter for detaljerede forklaringer eller rettelser.

Ydelse i benchmarks og sammenligninger

o3 sætter nye rekorder i uafhængig kodning og avancerede matematikvurderinger. Ele demonstrerer overlegenhed i problemer, der kræver flere logiske trin og intern verifikation. Resultados viser betydelige gevinster i forhold til sin forgænger o1 i standardiserede metrikker.

O4-mini balancerer ydeevne og effektivitet. Ele opnår score tæt på o3 i udvalgte opgaver, men med meget lavere ressourceforbrug. Essa-optimering gør det nemmere at bruge i stor skala for virksomheder og individuelle udviklere.

Sikkerhedsvurderinger indikerer, at begge modeller opretholder modstandsdygtighed over for forsøg på at omgå restriktioner. Eles afviser konsekvent skadeligt indhold.

Integration med værktøjer og økosystem

Modeller inkorporerer native værktøjer i ræsonnement. Isso inkluderer Python kodeudførelse til komplekse beregninger og websøgning efter opdaterede data. Kombinationen giver dig mulighed for at løse reelle problemer, der kræver flere kilder og verifikationer.

Værktøjer som filanalyse og billedgenerering udvider anvendeligheden. Usuários skaber komplette flows i en enkelt interaktion, fra søgning til visning af resultater.

Virksomheden har udgivet supplerende værktøjer til programmører. Elas letter integration i udviklingsmiljøer og fremskynder arbejdsgange.

Sikkerhedsforanstaltninger og vurderinger

OpenAI anvendte opdateret beredskabsramme til at vurdere risici. Modellerne opfyldte ikke høje tærskler i kritiske kategorier såsom biologiske kapaciteter, cybersikkerhed eller selvforbedring. Uafhængig gennemgang bekræftede korrekt tilpasning.

Foranstaltninger omfatter strenge tests for at afvise skadeligt indhold og modstand mod jailbreaks. Virksomheden overvåger fortsat produktionsanvendelsen for nødvendige justeringer.