OpenAI ilizinduliwa Alhamisi hii (5) GPT-5.4, muundo wake wa mpaka wenye uwezo na ufanisi unaolenga kazi ya kitaaluma. Disponível katika ChatGPT kama GPT-5.4 Thinking, katika API na katika Codex, mfumo mpya unajumuisha maendeleo ya hivi majuzi katika hoja, usimbaji na mtiririko wa kazi wa mawakala. Toleo la Pro linakidhi mahitaji ya utendaji wa juu zaidi katika kazi ngumu. Muundo huu hufanya shughuli za kitaalamu kwa usahihi zaidi na uhitaji mdogo wa marekebisho, kunufaisha watumiaji katika mazingira ya biashara na maendeleo.
GPT-5.4 inachanganya vipengele vya usimbaji kutoka GPT-5.3-Codex na uboreshaji wa zana, programu na kazi zinazohusisha lahajedwali, mawasilisho na hati. Ele hutoa matokeo yaliyosawazishwa na maombi yenye mwingiliano machache unaorudiwa. Katika ChatGPT, GPT-5.4 Thinking huonyesha mpango uliofikiriwa mapema, kuruhusu marekebisho ya wakati halisi kwa majibu sahihi zaidi. Utafutaji wa wavuti umepata kina katika maswali mahususi na hudumisha muktadha katika mazungumzo marefu.
Utendaji katika vigezo vya kitaaluma
GPT-5.4 ilipata ushindi wa 83.0% au sare dhidi ya wataalamu katika tathmini ya GDPval, ambayo inashughulikia kazi 44 na inahitaji bidhaa halisi kama lahajedwali na mawasilisho. Fahirisi ya Esse inapita 70.9% ya GPT-5.2. Executivos kutoka kwa makampuni kama Mercor na Harvey huangazia ubora katika uwasilishaji wa muda mrefu na uchanganuzi changamano wa kisheria.
Muundo huu unaboresha uundaji na uhariri wa lahajedwali, ukiwa na wastani wa alama 87.3% katika majaribio ya uundaji wa fedha wa ndani, ikilinganishwa na 68.4% ya mtangulizi wake. Apresentações iliyotengenezwa na GPT-5.4 ilipendelewa katika 68% ya matukio na wakadiriaji wa kibinadamu kutokana na urembo ulioboreshwa na matumizi bora ya picha.
Uwezo wa asili wa matumizi ya kompyuta
GPT-5.4 inatanguliza usaidizi asilia kwa utendakazi wa kompyuta, ikiruhusu mawakala kutekeleza mtiririko changamano katika programu mbalimbali. Ele inaweza kutumia hadi tokeni milioni 1 za muktadha kwa kupanga na uthibitishaji katika upeo mrefu. Muundo huu ni wa kipekee katika vigezo kama vile OSWorld-Verified, na kiwango cha mafanikio cha 75.0%, na WebArena-Verified, na kufikia 67.3%.
Mtazamo ulioimarishwa wa kuona huchangia uchanganuzi wa hati na picha zenye azimio la juu. Kwenye MMMU-Pro, usahihi hufikia 81.2% bila zana. Maelezo ya ingizo la picha yanaweza kutumia hadi pikseli milioni 2.56, kuboresha ujanibishaji na usahihi wa kubofya.
Maendeleo katika usimbaji na ufanisi
GPT-5.4 inalingana au inapita GPT-5.3-Codex kwenye SWE-Bench Pro, ikiwa na utulivu wa chini katika hatua za hoja. /modi ya haraka katika Codex huongeza kasi ya tokeni kwa hadi mara 1.5. Tarefas miisho ya mbele changamano hutoa matokeo ya umaridadi na utendaji kazi zaidi.
Ujuzi wa majaribio unaoitwa Dramaturgo Interativo huruhusu utatuzi wa kuona wa programu za wavuti na Electron. Exemplos inajumuisha uigaji wa bustani ya mandhari iliyoundwa kutoka kwa vidokezo rahisi, na majaribio ya kiotomatiki kupitia Playwright.
Maboresho katika matumizi ya zana na utafutaji
Kutafuta zana za API hupunguza tokeni zinazohitajika katika mifumo mipana ya ikolojia, hivyo basi kuokoa 47% kwenye majukumu ya Atlas MCP. Upigaji simu wa zana ya mawakala huongeza usahihi katika Toolathlon. Utafutaji wa kudumu wa wavuti huboreshwa kwenye BrowseComp, kwa usahihi wa 82.7%.
GPT-5.4 Thinking inafafanua hoja zake kwa hoja ndefu, ikiruhusu ulengaji bila kuanzisha upya. Ele hudumisha mshikamano katika mitiririko mirefu na hupunguza maono, na 33% ya taarifa za uongo chache na 18% makosa machache katika majibu kamili.
Upatikanaji na bei
Utoaji hutokea hatua kwa hatua kwenye ChatGPT na Codex. Katika API, GPT-5.4 inapatikana kama gpt-5.4 na toleo la Pro kama gpt-5.4-pro. Usuários Plus, Team na Pro wanafikia GPT-5.4 Thinking, kuchukua nafasi ya GPT-5.2 Thinking, ambayo inasalia kwa miezi mitatu. Planos Enterprise na Edu huwezesha ufikiaji kupitia mipangilio ya usimamizi.
Bei inaonyesha uwezo ulioimarishwa, lakini ufanisi wa ishara hulipa katika kazi nyingi. Bechi Processamento na Flex hugharimu nusu ya kiwango, huku kipaumbele kikiongeza bei maradufu.

