OpenAI இந்த வியாழன் (5) GPT-5.4 ஐ அறிமுகப்படுத்தியது, இது தொழில்முறை பணியை இலக்காகக் கொண்ட அதன் மிகவும் திறமையான மற்றும் திறமையான எல்லை மாடலாகும். GPT-5.4 சிந்தனை, API மற்றும் கோடெக்ஸ் என ChatGPT இல் கிடைக்கிறது, புதிய அமைப்பு பகுத்தறிவு, குறியீட்டு முறை மற்றும் ஏஜென்டிக் பணிப்பாய்வுகளில் சமீபத்திய முன்னேற்றங்களை ஒருங்கிணைக்கிறது. சிக்கலான பணிகளில் அதிகபட்ச செயல்திறனுக்கான கோரிக்கைகளை புரோ பதிப்பு பூர்த்தி செய்கிறது. இந்த மாதிரியானது தொழில்சார் செயல்பாடுகளை அதிக துல்லியத்துடன் செய்கிறது மற்றும் சரிசெய்தல்களின் தேவை குறைவாக உள்ளது, கார்ப்பரேட் மற்றும் மேம்பாட்டு சூழல்களில் பயனர்களுக்கு பயனளிக்கிறது.
GPT-5.4 ஆனது GPT-5.3-Codex இலிருந்து குறியீட்டு அம்சங்களை ஒருங்கிணைக்கிறது, கருவிகள், மென்பொருள் மற்றும் விரிதாள்கள், விளக்கக்காட்சிகள் மற்றும் ஆவணங்களை உள்ளடக்கிய பணிகளை மேம்படுத்துகிறது. குறைவான தொடர்ச்சியான இடைவினைகளுடன் கோரிக்கைகளுடன் சீரமைக்கப்பட்ட முடிவுகளை இது வழங்குகிறது. ChatGPT இல், GPT-5.4 சிந்தனை முந்தைய சிந்தனைத் திட்டத்தைக் காட்டுகிறது, மேலும் துல்லியமான பதில்களுக்கு நிகழ்நேர மாற்றங்களை அனுமதிக்கிறது. வலைத் தேடல் குறிப்பிட்ட வினவல்களில் ஆழத்தைப் பெற்றுள்ளது மற்றும் நீட்டிக்கப்பட்ட உரையாடல்களில் சூழலைப் பராமரிக்கிறது.
தொழில்முறை வரையறைகளில் செயல்திறன்
GPT-5.4 ஆனது GDPval மதிப்பீடுகளில் நிபுணர்களுக்கு எதிராக 83.0% வெற்றிகள் அல்லது சமநிலைகளை அடைந்தது, இது 44 தொழில்களை உள்ளடக்கியது மற்றும் கணக்கியல் விரிதாள்கள் மற்றும் விளக்கக்காட்சிகள் போன்ற உண்மையான தயாரிப்புகள் தேவைப்படுகிறது. இந்த விகிதம் GPT-5.2 இன் 70.9% ஐ விட அதிகமாக உள்ளது. மெர்கோர் மற்றும் ஹார்வி போன்ற நிறுவனங்களின் நிர்வாகிகள் நீண்ட கால விநியோகம் மற்றும் சிக்கலான சட்டப் பகுப்பாய்வு ஆகியவற்றில் மேன்மையை எடுத்துக்காட்டுகின்றனர்.
இந்த மாதிரியானது விரிதாள் உருவாக்கம் மற்றும் எடிட்டிங் ஆகியவற்றை மேம்படுத்துகிறது, உள் நிதி மாடலிங் சோதனைகளில் சராசரியாக 87.3% மதிப்பெண் பெற்றுள்ளது, அதன் முன்னோடிக்கு 68.4% ஆக இருந்தது. GPT-5.4 ஆல் உருவாக்கப்பட்ட விளக்கக்காட்சிகள் மனித மதிப்பீட்டாளர்களால் 68% வழக்குகளில் சுத்திகரிக்கப்பட்ட அழகியல் மற்றும் படங்களை திறம்பட பயன்படுத்துவதன் காரணமாக விரும்பப்படுகின்றன.
சொந்த கணினி பயன்பாட்டு திறன்கள்
GPT-5.4 கணினி செயல்பாட்டிற்கான சொந்த ஆதரவை அறிமுகப்படுத்துகிறது, இது பல்வேறு பயன்பாடுகளில் சிக்கலான ஓட்டங்களைச் செயல்படுத்த முகவர்களை அனுமதிக்கிறது. நீண்ட எல்லைகளில் திட்டமிடுவதற்கும் சரிபார்ப்பதற்கும் இது 1 மில்லியன் சூழல் டோக்கன்களை ஆதரிக்கிறது. 75.0% வெற்றி விகிதத்துடன் OSWorld-Verified, மற்றும் WebArena-Verified, 67.3%ஐ எட்டுவது போன்ற வரையறைகளில் இந்த மாடல் தனித்து நிற்கிறது.
மேம்படுத்தப்பட்ட காட்சி உணர்தல் உயர் தெளிவுத்திறன் கொண்ட ஆவணங்கள் மற்றும் படங்களின் பகுப்பாய்வுக்கு பங்களிக்கிறது. MMMU-Pro இல், கருவிகள் இல்லாமல் துல்லியம் 81.2% ஐ அடைகிறது. பட உள்ளீட்டு விவரம் 2.56 மில்லியன் பிக்சல்கள் வரை ஆதரிக்கிறது, உள்ளூர்மயமாக்கல் மற்றும் கிளிக் துல்லியத்தை மேம்படுத்துகிறது.
குறியீட்டு முறை மற்றும் செயல்திறனில் முன்னேற்றம்
GPT-5.4 SWE-Bench Pro இல் GPT-5.3-Codex உடன் பொருந்துகிறது அல்லது மிஞ்சுகிறது, பகுத்தறிவு படிகளில் குறைந்த தாமதம் உள்ளது. /கோடெக்ஸில் ஃபாஸ்ட் மோட் டோக்கனைசேஷன் வேகத்தை 1.5 மடங்கு வரை அதிகரிக்கிறது. சிக்கலான முன்-இறுதிப் பணிகள் அதிக அழகியல் மற்றும் செயல்பாட்டு முடிவுகளை உருவாக்குகின்றன.
இன்டராக்டிவ் ப்ளேரைட் எனப்படும் சோதனை திறன் இணையம் மற்றும் எலக்ட்ரான் பயன்பாடுகளின் காட்சி பிழைத்திருத்தத்தை அனுமதிக்கிறது. ப்ளேரைட் மூலம் தானியங்கு சோதனையுடன் எளிய தூண்டுதல்களிலிருந்து உருவாக்கப்பட்ட தீம் பார்க் உருவகப்படுத்துதல்கள் எடுத்துக்காட்டுகளில் அடங்கும்.
கருவிகள் மற்றும் தேடலின் பயன்பாட்டில் மேம்பாடுகள்
API இல் கருவிகளைத் தேடுவது பரந்த சுற்றுச்சூழல் அமைப்புகளில் தேவைப்படும் டோக்கன்களைக் குறைக்கிறது, அட்லஸ் MCP பணிகளில் 47% சேமிக்கிறது. ஏஜென்டிக் கருவி அழைப்பு டூலத்லானில் துல்லியத்தை அதிகரிக்கிறது. 82.7% துல்லியத்துடன் BrowseComp இல் நிலையான இணையத் தேடல் மேம்படுகிறது.
GPT-5.4 சிந்தனையானது நீண்ட வினவல்களில் உங்கள் பகுத்தறிவை விவரிக்கிறது, மறுதொடக்கம் இல்லாமல் இலக்கை அனுமதிக்கிறது. இது நீண்ட ஸ்ட்ரீம்களில் ஒத்திசைவை பராமரிக்கிறது மற்றும் மாயத்தோற்றத்தை குறைக்கிறது, 33% குறைவான தவறான அறிக்கைகள் மற்றும் முழுமையான பதில்களில் 18% குறைவான பிழைகள்.
கிடைக்கும் மற்றும் விலை
ChatGPT மற்றும் Codex இல் வெளியீடு படிப்படியாக நிகழ்கிறது. API இல், GPT-5.4 gpt-5.4 ஆகவும், Pro பதிப்பு gpt-5.4-pro ஆகவும் கிடைக்கிறது. கூடுதலாக, டீம் மற்றும் ப்ரோ பயனர்கள் GPT-5.4 சிந்தனையை அணுகுகின்றனர், GPT-5.2 சிந்தனைக்கு பதிலாக, இது மூன்று மாதங்களுக்கு இருக்கும். Enterprise மற்றும் Edu திட்டங்கள் நிர்வாக அமைப்புகள் வழியாக அணுகலை செயல்படுத்துகின்றன.
விலை மேம்படுத்தப்பட்ட திறன்களை பிரதிபலிக்கிறது, ஆனால் டோக்கன் செயல்திறன் பல பணிகளில் செலுத்துகிறது. பேட்ச் மற்றும் ஃப்ளெக்ஸ் செயலாக்கம் தரத்தில் பாதி செலவாகும், முன்னுரிமை விலையை இரட்டிப்பாக்குகிறது.

