OpenAI ஆனது GPT-5.4ஐ தொழில்முறை வேலை மற்றும் தன்னாட்சி முகவர்கள் மீது கவனம் செலுத்துகிறது

OpenAI

OpenAI - Novikov Aleksey/ Shutterstock.com

OpenAI இந்த வியாழன் (5) GPT-5.4 ஐ அறிமுகப்படுத்தியது, இது தொழில்முறை பணியை இலக்காகக் கொண்ட அதன் மிகவும் திறமையான மற்றும் திறமையான எல்லை மாடலாகும். GPT-5.4 சிந்தனை, API மற்றும் கோடெக்ஸ் என ChatGPT இல் கிடைக்கிறது, புதிய அமைப்பு பகுத்தறிவு, குறியீட்டு முறை மற்றும் ஏஜென்டிக் பணிப்பாய்வுகளில் சமீபத்திய முன்னேற்றங்களை ஒருங்கிணைக்கிறது. சிக்கலான பணிகளில் அதிகபட்ச செயல்திறனுக்கான கோரிக்கைகளை புரோ பதிப்பு பூர்த்தி செய்கிறது. இந்த மாதிரியானது தொழில்சார் செயல்பாடுகளை அதிக துல்லியத்துடன் செய்கிறது மற்றும் சரிசெய்தல்களின் தேவை குறைவாக உள்ளது, கார்ப்பரேட் மற்றும் மேம்பாட்டு சூழல்களில் பயனர்களுக்கு பயனளிக்கிறது.

GPT-5.4 ஆனது GPT-5.3-Codex இலிருந்து குறியீட்டு அம்சங்களை ஒருங்கிணைக்கிறது, கருவிகள், மென்பொருள் மற்றும் விரிதாள்கள், விளக்கக்காட்சிகள் மற்றும் ஆவணங்களை உள்ளடக்கிய பணிகளை மேம்படுத்துகிறது. குறைவான தொடர்ச்சியான இடைவினைகளுடன் கோரிக்கைகளுடன் சீரமைக்கப்பட்ட முடிவுகளை இது வழங்குகிறது. ChatGPT இல், GPT-5.4 சிந்தனை முந்தைய சிந்தனைத் திட்டத்தைக் காட்டுகிறது, மேலும் துல்லியமான பதில்களுக்கு நிகழ்நேர மாற்றங்களை அனுமதிக்கிறது. வலைத் தேடல் குறிப்பிட்ட வினவல்களில் ஆழத்தைப் பெற்றுள்ளது மற்றும் நீட்டிக்கப்பட்ட உரையாடல்களில் சூழலைப் பராமரிக்கிறது.

தொழில்முறை வரையறைகளில் செயல்திறன்

GPT-5.4 ஆனது GDPval மதிப்பீடுகளில் நிபுணர்களுக்கு எதிராக 83.0% வெற்றிகள் அல்லது சமநிலைகளை அடைந்தது, இது 44 தொழில்களை உள்ளடக்கியது மற்றும் கணக்கியல் விரிதாள்கள் மற்றும் விளக்கக்காட்சிகள் போன்ற உண்மையான தயாரிப்புகள் தேவைப்படுகிறது. இந்த விகிதம் GPT-5.2 இன் 70.9% ஐ விட அதிகமாக உள்ளது. மெர்கோர் மற்றும் ஹார்வி போன்ற நிறுவனங்களின் நிர்வாகிகள் நீண்ட கால விநியோகம் மற்றும் சிக்கலான சட்டப் பகுப்பாய்வு ஆகியவற்றில் மேன்மையை எடுத்துக்காட்டுகின்றனர்.

இந்த மாதிரியானது விரிதாள் உருவாக்கம் மற்றும் எடிட்டிங் ஆகியவற்றை மேம்படுத்துகிறது, உள் நிதி மாடலிங் சோதனைகளில் சராசரியாக 87.3% மதிப்பெண் பெற்றுள்ளது, அதன் முன்னோடிக்கு 68.4% ஆக இருந்தது. GPT-5.4 ஆல் உருவாக்கப்பட்ட விளக்கக்காட்சிகள் மனித மதிப்பீட்டாளர்களால் 68% வழக்குகளில் சுத்திகரிக்கப்பட்ட அழகியல் மற்றும் படங்களை திறம்பட பயன்படுத்துவதன் காரணமாக விரும்பப்படுகின்றன.

சொந்த கணினி பயன்பாட்டு திறன்கள்

GPT-5.4 கணினி செயல்பாட்டிற்கான சொந்த ஆதரவை அறிமுகப்படுத்துகிறது, இது பல்வேறு பயன்பாடுகளில் சிக்கலான ஓட்டங்களைச் செயல்படுத்த முகவர்களை அனுமதிக்கிறது. நீண்ட எல்லைகளில் திட்டமிடுவதற்கும் சரிபார்ப்பதற்கும் இது 1 மில்லியன் சூழல் டோக்கன்களை ஆதரிக்கிறது. 75.0% வெற்றி விகிதத்துடன் OSWorld-Verified, மற்றும் WebArena-Verified, 67.3%ஐ எட்டுவது போன்ற வரையறைகளில் இந்த மாடல் தனித்து நிற்கிறது.

மேம்படுத்தப்பட்ட காட்சி உணர்தல் உயர் தெளிவுத்திறன் கொண்ட ஆவணங்கள் மற்றும் படங்களின் பகுப்பாய்வுக்கு பங்களிக்கிறது. MMMU-Pro இல், கருவிகள் இல்லாமல் துல்லியம் 81.2% ஐ அடைகிறது. பட உள்ளீட்டு விவரம் 2.56 மில்லியன் பிக்சல்கள் வரை ஆதரிக்கிறது, உள்ளூர்மயமாக்கல் மற்றும் கிளிக் துல்லியத்தை மேம்படுத்துகிறது.

குறியீட்டு முறை மற்றும் செயல்திறனில் முன்னேற்றம்

GPT-5.4 SWE-Bench Pro இல் GPT-5.3-Codex உடன் பொருந்துகிறது அல்லது மிஞ்சுகிறது, பகுத்தறிவு படிகளில் குறைந்த தாமதம் உள்ளது. /கோடெக்ஸில் ஃபாஸ்ட் மோட் டோக்கனைசேஷன் வேகத்தை 1.5 மடங்கு வரை அதிகரிக்கிறது. சிக்கலான முன்-இறுதிப் பணிகள் அதிக அழகியல் மற்றும் செயல்பாட்டு முடிவுகளை உருவாக்குகின்றன.

இன்டராக்டிவ் ப்ளேரைட் எனப்படும் சோதனை திறன் இணையம் மற்றும் எலக்ட்ரான் பயன்பாடுகளின் காட்சி பிழைத்திருத்தத்தை அனுமதிக்கிறது. ப்ளேரைட் மூலம் தானியங்கு சோதனையுடன் எளிய தூண்டுதல்களிலிருந்து உருவாக்கப்பட்ட தீம் பார்க் உருவகப்படுத்துதல்கள் எடுத்துக்காட்டுகளில் அடங்கும்.

கருவிகள் மற்றும் தேடலின் பயன்பாட்டில் மேம்பாடுகள்

API இல் கருவிகளைத் தேடுவது பரந்த சுற்றுச்சூழல் அமைப்புகளில் தேவைப்படும் டோக்கன்களைக் குறைக்கிறது, அட்லஸ் MCP பணிகளில் 47% சேமிக்கிறது. ஏஜென்டிக் கருவி அழைப்பு டூலத்லானில் துல்லியத்தை அதிகரிக்கிறது. 82.7% துல்லியத்துடன் BrowseComp இல் நிலையான இணையத் தேடல் மேம்படுகிறது.

GPT-5.4 சிந்தனையானது நீண்ட வினவல்களில் உங்கள் பகுத்தறிவை விவரிக்கிறது, மறுதொடக்கம் இல்லாமல் இலக்கை அனுமதிக்கிறது. இது நீண்ட ஸ்ட்ரீம்களில் ஒத்திசைவை பராமரிக்கிறது மற்றும் மாயத்தோற்றத்தை குறைக்கிறது, 33% குறைவான தவறான அறிக்கைகள் மற்றும் முழுமையான பதில்களில் 18% குறைவான பிழைகள்.

கிடைக்கும் மற்றும் விலை

ChatGPT மற்றும் Codex இல் வெளியீடு படிப்படியாக நிகழ்கிறது. API இல், GPT-5.4 gpt-5.4 ஆகவும், Pro பதிப்பு gpt-5.4-pro ஆகவும் கிடைக்கிறது. கூடுதலாக, டீம் மற்றும் ப்ரோ பயனர்கள் GPT-5.4 சிந்தனையை அணுகுகின்றனர், GPT-5.2 சிந்தனைக்கு பதிலாக, இது மூன்று மாதங்களுக்கு இருக்கும். Enterprise மற்றும் Edu திட்டங்கள் நிர்வாக அமைப்புகள் வழியாக அணுகலை செயல்படுத்துகின்றன.

விலை மேம்படுத்தப்பட்ட திறன்களை பிரதிபலிக்கிறது, ஆனால் டோக்கன் செயல்திறன் பல பணிகளில் செலுத்துகிறது. பேட்ச் மற்றும் ஃப்ளெக்ஸ் செயலாக்கம் தரத்தில் பாதி செலவாகும், முன்னுரிமை விலையை இரட்டிப்பாக்குகிறது.