OpenAI ने गुरुवारी (5) GPT-5.4 लाँच केले, हे त्याचे सर्वात सक्षम आणि कार्यक्षम फ्रंटियर मॉडेल व्यावसायिक कामासाठी आहे. ChatGPT वर GPT-5.4 थिंकिंग, API आणि कोडेक्स म्हणून उपलब्ध, नवीन प्रणाली तर्क, कोडिंग आणि एजंटिक वर्कफ्लोमध्ये अलीकडील प्रगती एकत्रित करते. प्रो आवृत्ती जटिल कार्यांमध्ये जास्तीत जास्त कामगिरीसाठी मागणी पूर्ण करते. मॉडेल व्यावसायिक क्रियाकलाप अधिक अचूकतेसह आणि समायोजनाची कमी गरजेसह करते, ज्यामुळे कॉर्पोरेट आणि विकास वातावरणातील वापरकर्त्यांना फायदा होतो.
GPT-5.4 GPT-5.3-Codex मधील कोडींग वैशिष्ट्ये साधने, सॉफ्टवेअर आणि स्प्रेडशीट, सादरीकरणे आणि दस्तऐवजांचा समावेश असलेल्या कार्यांमधील सुधारणांसह एकत्रित करते. हे कमी पुनरावृत्ती परस्परसंवादांसह विनंत्यांशी संरेखित परिणाम वितरीत करते. ChatGPT मध्ये, GPT-5.4 थिंकिंग मागील विचार योजना प्रदर्शित करते, अधिक अचूक प्रतिसादांसाठी रिअल-टाइम ऍडजस्टमेंटला अनुमती देते. वेब शोधाने विशिष्ट प्रश्नांमध्ये सखोलता प्राप्त केली आहे आणि विस्तारित संवादांमध्ये संदर्भ राखले आहे.
व्यावसायिक बेंचमार्कमध्ये कामगिरी
GPT-5.4 ने GDPval मुल्यांकनामध्ये व्यावसायिकांविरुद्ध 83.0% विजय किंवा ड्रॉ मिळवले, ज्यामध्ये 44 व्यवसायांचा समावेश आहे आणि लेखा स्प्रेडशीट आणि सादरीकरणे यासारख्या वास्तविक उत्पादनांची आवश्यकता आहे. हा दर GPT-5.2 च्या 70.9% पेक्षा जास्त आहे. Mercor आणि Harvey सारख्या कंपन्यांमधील अधिकारी दीर्घकालीन वितरण आणि जटिल कायदेशीर विश्लेषणामध्ये श्रेष्ठता दर्शवतात.
मॉडेल स्प्रेडशीट निर्मिती आणि संपादन सुधारते, अंतर्गत आर्थिक मॉडेलिंग चाचण्यांमध्ये सरासरी 87.3% गुणांसह, त्याच्या आधीच्या 68.4% च्या तुलनेत. परिष्कृत सौंदर्यशास्त्र आणि प्रतिमांच्या प्रभावी वापरामुळे मानवी मूल्यांकनकर्त्यांनी 68% प्रकरणांमध्ये GPT-5.4 द्वारे व्युत्पन्न केलेल्या सादरीकरणांना प्राधान्य दिले गेले.
मूळ संगणक वापर क्षमता
GPT-5.4 संगणक ऑपरेशनसाठी नेटिव्ह सपोर्ट सादर करते, जे एजंटना विविध ऍप्लिकेशन्समध्ये जटिल प्रवाह कार्यान्वित करण्यास अनुमती देते. हे दीर्घ क्षितिजांवर नियोजन आणि पडताळणीसाठी 1 दशलक्ष संदर्भ टोकनचे समर्थन करते. हे मॉडेल OSWorld-Verified सारख्या बेंचमार्कमध्ये 75.0% आणि WebArena-सत्यापित, 67.3% पर्यंत पोहोचले आहे.
वर्धित व्हिज्युअल धारणा उच्च-रिझोल्यूशन दस्तऐवज आणि प्रतिमांचे विश्लेषण करण्यासाठी योगदान देते. MMMU-Pro वर, टूल्सशिवाय अचूकता 81.2% पर्यंत पोहोचते. प्रतिमा इनपुट तपशील 2.56 दशलक्ष पिक्सेल पर्यंत समर्थन करते, स्थानिकीकरण आणि क्लिक अचूकता सुधारते.
कोडिंग आणि कार्यक्षमतेत प्रगती
SWE-Bench Pro मध्ये GPT-5.4 जुळते किंवा GPT-5.3-कोडेक्सला मागे टाकते, तर्क चरणांमध्ये कमी विलंबासह. कोडेक्समधील /फास्ट मोड टोकनायझेशनचा वेग 1.5 पटीने वाढवतो. जटिल फ्रंट-एंड कार्ये अधिक सौंदर्यात्मक आणि कार्यात्मक परिणाम निर्माण करतात.
इंटरएक्टिव्ह प्लेराईट नावाचे प्रायोगिक कौशल्य वेब आणि इलेक्ट्रॉन ऍप्लिकेशन्सच्या व्हिज्युअल डीबगिंगला अनुमती देते. उदाहरणांमध्ये प्लेराइट द्वारे स्वयंचलित चाचणीसह, साध्या प्रॉम्प्टमधून तयार केलेली थीम पार्क सिम्युलेशन समाविष्ट आहे.
साधने आणि शोध वापरात सुधारणा
API मधील टूल्स शोधल्याने व्यापक इकोसिस्टममध्ये आवश्यक टोकन्स कमी होतात, Atlas MCP कार्यांवर 47% बचत होते. एजंटिक टूल कॉलिंग टूलथलॉनमध्ये अचूकता वाढवते. 82.7% अचूकतेसह, ब्राउझकॉम्पवर सतत वेब शोध सुधारतो.
GPT-5.4 थिंकिंग रीस्टार्ट न करता लक्ष्यीकरणास अनुमती देऊन, लांब प्रश्नांमध्ये तुमच्या तर्काचे वर्णन करते. हे लांब प्रवाहांमध्ये सुसंगतता राखते आणि 33% कमी चुकीची विधाने आणि पूर्ण प्रतिसादांमध्ये 18% कमी त्रुटींसह भ्रम कमी करते.
उपलब्धता आणि किंमत
ChatGPT आणि Codex वर हळूहळू रोलआउट होते. API मध्ये, GPT-5.4 gpt-5.4 आणि प्रो आवृत्ती gpt-5.4-pro म्हणून उपलब्ध आहे. तसेच, टीम आणि प्रो वापरकर्ते GPT-5.4 थिंकिंगमध्ये प्रवेश करतात, GPT-5.2 थिंकिंगच्या जागी, जे तीन महिन्यांसाठी राहते. Enterprise आणि Edu योजना प्रशासकीय सेटिंग्जद्वारे प्रवेश सक्षम करतात.
किंमत वर्धित क्षमता प्रतिबिंबित करते, परंतु टोकन कार्यक्षमता बऱ्याच कार्यांमध्ये पैसे देते. बॅच आणि फ्लेक्स प्रक्रियेची किंमत मानकापेक्षा अर्धी आहे, तर प्राधान्य किंमत दुप्पट करते.

