تطلق Google تحديث Gemini مع قفزة في المنطق وإنشاء أنظمة مرئية مستقلة

Gemini

Gemini - Mehaniq/shutterstock.com

أعلن قسم Google DeepMind رسميًا يوم الخميس (19) عن وصول نسخة جديدة لعائلته الرئيسية من نماذج الذكاء الاصطناعي. تم تطوير التحديث، المسمى Gemini 3.1 Pro، مع التركيز بشكل أساسي على توسيع قدرات التفكير المعقدة، مما يعد بالتغلب على قيود الإصدارات السابقة في المهام التي تتطلب تركيب البيانات والمنطق المتقدم.

يتم الإطلاق في لحظة استراتيجية لقطاع التكنولوجيا، حيث يفسح إنشاء النص البسيط المجال أمام الطلب على الوكلاء القادرين على تنفيذ سير العمل الكامل. الأداة الجديدة متاحة الآن في مرحلة المعاينة للمطورين والمشتركين في الخطط المتقدمة، حيث تقدم تحسينات كبيرة في المعالجة متعددة الوسائط التي تتراوح من أكواد البرمجة إلى تفسير الفيديو والصوت.

الذكاء الاصطناعي الجوزاء – جو جاي يونج / Shutterstock.com

ويشير الخبراء إلى أن الاختلاف في هذا الإصدار يكمن في بنيته المحسنة لحل المشكلات الجديدة، والابتعاد عن الاعتماد الحصري على الأنماط المحفوظة أثناء التدريب. تم تصميم هذه التقنية لخدمة المستخدمين النهائيين، من خلال التطبيق الخاص بالشركة، وبيئات الشركات التي تتطلب أتمتة قوية عبر واجهة برمجة التطبيقات (API).

أظهرت اختبارات التحقق الداخلية أن النموذج يمكنه الحفاظ على التماسك في سلاسل التفكير الطويلة، وهي سمة أساسية لتطوير العوامل الوظيفية المستقلة. ويهدف التوفر الفوري إلى تسريع دمج هذه الإمكانات في منتجات الطرف الثالث والأنظمة الأساسية السحابية للشركة.

قفزة الأداء في اختبارات المنطق

يشير المقياس الأكثر أهمية الذي تم تقديمه خلال الإعلان إلى الأداء وفقًا لمعيار ARC-AGI-2، وهو اختبار صارم مصمم لتقييم قدرة الذكاء الاصطناعي على حل الأنماط المنطقية غير المرئية سابقًا. وسجل هاتف Gemini 3.1 Pro نسبة 77.1% في هذا الصدد، وهي نتيجة تمثل أكثر من ضعف الأداء الذي حصل عليه سابقه Gemini 3 Pro الذي حقق 31.1% في نفس التقييم.

بالإضافة إلى التطور في المنطق المجرد، تم إخضاع النموذج لتقييمات مقارنة مباشرة مع التقنيات المتطورة الأخرى المتوفرة في السوق. وفي الاختبار المعروف باسم “الاختبار الأخير للإنسانية”، حقق الإصدار الجديد نسبة 44.4%، متجاوزا الحلول المنافسة التي طورتها شركتا Anthropic وOpenAI، معززا مكانته في السيناريوهات التي تتطلب معرفة تقنية متعمقة.

يسمح هذا الاتساق في التفكير المنطقي بتطبيق الأداة في المواقف التي لا يكفي فيها استرجاع المعلومات البسيطة. ينصب تركيز التحديث على ضمان قدرة النظام على التعامل مع المشكلات متعددة الأوجه دون فقدان السياق أو الاستجابات الهلوسة، مما يرفع مستوى الموثوقية للاستخدام المهني والأكاديمي.

الاستقلالية في الملاحة والوكلاء الظاهريين

تم توسيع القدرة على العمل كوكيل مستقل بشكل كبير في هذا التحديث، مع نتائج مبهرة في المعايير التي تحاكي الأنشطة المهنية الحقيقية. وفي اختبار APEX-Agents، الذي يقيس الكفاءة في المهام طويلة المدى، وصل النموذج إلى علامة 33.5%، مما يشير إلى كفاءة فائقة في إدارة الأهداف التي تتطلب خطوات متعددة لإكمالها.

وكان الأداء المميز الآخر هو الأداء في BrowseComp، وهو تقييم يركز على البحث الوكيل على الإنترنت جنبًا إلى جنب مع استخدام أدوات البرمجة مثل Python. حقق Gemini 3.1 Pro فعالية بنسبة 85.9%، مما يدل على القدرة على البحث بشكل مستقل عن المعلومات ذات الصلة وتصفيتها واستخراجها من الويب، ودمج هذه البيانات مباشرة في سير العمل.

ولتوضيح الإمكانيات المحسنة للنظام الجديد، سلطت الشركة الضوء على ثلاث ركائز أساسية تدعم عمل الوكلاء في هذا الإصدار:

  • القدرة على الحفاظ على التركيز على الأهداف المعقدة خلال عمليات التنفيذ واسعة النطاق، دون الانحراف عن الهدف.
  • التكامل السلس بين بحث الويب وتنفيذ التعليمات البرمجية للتحقق من صحة البيانات في الوقت الحقيقي.
  • تحديد أولويات سير العمل الذي يتطلب الاستخدام المنسق لأدوات رقمية متعددة في وقت واحد.

إنشاء الأنظمة البصرية والترميز

يمتد تنوع النموذج إلى تركيب الأنظمة المرئية المعقدة من أوامر نصية بسيطة. خلال العروض التوضيحية التقنية، تمكن الذكاء الاصطناعي من إنشاء رسوم متحركة بتنسيق SVG قابلة للتطوير وخفيفة الوزن، مما يوفر بديلاً فعالاً لتنسيقات الفيديو التقليدية لواجهات الويب وتطبيقات الهاتف المحمول.

أحد الأمثلة العملية الموضحة يتضمن إعداد لوحة تحكم للقياس عن بعد في الوقت الفعلي. قام النموذج بمعالجة واجهات برمجة التطبيقات العامة والبيانات الأولية لإنشاء واجهة وظيفية من الصفر تصور مدار محطة الفضاء الدولية. تضمنت العملية كل شيء بدءًا من تفسير بيانات الإدخال وحتى ترميز الواجهة الرسومية النهائية.

وفي مجال التفسير الإبداعي، قام النظام بتحويل الأوصاف الأدبية الكلاسيكية إلى منتجات رقمية حديثة. من خلال معالجة مقتطفات من Wuthering Heights، استحوذ الذكاء الاصطناعي على الجو السردي للكتاب وصمم موقعًا إلكترونيًا معاصرًا للمحفظة، حيث قام بترجمة المفاهيم المجردة والفنية إلى تعليمات برمجية قابلة للتنفيذ وتصميم وظيفي.

وأظهرت الأداة أيضًا الكفاءة في إنشاء تجارب تفاعلية ثلاثية الأبعاد. تم تقديم محاكاة حيث استجاب سرب من الطيور الافتراضية ديناميكيًا لتتبع يدي المستخدم، مما يثبت قدرة النموذج على دمج رؤية الكمبيوتر مع منطق الرسوم المتحركة المعقد.

تفاصيل حول وصول الشركات والتكامل

يتبع توزيع Gemini 3.1 Pro نموذجًا متدرجًا، مع إعطاء الأولوية للمطورين وعملاء الشركات في هذه المرحلة. يمكن الوصول إلى الإصدار من خلال منصات مثل AI Studio وVertex AI، مما يسمح للشركات باختبار التكنولوجيا في بيئاتها الخاصة وتكييف منتجاتها لاستخدام محرك الاستدلال الجديد.

بالنسبة للمستخدمين الفرديين، تم منح حق الوصول للمشتركين في خطتي Google AI Pro وUltra، مما أدى إلى زيادة حدود الاستخدام. تم دمج الأداة أيضًا مع NotebookLM، مما يعزز وظائف تركيب المستندات وتوليد الأفكار للمستخدمين الذين يدفعون والذين يستخدمون المنصة لإجراء الأبحاث والدراسات.

تتمثل إحدى النقاط الفنية ذات الصلة في صيانة نافذة سياق المليون رمز مميز، وهي ميزة موروثة من الأجيال السابقة من السلسلة 3. وهذا يضمن استمرار النموذج في القدرة على تحليل كميات كبيرة من البيانات، مثل الكتب بأكملها أو مستودعات الأكواد الشاملة، دون فقدان القدرة على الرجوع إلى معلومات محددة داخل المحتوى المعالج.