تقدم Google برنامج Gemini 3 بواجهة مرئية ديناميكية وتفكير متقدم لعمليات البحث المعقدة
أطلق قسم DeepMind في Google رسميًا برنامج Gemini 3، مما عزز التقدم الكبير في مجال الذكاء الاصطناعي التوليدي من خلال تقديم إمكانات تتجاوز التوليد البسيط للنص والتعليمات البرمجية. تم تصميم النموذج الجديد ليكون بمثابة واجهة رقمية كاملة، مما يسمح للمطورين والمستخدمين النهائيين بالتفاعل مع المعلومات من خلال تخطيطات ديناميكية يتم إنشاؤها في الوقت الفعلي. يمثل هذا التحديث تحولًا استراتيجيًا في كيفية قيام عملاق التكنولوجيا ببناء خدماته، ودمج قدرات التفكير المنطقي المعقدة مع البنية التحتية للبحث لتقديم إجابات منظمة بصريًا وقابلة للاستخدام على الفور.
أهم ما يميز هذا الإصدار هو الوظيفة التي تسمى “التخطيط المرئي”، والتي تسمح للنظام بمحاكاة هياكل مواقع الويب الاحترافية على الفور. عند معالجة الطلب، لا يقوم الذكاء الاصطناعي باسترداد البيانات فحسب، بل ينظم النصوص والصور ومقاطع الفيديو في عرض تقديمي متماسك، مما يزيل تجزئة المعلومات ويقدم نتيجة تشبه تطبيقًا مخصصًا.
ومن بين الابتكارات التقنية المطبقة في هذه البنية الجديدة، تبرز الميزات التي تعد بإعادة تعريف الإنتاجية الرقمية:
– إنشاء واجهات تفاعلية من أوامر نصية بسيطة؛
– التكامل العميق مع محرك البحث للتحقق من صحة البيانات في الوقت الحقيقي؛
– المعالجة الأصلية لطرائق متعددة، بما في ذلك الصوت والفيديو عالي الوضوح.
واجهة مضادة للجاذبية وبيئة العمل
لدعم القدرات الجديدة للنموذج، تم تقديم “Google Antigravity”، وهي بيئة عمل مرنة تبتعد عن أنماط تصميم البرامج التقليدية. تعمل هذه الواجهة الجديدة مثل لوحة قماشية لا نهائية حيث يمكن التعامل مع العناصر الناتجة عن الذكاء الاصطناعي بحرية، مما يسمح للمستخدم بتنظيم تدفق الأفكار والاستجابات البصرية بطريقة غير خطية. يتمثل الاقتراح في تحويل التفاعل السلبي مع chatbot إلى تجربة بناء نشطة، حيث تتعايش الرسومات والأكواد والنصوص ويمكن إعادة تنظيمها وفقًا لاحتياجات المشروع، مما يسهل تصور الروابط المعقدة بين الموضوعات المختلفة.
التقدم للمطورين والبرمجة
وفي قطاع تطوير البرمجيات، يُظهر Gemini 3 تطوراً ملحوظاً في فهم وإنشاء رموز معقدة، مع التركيز بشكل خاص على إنشاء عناصر مرئية عبر البرمجة. يُظهر النموذج كفاءة محسنة في كتابة ملفات SVG والبرامج النصية الوظيفية، والتغلب على قيود الإصدارات السابقة في اختبارات الأداء الموحدة. تتيح هذه الإمكانية للمبرمجين عرض نتائج الأكواد الخاصة بهم على الفور داخل الواجهة نفسها، مما يؤدي إلى تسريع عملية تصحيح أخطاء التطبيق والنماذج الأولية.
تم تحسين الأداة لتحديد الأخطاء المنطقية والنحوية بدقة أكبر، وتقديم تصحيحات سياقية تأخذ في الاعتبار الهدف النهائي للمشروع. من خلال تقليل الوقت الذي يقضيه في المهام المتكررة والبحث عن عيوب التعليمات البرمجية، تهدف التكنولوجيا إلى تحرير المهنيين للتركيز على هندسة الأنظمة والابتكار، باستخدام الذكاء الاصطناعي كزوج تعاوني يفهم الفروق الدقيقة في لغات البرمجة الحديثة.
تكامل محرك البحث
يصل التوحيد بين نموذج اللغة ومحرك بحث Google إلى مستوى جديد مع هذا التحديث، مما يسمح باعتماد الإجابات على البيانات المحدثة في الوقت الفعلي. على عكس النماذج التي تعتمد فقط على قاعدة بيانات مدربة مسبقًا، يقوم النظام الآن بالاستعلام بشكل نشط على الويب أثناء عملية إنشاء الاستجابة.
تم تحسين وضع الاستدلال المنطقي للتعامل مع الموضوعات المثيرة للجدل أو التي تتطلب التحقق الدقيق من الحقائق قبل تقديم الاستنتاج. يستخدم النظام الرسوم البيانية الديناميكية والجداول المقارنة التي يتم إنشاؤها في وقت الاستشارة لتوضيح المعلومات، مما يجعل استيعاب المحتوى أسرع وأكثر كفاءة.
ويهدف هذا النهج إلى التخفيف من انتشار المعلومات القديمة، مما يضمن وصول المستخدم إلى أحدث سياق متاح على الإنترنت، والذي تتم معالجته وتلخيصه بواسطة الذكاء الاصطناعي.
توسيع قدرات الوسائط المتعددة
تم تصميم بنية Gemini 3 لتكون متعددة الوسائط، مما يعني أنها لا تحتاج إلى مكونات إضافية أو برامج إضافية لفهم تنسيقات الوسائط المختلفة. يمكن للنظام تحليل مقاطع الفيديو والصور والصوت بنفس السلاسة التي يعالج بها النصوص، مما يسمح بتفاعل أكثر ثراءً وتنوعًا.
ويمكن للمستخدمين، على سبيل المثال، تحميل مقطع فيديو لمحاضرة وطلب ملخص تفصيلي للنقاط الرئيسية، أو مطالبة الذكاء الاصطناعي بتحديد كائنات معينة داخل صورة معقدة. تعد هذه المرونة أمرًا بالغ الأهمية للمحترفين الذين يتعاملون مع كميات كبيرة من البيانات غير المنظمة.
إن القدرة على ربط المعلومات المرئية بالبيانات النصية تفتح إمكانيات جديدة للتعليم والبحث، حيث يعتمد السياق غالبًا على التحليل المشترك لمصادر مختلفة.
علاوة على ذلك، تم تحسين إنشاء محتوى الوسائط المتعددة، مما يسمح للنموذج بإنشاء تمثيلات مرئية تكمل التفسيرات النصية، مما يثري تجربة التعلم والاستشارة.
تجربة المستخدم على الأجهزة المحمولة
كما تلقى تطبيق جوجل الرسمي أيضًا تحديثات مهمة لاستيعاب الوظائف الجديدة، مع واجهة مُعاد تصميمها لتسهيل إدارة المهام على الشاشات الأصغر حجمًا. يتيح إدخال قسم “أشيائي” للمستخدمين حفظ وتنظيم تفاعلاتهم وتقاريرهم وإبداعاتهم المرئية بشكل حدسي، مما يضمن إمكانية استمرار العمل الذي بدأ على سطح المكتب على الهاتف المحمول دون أي احتكاك.
لقد تم تبسيط التنقل لإعطاء الأولوية للسرعة، مما يسمح بتنفيذ المهام المعقدة ببضع نقرات فقط. إن تكييف النموذج للأجهزة المحمولة يأخذ في الاعتبار قيود المعالجة المحلية، وذلك باستخدام السحابة لتوفير الطاقة الكاملة لجهاز Gemini 3 دون المساس ببطارية الجهاز أو أدائه.
التفكير العميق وطريقة التفكير
بالنسبة للطلبات التي تتطلب مستوى أعلى من التحليل، أتاحت Google إمكانية الوصول إلى ميزة “التفكير” لمشتركي الخطط المتقدمة. تعمل هذه الوظيفة على تنشيط طبقة إضافية من المعالجة حيث يخصص النموذج مزيدًا من الوقت “للتفكير” في السؤال قبل الإجابة، ومحاكاة سلسلة فكرية بشرية لحل مشكلات المنطق والرياضيات والاستراتيجية التي قد تربك الأنظمة الأبسط.
ومن خلال تقسيم المشكلات المعقدة إلى خطوات أصغر والتحقق من اتساق كل خطوة، يصبح النموذج قادرًا على تقديم حلول أكثر قوة وأقل عرضة للهلوسة. يستهدف هذا المورد بشكل خاص العلماء والأكاديميين ومحللي البيانات الذين يحتاجون إلى مساعد افتراضي قادر على متابعة التفكير الاستنتاجي الشامل والتحقق من صحة الفرضيات بناءً على كميات كبيرة من المعلومات.
الكلمات الرئيسية: الجوزاء 3، Google DeepMind، الذكاء الاصطناعي، التخطيط الديناميكي.
الكلمة الرئيسية الطويلة: التفكير المنطقي في الوقت الحقيقي في البحث.
المصادر المبحوثة:
https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/
https://deepmind.google/technologies/gemini/
https://store.google.com/intl/en/ideas/articles/gemini-advanced-features/
Veja Tambem em News (AR)
خصم كبير على هاتف Galaxy S25 Plus يخفض قيمته إلى أقل من 4500 ريال في المتجر الإلكتروني
يتجاهل Resident Evil الجديد من Zach Cregger الألعاب ويركز على قصة غير مسبوقة بشخصيات جديدة
تشير الشائعات إلى أن Nintendo تقوم بإعداد إصدار خاص من Switch 2 مع طبعة جديدة من Ocarina of Time
يؤدي انخفاض أسعار PlayStation 5 Pro إلى تسريع مبيعات التجزئة الرقمية وإزالة المخزونات العالمية
يعمل التحديث الجديد لنظام Apple على تحسين إدارة المهام العاجلة لمستخدمي iPhone
تسرب تفاصيل أجهزة جهاز PlayStation المحمول الجديد مع رسومات متفوقة على Xbox Series S
تطلق شركة أوبو هاتف Find X9 Ultra رسميًا في جميع أنحاء العالم مع عدسات Hasselblad وبطارية قوية
يكشف تيم كوك عن نماذج أولية جديدة لأجهزة iPhone و iPod احتفالاً بالذكرى الخمسين لشركة Apple
الإصدار الجديد من الهاتف الذكي القابل للطي يضفي لمسة نهائية ذهبية على المنافسين في الألعاب الشتوية
تقوم سامسونج بتحديث وحدة QuickStar وتوسع التحكم البصري باللوحة في واجهة One UI 8.5
يتلقى نظام Android تكامل Gemini Nano 4 الأصلي للمعالجة في وضع عدم الاتصال على الهواتف الذكية