News (AR)

جوجل تعلن عن Gemini 3.1 Flash Live في تحديث Gemini Live

Gemini
Gemini - Mehaniq/shutterstock.com

أعلنت Google يوم الخميس عن Gemini 3.1 Flash Live باعتباره النموذج الصوتي الأعلى جودة حتى الآن. يقود هذا الإصدار عددًا من التحسينات المهمة إلى Gemini Live وSearch Live. النموذج متاح الآن للمعاينة عبر Gemini Live API في Google AI Studio. ويتميز بتقديم زمن وصول أقل مقارنة بالإصدار السابق وفعالية أكبر في التعرف على الفروق الصوتية مثل النغمة والإيقاع.

يمكن للمطورين اختبار النموذج الجديد على الفور لإنشاء تطبيقات تتضمن محادثات متعددة الوسائط في الوقت الفعلي. يقوم Gemini 3.1 Flash Live بتصفية ضوضاء الخلفية بشكل أكثر دقة ويمكنه تمييز الكلام ذي الصلة بشكل أفضل وسط الأصوات البيئية مثل حركة المرور أو التلفزيون. علاوة على ذلك، يدعم النظام أكثر من 90 لغة، مما يوسع نطاق التفاعلات المباشرة.

  • تحسين التعرف على الفروق الصوتية مثل طبقة الصوت والإيقاع
  • تقليل الكمون في المحادثات في الوقت الحقيقي
  • تصفية أكثر فعالية لضوضاء الخلفية والأصوات البيئية
  • دعم أكثر من 90 لغة للتفاعلات متعددة الوسائط

التحسينات التقنية على النموذج الصوتي

يعمل النموذج الجديد على تحسين القدرة على تشغيل الأدوات الخارجية بشكل كبير أثناء المحادثات المباشرة. كما أنه يتميز بمتابعة أفضل للتعليمات المعقدة، مما يبقي الوكيل ضمن الحدود التشغيلية حتى عندما تأخذ المحادثات منعطفات غير متوقعة. تؤدي هذه التغييرات إلى استجابات أكثر موثوقية وطبيعية.

في Gemini Live لأجهزة Android وiOS، يوفر Flash Live 3.1 استجابات أسرع مع فترات توقف مؤقتة أقل. يمكن للنظام متابعة منطق المحادثة مرتين في المرة السابقة. وهذا يسمح بجلسات عصف ذهني أطول دون فقدان قطار أفكارك.

يقوم Gemini Live بضبط طول ونبرة الاستجابات ديناميكيًا لتناسب سياق اللحظة. يبلغ المستخدمون عن تفاعلات أكثر سلاسة وانقطاعات أقل أثناء الاستخدام اليومي. يساهم التكامل مع النموذج الجديد في توفير تجربة شاملة أكثر اتساقًا.

التوسع العالمي لخدمة البحث المباشر

تستخدم Google برنامج Gemini 3.1 Flash Live لإطلاق Search Live عالميًا في أكثر من 200 دولة. يغطي التوسيع جميع اللغات والمواقع التي يتوفر فيها وضع AI حاليًا. وتسمح هذه الميزة بإجراء محادثات تفاعلية مع بحث Google، بما في ذلك الصوت والفيديو من خلال Google Lens.

يمكن للمستخدمين الآن إجراء عمليات بحث محادثة في الوقت الفعلي بدقة أكبر عبر مناطق مختلفة. يقوم النظام بمعالجة الاستعلامات متعددة الوسائط بشكل أكثر كفاءة في بيئات متنوعة. يعمل هذا التوفر على توسيع الوصول إلى المعلومات الصوتية على نطاق عالمي.

يستفيد Search Live بشكل مباشر من التحسينات في التعرف على الكلام وتقليل زمن الوصول. تصبح المحادثات مع البحث أكثر طبيعية وسياقية. يعمل تكامل الصوت والفيديو على تسهيل التفاعل في السيناريوهات اليومية العملية.

Google
جوجل – daily_creativity/shutterstock.com

تفاصيل حول اللغة والدعم المتعدد الوسائط

يتيح دعم أكثر من 90 لغة إجراء محادثات متعددة الوسائط عالية الجودة في الوقت الفعلي. يتعامل النموذج بشكل أفضل مع الاختلافات الإقليمية في النطق واللهجات. وهذا يجعل Gemini Live في متناول المستخدمين في مختلف البلدان.

يكتسب المطورون أدوات لإنشاء تجارب مخصصة بناءً على النموذج الجديد. تعمل واجهة برمجة التطبيقات (API) على تسهيل الاندماج في التطبيقات التي تتطلب تفاعلات صوتية غنية. يساعد التركيز على زمن الوصول المنخفض في الحفاظ على تدفق المحادثات بشكل طبيعي.

تطبيقات عملية في الاستخدام اليومي

في الحياة اليومية، يستجيب Gemini Live مع النموذج الجديد بسرعة أكبر للأوامر والأسئلة المعقدة. يحافظ النظام على السياق لفترات أطول دون إعادة تشغيل المنطق. يمكن للمستخدمين استكشاف الأفكار بشكل مستمر خلال الجلسات الممتدة.

تعمل القدرة على تصفية الضوضاء البيئية على تحسين الأداء في الأماكن المزدحمة أو مع أصوات الخلفية. تصبح المحادثات في بيئات مثل الشوارع أو الغرف التي بها تلفزيون أكثر وضوحًا. يتكيف التعديل الديناميكي للنغمة ومدة الاستجابات مع أسلوب التفاعل.

التقدم في التكامل مع الأدوات الخارجية

يقوم النموذج المحسن بتشغيل الأدوات الخارجية بشكل أكثر فعالية أثناء المحادثات. فهو يتبع تعليمات النظام بشكل أكثر اتساقًا حتى في مربعات الحوار المتفرعة. يساهم هذا الاستقرار في تحقيق نتائج أكثر قابلية للتنبؤ بها في التطبيقات العملية.

يستفيد المطورون والمستخدمون النهائيون من التفاعلات الأكثر قوة. تصبح Gemini Live أداة أكثر موثوقية للمهام التي تتضمن خطوات متعددة. يؤدي الجمع بين الصوت المتقدم وقدرات الاستدلال الموسعة إلى توسيع إمكانيات الاستخدام.

تواصل Google الاستثمار في النماذج الصوتية لجعل تفاعلات الذكاء الاصطناعي أكثر طبيعية. يمثل إصدار Gemini 3.1 Flash Live خطوة مهمة في هذا الاتجاه. يمكن لمستخدمي Android وiOS تجربة الميزات الجديدة مباشرة في تطبيق Gemini Live.

التحديثات ذات الصلة على النظام البيئي الجوزاء

يتضمن الإعلان تحسينات تكميلية للوحة Gemini Live العائمة على نظام Android. تهدف هذه التغييرات إلى تسهيل الوصول السريع إلى الوظائف الصوتية. تعزز مجموعة التحديثات الالتزام بتجارب المحادثة المتقدمة.

يصل تطبيق Search Live الآن إلى جمهور أوسع بفضل إمكانات الصوت والفيديو المدمجة. يؤدي التوسع العالمي إلى إضفاء الطابع الديمقراطي على الوصول إلى عمليات البحث الصوتي التفاعلية. يحصل المستخدمون في المناطق المختلفة على أداة أكثر قوة للاستعلامات في الوقت الفعلي.

يمثل Gemini 3.1 Flash Live تطورًا ملحوظًا في جودة الصوت والصوت لنماذج Google. تعمل التحسينات في زمن الوصول وتصفية الضوضاء والتعليمات التالية على رفع مستوى التفاعلات المباشرة. يتيح إصدار المعاينة للمطورين استكشاف التطبيقات الجديدة الآن.

To Top