الذكاء الاصطناعي جوجل جيميني يبدأ التحكم في واتساب على أندرويد من خلال الأوامر الصوتية

Aplicativo WhatsApp

Aplicativo WhatsApp - Foto: Worawee Meepian / Shutterstock.com

حصل Google Gemini على تحديث جديد يتيح التكامل المباشر مع تطبيق المراسلة WhatsApp على الأجهزة المزودة بنظام التشغيل Android. ويحول التغيير أداة الذكاء الاصطناعي إلى وكيل افتراضي قادر على أداء مهام معقدة، متجاوزًا الوظيفة البسيطة المتمثلة في الإجابة على أسئلة معزولة. تتيح هذه الميزة إرسال الرسائل واسترجاع البيانات المخزنة في التطبيقات الأخرى في النظام البيئي وتنفيذ الأوامر في الوقت الفعلي، مما يلغي حاجة المستخدم للتبديل يدويًا بين الأنظمة الأساسية المختلفة على شاشة الهاتف الخليوي.

تمثل هذه الميزة الجديدة تقدمًا كبيرًا في طريقة تفاعل المستخدمين مع هواتفهم الذكية. يعمل التكامل كجسر تكنولوجي يربط برنامج Meta’s messenger بالخدمات الأصلية لعملاق البحث، مثل Google Keep والتقويم وخرائط Google. تعمل القدرة على معالجة خطوات متعددة بأمر صوتي واحد على تغيير ديناميكيات الاستخدام اليومي، مما يسمح بإكمال سير العمل الذي كان يتطلب في السابق نقرات متعددة على الشاشة بصمت وتلقائيًا في الخلفية.

تكوين الموارد على نظام أندرويد

يتطلب تنشيط الوظيفة الجديدة أن يقوم المستخدم بتثبيت تطبيق Google Gemini الرسمي وتكوينه على هاتفه الذكي. تم توفير الميزة حصريًا لبيئة Android، مما يعني أن مالكي أجهزة iPhone لا يمكنهم الوصول إلى هذه الأداة في الوقت الحالي. قامت الشركة أيضًا بتقييد الميزة الجديدة على بيئة الهاتف المحمول، مع ترك إصدار الويب للمساعد خارج تحديث الاتصال المحدد هذا.

لتمكين الاتصال بين الذكاء الاصطناعي والمراسلة، يحتاج مالك الجهاز إلى تنفيذ إجراء ضمن إعدادات المساعد الخاصة. تم تصميم مسار التنشيط ليكون واضحًا ومباشرًا، ولا يتطلب سوى بضع نقرات على واجهة البرنامج الرئيسية. تتبع العملية ترتيبًا محددًا للقوائم:

  • افتح تطبيق Google Gemini على هاتفك الخلوي.
  • قم بالوصول إلى أيقونة ملف تعريف المستخدم وادخل إلى قسم الإعدادات.
  • انتقل إلى خيار Personal Intelligence ثم حدد Connection Apps.
  • ابحث عن خيار WhatsApp وقم بتنشيط زر التبديل.

بعد الانتهاء من هذا الإجراء، يتلقى المساعد الافتراضي الأذونات اللازمة من نظام التشغيل للوصول إلى سجل محادثات WhatsApp وتنفيذ أوامر إرسال النص. يعد تنشيط زر التبديل هو المشغل الذي يسمح بتبادل البيانات بين التطبيقين، مما يضمن فهم الذكاء الاصطناعي لسياق الطلبات وتحديد جهات الاتصال الصحيحة في دفتر عناوين الهاتف قبل إنشاء أي رسائل.

التطور مقارنة بمساعد جوجل القديم

تقدم بنية تشغيل Google Gemini اختلافات هيكلية عميقة عند مقارنتها بالأوامر الصوتية التقليدية لمساعد Google القديم. كان النظام السابق يعمل بطريقة معزولة وخطية، ويقتصر على نسخ الكلمات التي يمليها المستخدم بعد تفعيل جهة اتصال معينة بالاسم. أظهرت التكنولوجيا القديمة قدرة محدودة على تفسير السياقات المعقدة أو إسناد المعلومات من قواعد بيانات التطبيقات المختلفة.

ويعمل نموذج الذكاء الاصطناعي الجديد بطريقة متكاملة، حيث يعمل كمركز مركزي لمعالجة البيانات في الهاتف. يمكن للبرنامج الوصول إلى الملاحظات والتحقق من مواعيد التقويم ورسم المسارات مع الحفاظ على واجهة المراسلة نشطة. تعمل هذه الميزة على تحويل المساعد إلى وكيل إنتاجي حقيقي، قادر على تفسير نية المستخدم، والبحث عن المعلومات الضرورية في التطبيق المصدر، وتنسيق المحتوى وتسليمه إلى التطبيق الوجهة دون انقطاع.

ويشير خبراء التكنولوجيا إلى أن هذا التحول من نموذج أوامر بسيط إلى نظام تنفيذ مهام متعدد الخطوات يعكس تطور التعلم الآلي على الأجهزة المحمولة. يعد تقليل وقت الشاشة وأتمتة العمليات المتكررة من الفوائد العملية الرئيسية لهذا التحديث، مما يوفر تجربة مستخدم أكثر مرونة وأقل اعتمادًا على التفاعل اليدوي المستمر مع شاشة الجهاز.

انظر أيضاً

أمثلة عملية للاستخدام مع Google Keep وخرائط Google

ويمكن ملاحظة التطبيق العملي لهذه التكنولوجيا في سيناريوهات تبادل المعلومات اليومية. في الماضي، إذا أراد المستخدم إرسال مستند محفوظ في ملاحظاته، كانت العملية تتطلب مغادرة WhatsApp، وفتح Google Keep، والعثور على الملف المحدد، ونسخ كتلة النص، والعودة إلى برنامج المراسلة، ولصق المحتوى والضغط على زر الإرسال. مع التكامل الجديد، يتم تقليل التدفق إلى أمر صوتي واحد، مثل التعليمات: “احصل على وصفة البيتزا الخاصة بي من Google Keep وأرسلها إلى Mark on WhatsApp.”

يقوم Google Gemini بتنفيذ العملية بأكملها بشكل غير مرئي للمستخدم. يقوم النظام بتحديد موقع الملاحظة المطلوبة واستخراج المعلومات ذات الصلة وتنسيق رسالة نصية واضحة وإعداد حقل الإرسال في برنامج المراسلة بنقرة واحدة فقط للتأكيد. ينطبق نفس المنطق على مشاركة بيانات تحديد الموقع الجغرافي وتخطيط المسار. أثناء ترتيب الرحلة، يمكن لمالك الهاتف الذكي إصدار الأمر التالي: “ابحث عن المسافة من منزلي إلى شاطئ دايتونا وأرسل التفاصيل إلى صديقي عبر تطبيق WhatsApp”.

باستخدام هذا الأمر، يقوم المساعد الافتراضي بمراجعة قاعدة بيانات خرائط Google، وحساب الطريق الأكثر كفاءة، واستخراج البيانات الأساسية حول وقت السفر والمسافة المقطوعة، وتنظيم النص بطريقة مفهومة وفتح نافذة المحادثة الدقيقة في تطبيق المراسلة. توضح هذه القدرة على الإسناد الترافقي للبيانات الجغرافية باستخدام أدوات الاتصال الفرق الأساسي بين برامج تحويل الكلام إلى نص البسيطة وعامل الذكاء الاصطناعي المصمم لربط النظم البيئية الرقمية.

التشغيل عن طريق الأوامر الصوتية في Android Auto

تمتد وظيفة التكامل أيضًا إلى بيئة السيارات من خلال نظام Android Auto. التركيز الرئيسي لتكييف التكنولوجيا مع المركبات هو الحفاظ على السلامة على الطرق، مما يسمح للسائقين بأداء مهام الاتصال المعقدة دون الحاجة إلى التعامل مع الهاتف الخليوي. ويمكن إجراء التنشيط من خلال الميكروفون المدمج في لوحة عدادات السيارة أو عن طريق الضغط على زر التحكم الصوتي الموجود على عجلة القيادة.

أثناء رحلة العودة إلى المنزل بعد العمل، يمكن للسائق استخدام اللغة الطبيعية لإدارة مواعيده. يحدث مثال عملي لهذا التطبيق عندما يقوم السائق بتنشيط النظام ويقول: “أرسل رسالة على WhatsApp إلى Sonal تفيد بأنني سأصل خلال حوالي 10 دقائق.” يلتقط البرنامج الصوت وسط ضجيج المقصورة، ويعالج القصد من الجملة ويحدد جهة الاتصال في دليل الهاتف.

تتم معالجة الكلام على الفور، ويطلب النظام تأكيدًا مرئيًا أو سمعيًا من خلال واجهة Android Auto قبل إكمال الإرسال. يؤدي أداء المهمة إلى إلغاء حاجة المستخدم تمامًا إلى النظر بعيدًا عن المسار أو النظر إلى شاشة الهاتف الذكي. ويتم ضمان الحفاظ على الانتباه في حركة المرور من خلال أتمتة عملية الكتابة والإرسال، مما يعزز دور الذكاء الاصطناعي كأداة مساعدة آمنة عند قيادة المركبات.

توسيع النظام البيئي والتكامل مع Spotify

يؤدي تنشيط زر الاتصال في قسم الذكاء الشخصي بالتطبيق إلى تحويل المساعد الافتراضي من حداثة تكنولوجية بسيطة إلى مركز قيادة عملي ووظيفي. يشجع المطورون المستخدمين على استكشاف قائمة ملحقات البرنامج لاكتشاف طرق جديدة لأتمتة المهام اليومية. إن القدرة على إرسال رسائل نصية منسقة من خلال أوامر صوتية معقدة هي مجرد الطبقة الأولية من الإمكانيات التي توفرها المنصة.

يستمر النظام البيئي لعمليات التكامل في النمو، ولا يشمل أدوات الاتصال والإنتاجية فحسب، بل يشمل أيضًا منصات الترفيه. بالإضافة إلى الاتصال الذي تم إنشاؤه مع WhatsApp، يُظهر Google Gemini التوافق مع تطبيقات الطرف الثالث الأخرى ذات الصلة للغاية في السوق، بما في ذلك خدمة البث الصوتي Spotify. يشير توسع هذه الشراكات إلى وجود اتجاه نحو دمج المساعد باعتباره الوسيط الرئيسي بين المستخدم وجميع الخدمات المثبتة على الجهاز المحمول.

انظر أيضاً