آخر الأخبار (AR)

تقوم Google بإعداد نظام Rambler الجديد على لوحة مفاتيح Gboard مع Gemini Intelligence لتحسين الإملاء على Android

Gemini
Gemini - mundissima/ Shutterstock.com

تتقدم شركة جوجل في تطوير تحديث للوحة المفاتيح الافتراضية الرسمية الخاصة بها. تستعد الشركة للدمج الأصلي لأداة Rambler في Gboard باستخدام Gemini Intelligence، وهو نظام مصمم لإعادة تشكيل الإملاء الصوتي على الهواتف الذكية. وظهرت الميزة الجديدة مخفية في الملفات الداخلية للتطبيق أثناء التحليلات الفنية. الهدف الرئيسي ينطوي على حل العيوب في النسخ التلقائي للصوتيات الطويلة.

جاء التأكيد على المشروع بعد فحص تفصيلي لحزمة التثبيت لنظام Android. وتمكن الخبراء من تمكين الواجهة مسبقًا، وكشفوا عن خيارات جديدة في قائمة الإعدادات. يشير ظهور الأزرار الوظيفية إلى أن مرحلة الاختبار الداخلي تتجه نحو الاكتمال. ومن المتوقع أن يتم التوزيع العالمي في الأشهر المقبلة.

الهندسة العكسية تكشف عن واجهة مخفية في نظام أندرويد

حدث الاكتشاف من خلال مسح التعليمات البرمجية في حزمة بيانات التطبيق. أجرت بوابة Android Authority اختبارات كشفت عن خطوط الأوامر المسؤولة عن الذكاء الاصطناعي الجديد. استخدم المطورون الهندسة العكسية لإجبار الشاشات المقفلة على الظهور للمستخدمين العاديين. سمح هذا الإجراء بتعيين البنية المرئية لإعدادات المعالج.

تعرض الشاشات المفعّلة المسارات التي اختارتها Google لتوحيد لوحة المفاتيح مع نماذج اللغات الحديثة. تعرض القائمة الداخلية مربعات اختيار محددة لإدارة الصوت الملتقط. تقترح البنية التركيز على المعالجة الذكية للمعلومات محليًا. يقلل هذا الأسلوب من الاعتماد على الاتصالات بخوادم خارجية للتعرف على الكلام.

أظهر الوصول المبكر أن الواجهة ستحافظ على الهوية المرئية المعروفة. ويتم التكامل بشكل سري في التكوينات المتقدمة، ولا يتطلب سوى تنشيط مفتاح رقمي. تتناقض البساطة مع تعقيد الخوارزميات التي تعمل في الخلفية لفك تشفير الأنماط الصوتية. يضيف النموذج ميزات قوية دون تلويث الشاشة الرئيسية.

تعمل تقنية Rambler على تصحيح القواعد النحوية وإزالة التوقف المؤقت في الكلام

يكمن الاختلاف التقني في القدرة على تفسير الكلام سياقيًا في الوقت الفعلي. تتيح الأداة للمستخدم إملاء فقرات بأكملها بطريقة طبيعية، مع متابعة تدفق الأفكار. يتولى الذكاء الاصطناعي مسؤولية هيكلة النص النهائي، مما يضمن التماسك والسيولة. يعمل المحرك كمصحح فوري يقوم بمعالجة الكلمات.

يقوم جهاز الكمبيوتر بمهام التحرير التلقائي بينما يظل الميكروفون مفتوحًا. تشمل الوظائف الرئيسية ما يلي:

  • الإزالة الكاملة للترددات الشائعة في التواصل الشفهي، مثل التأتأة والتكرار اللاإرادي للمقاطع.
  • الإزالة التلقائية لضوضاء الخلفية التي يلتقطها الميكروفون وقمع فترات التوقف الطويلة بين الكلمات.
  • الإدراج الدقيق للنقاط والفواصل وعلامات الاستفهام بناءً على التنغيم وسياق الجملة.
  • تصحيح أخطاء الإتفاق اللفظي والإسمي دون تغيير المعنى الأصلي للرسالة المُملاة.
  • تم تعديل بناء الجملة لضمان الوضوح وتسهيل القراءة بسرعة في تطبيقات المراسلة الفورية.

تسعى معايرة الخوارزمية إلى تحسين التعبير المكتوب دون إزالة هوية من ينتج الرسالة. تم تدريب النظام للحفاظ على المصطلحات الإقليمية والعامية، مع التركيز على التصحيحات على العيوب اللغوية الارتجالية. تفرق التكنولوجيا بين الخطأ النحوي والتعبير العامي المتعمد. تمثل هذه الإمكانية تحسنًا ملحوظًا مقارنة بالناسخات القديمة.

تضمن المعالجة المحلية المرونة في تحويل الصوت

يمثل تنفيذ مهام النسخ مباشرة على الأجهزة تحولًا في خدمات الإملاء. يستخدم Gboard مع Gemini Intelligence المعالجات العصبية للأجهزة لتحليل الكلام دون إرسال حزم صوتية ثابتة إلى السحابة. تقلل الإستراتيجية من زمن الوصول بين الكلام وظهور الكلمات. يلاحظ المستخدم استجابة فورية تقريبًا.

الاستقلال الجزئي للإنترنت يحل مشاكل الاستخدام في المناطق ذات التغطية غير المستقرة. يمكن للنظام الحفاظ على دقة النسخ حتى عندما يمر الجهاز عبر مناطق ظل الإشارة. استمرارية الخدمة تمنع فقدان الأقسام التي تم إملاؤها بسبب انقطاع الاتصال. تقوم الميزة بتخزين نماذج اللغة في الذاكرة الداخلية.

يلبي نهج المعالجة المحلية المتطلبات المتزايدة للخصوصية الرقمية. إن تحويل الصوت إلى نص داخل الجهاز نفسه يقلل من المخاطر المرتبطة بحركة المعلومات الحساسة. تظل بيانات القياسات الحيوية الصوتية ومحتوى الرسائل مقتصرة على أجهزة المالك. تعمل الشركة على تعزيز الأمان من خلال الحد من الاعتماد على خوادم الطرف الثالث.

يؤدي توسيع النظام البيئي إلى تكثيف المنافسة في سوق الهواتف المحمولة

يعزز تقديم Rambler استراتيجية الشركة المتمثلة في تحويل تجربة المستخدم من خلال الذكاء الاصطناعي التوليدي. المشروع، الذي تم الإعلان عنه في شهر مايو، أبقى التفاصيل التشغيلية مقتصرة على المختبرات حتى التسرب الأخير. تعمل لوحة المفاتيح الافتراضية كنقطة التفاعل الرئيسية لإدخال البيانات عبر مليارات الأجهزة. يقوم التحديث بتحويل تطبيق الأداة المساعدة إلى مساعد كتابة.

يؤدي تطبيق ختم Gemini Intelligence إلى إنشاء ميزة تنافسية مباشرة ضد الحلول الأصلية التي طورتها Apple. يأخذ الصراع من أجل الهيمنة على أدوات الإنتاجية المحمولة فصلاً جديدًا مع النسخ السياقية المجانية. يسعى صانع Android إلى توحيد تجربة الكتابة الذكية، متجاوزًا تعديلات البرامج التي تنفذها شركات صناعة السيارات الآسيوية. تضمن لوحة المفاتيح الموحدة ابتكارات متزامنة.

يتوقع المحللون أن يتم توزيع المنتج الجديد على مراحل مختلفة لضمان استقرار الخوادم. من المتوقع أن تتلقى الهواتف الذكية في خط Pixel هذه الميزة حصريًا خلال الفترة الأولية. يجب أن يتم التوسع إلى الأجهزة الأخرى المتوافقة مع نظام التشغيل بشكل تدريجي. يسمح الجدول الزمني المتدرج للمهندسين بتصحيح أي عيوب قبل الإصدار الشامل.

To Top