يقوم Gemini Live بتغيير الأصوات وتغيير الإيقاع في التحديثات الأخيرة

Gemini

Gemini - Primakov / Shutterstock.com

يلاحظ مستخدمو Gemini Live تغييرات في الخيارات الصوتية لمساعد الذكاء الاصطناعي من Google. تتضمن التغييرات اختلافات في إيقاع الكلام والنبرة وحتى مزيج اللهجات الإقليمية أثناء التفاعلات في الوقت الفعلي. تحدث هذه التغييرات بشكل متكرر بعد تحديثات القالب، مثل الإصدار 3.1 الأخير من Flash Live، وتؤثر على تجربة المحادثات المخصصة.

تشير العديد من التقارير إلى أن معاينات الصوت في التطبيق لا تتطابق مع الصوت الفعلي عند استخدام ميزة البث المباشر. يقدم خيار كابيلا، الذي يستنسخ اللهجة الأنثوية البريطانية، تغييرات أكثر وضوحًا منذ الإطلاق الأولي. وتبدي الأصوات الإقليمية الأخرى أيضًا مشكلات مماثلة في الاتساق.

تغيرات في إيقاع ونبرة الأصوات

تمثل التغييرات في إيقاع الكلام إحدى الشكاوى الأكثر شيوعًا بين المستخدمين الذين يستخدمون خيارات صوتية مختلفة في Gemini Live. تتباطأ أنماط الكلام في البيئات المختلفة، بينما تنخفض النغمات عالية الطبقة بشكل ملحوظ. في بعض الحالات، تتناوب الردود بين اللهجات الأسترالية واللهجات الأمريكية الأكثر حيادية أثناء المحادثات الجارية.

تحدث هذه التعديلات تدريجيًا بعد إعادة ضبط التطبيق، حيث تظل اللكنة المحددة لفترة قصيرة قبل أن تتحول إلى نسخة هجينة. يمكن أن تصبح التجربة غير مريحة لأولئك الذين يتوقعون الاتساق في التفاعلات. يلاحظ المستخدمون الذين لديهم محادثات أطول هذه التحولات بشكل متكرر.

الجوزاء – مونديسيما / Shutterstock.com

مقارنة بين المعاينة والاستخدام الفعلي للمورد

غالبًا ما تختلف معاينة الصوت المتوفرة في إعدادات Gemini Live عن النتائج التي يتم الحصول عليها في جلسات الدردشة النشطة. يؤثر هذا الاختلاف بشكل خاص على الأصوات المخصصة، والتي تفقد خصائصها الأصلية بمرور الوقت. وتشير التقارير المتراكمة في الأشهر الأخيرة إلى تدهور تدريجي في العديد من الخيارات المتاحة.

  • يؤثر الإيقاع الأبطأ على التدفق الطبيعي للاستجابات.
  • يتم تخفيف النغمات العالية وتغيير شخصية الصوت.
  • يحدث مزيج من اللهجات بشكل غير متوقع في الحوارات.
  • تؤدي إعادة ضبط التطبيق مؤقتًا إلى استعادة السلوك الأولي جزئيًا.

تأتي هذه الملاحظات في سياق التحديثات المتكررة لنماذج الذكاء الاصطناعي من جوجل، والتي تهدف إلى تحسين الأداء العام ولكنها تولد آثارًا جانبية على الأصوات.

التحف الصوتية في جلسات Gemini Live

تظهر المؤثرات الصوتية مثل الفرقعات والفرقعات والهسهسة بشكل متقطع عند استخدام Gemini Live. لا ترتبط هذه الضوضاء بشكل مباشر بالتغييرات الصوتية، ولكنها تمثل شكوى متكررة أخرى في منتديات الدعم الخاصة بالشركة. يختلف الحدوث وفقًا لخيار الصوت المحدد ولا يتكرر دائمًا بشكل مماثل.

العديد من المستخدمين قادرون على إعادة إنتاج المشكلة في اختبارات محددة، بينما يلاحظ الآخرون القطع الأثرية فقط في ظروف محددة. تظل جودة الصوت مستقرة مع الأوامر الصوتية السريعة أو في الوضع المباشر المدمج في Android Auto في المركبات. يشير هذا الاختلاف إلى أن المشكلة تتركز في جلسات محادثة أطول أو في سياقات استخدام معينة.

السلوك في سيناريوهات التفاعل المختلفة

تحافظ أصوات Gemini Live على قدر أكبر من الاستقرار عند استدعاء المساعد للحصول على أوامر مختصرة أو عناصر تحكم صوتية بسيطة. ومع ذلك، أثناء التفاعلات المحادثة الأعمق، تصبح التغييرات في الإيقاع والنبرة أكثر وضوحًا. كما تحافظ الميزة الموجودة في السيارات عبر Android Auto على الخصائص الأصلية للخيارات المحددة بشكل أفضل.

تلقت Google استفسارات حول هذه السلوكيات، على الرغم من عدم وجود تأكيد رسمي للاعتراف أو الإصلاحات قيد التنفيذ في الوقت الحالي. يستمر المستخدمون في اختبار الأصوات المختلفة المتاحة، بما في ذلك كابيلا، لتحديد الأصوات التي تظهر أقل تباين مع مرور الوقت.

الخيارات المتاحة والتعديلات داخل التطبيق

تقدم Gemini Live العديد من الأصوات القابلة للتخصيص مع لهجات ونغمات مميزة، مثل الخيارات التي تحاكي الاختلافات البريطانية والأمريكية المحايدة والاختلافات الإقليمية الأخرى. يمكن للمستخدمين تغيير التحديد مباشرة في إعدادات التطبيق للعثور على الإعداد الذي يناسب التفضيلات الفردية. لا يؤدي تغيير الأصوات دائمًا إلى حل مشكلات الإيقاع بشكل دائم.

  • تتضمن الخيارات أصواتًا ذات خصائص طبقة صوت أعلى أو أقل.
  • من الأفضل أن يحافظ البعض على اللهجة المختارة في الجلسات الأولية.
  • قد تؤدي إعادة ضبط التطبيق إلى استعادة السلوك المتوقع مؤقتًا.
  • تؤثر تحديثات القالب على الأداء العام للأصوات.

تسمح هذه الميزات بمزيد من التخصيص، لكن التناقضات المبلغ عنها تسلط الضوء على الحاجة إلى التعديلات من قبل الشركة المسؤولة عن التطوير.

تطور الأصوات في جيميني لايف مع مرور الوقت

على مدى الأشهر القليلة الماضية، خضعت العديد من الخيارات الصوتية في Gemini Live لتعديلات أدت إلى تغيير جوانب مثل سرعة التحدث ومزيج اللهجات. وتتزامن هذه التغييرات مع التحسينات في جوانب أخرى من نماذج الذكاء الاصطناعي، بما في ذلك سرعة الاستجابة وفهم السياق. تستمر الميزة في التطور، مع التحديثات التي تهدف إلى جعل التفاعلات أكثر مرونة.

يرى المستخدمون الذين يعتمدون على أصوات محددة للمهام اليومية أو إمكانية الوصول تأثيرات مباشرة على سهولة الاستخدام. يظل الاتساق بين معاينة الصوت والتنفيذ الفعلي نقطة اهتمام لأولئك الذين يستخدمون المساعد في المحادثات المطولة. تواصل Google تحسين النظام، استنادًا إلى التعليقات الواردة حول الأداء الصوتي.