חדשות אחרונות (HE)

גוגל מכינה מערכת Rambler חדשה במקלדת Gboard עם Gemini Intelligence לשיפור ההכתבה באנדרואיד

Gemini
Gemini - mundissima/ Shutterstock.com

גוגל מתקדמת בפיתוח עדכון למקלדת הוירטואלית הרשמית שלה. החברה מכינה את האינטגרציה המקורית של הכלי Rambler לתוך Gboard עם Gemini Intelligence, מערכת שנועדה לעצב מחדש את ההכתבה הקולית בסמארטפונים. התכונה החדשה הופיעה מוסתרת בקבצים הפנימיים של האפליקציה במהלך ניתוחים טכניים. המטרה העיקרית כוללת פתרון פגמים בתמלול אוטומטי של אודיו ארוכים.

אישור על הפרויקט הגיע לאחר בדיקה מפורטת של חבילת ההתקנה למערכת אנדרואיד. מומחים הצליחו להפעיל את הממשק מראש, וחשפו אפשרויות חדשות בתפריט ההגדרות. המראה של כפתורים פונקציונליים מצביע על כך ששלב הבדיקה הפנימי מתקדם לקראת סיום. ההפצה העולמית צפויה להתרחש בחודשים הקרובים.

הנדסה לאחור חושפת ממשק נסתר במערכת אנדרואיד

הגילוי התרחש באמצעות סריקת קוד בחבילת הנתונים של האפליקציה. פורטל רשות אנדרואיד ערך בדיקות שחשפו את שורות הפיקוד האחראיות לבינה המלאכותית החדשה. מפתחים השתמשו בהנדסה לאחור כדי לאלץ מסכים נעולים להופיע עבור משתמשים רגילים. ההליך איפשר מיפוי המבנה החזותי של הגדרות האשף.

המסכים המופעלים מציגים את הנתיבים שנבחרו על ידי גוגל כדי לאחד את המקלדת עם דגמי השפה האחרונים. התפריט הפנימי מציג תיבות סימון ספציפיות לניהול השמע שנלכד. הארכיטקטורה מציעה התמקדות בעיבוד אינטליגנטי של מידע באופן מקומי. גישה זו מפחיתה את התלות בחיבורים לשרתים חיצוניים לצורך זיהוי דיבור.

גישה מוקדמת הוכיחה שהממשק ישמור על הזהות החזותית הידועה. האינטגרציה מתרחשת באופן דיסקרטי בתצורות מתקדמות, הדורשות רק הפעלה של מתג דיגיטלי. הפשטות עומדת בניגוד למורכבות האלגוריתמים הפועלים ברקע לפענוח תבניות ווקאליות. הדגם מוסיף תכונות חזקות מבלי לזהם את המסך הראשי.

טכנולוגיית Rambler מתקנת דקדוק ומבטלת הפסקות בדיבור

ההבדל הטכני טמון ביכולת לפרש דיבור באופן הקשרי בזמן אמת. הכלי מאפשר למשתמש להכתיב פסקאות שלמות בצורה טבעית, בעקבות זרימת המחשבה. בינה מלאכותית לוקחת על עצמה את האחריות לבניית הטקסט הסופי, הבטחת לכידות ונזילות. המנוע פועל כמגיה מיידי המעבד את המילים.

מעבד הנתונים מבצע משימות עריכה אוטומטיות בזמן שהמיקרופון נשאר פתוח. הפונקציות העיקריות כוללות:

  • הסרה מלאה של התלבטויות נפוצות בתקשורת בעל פה, כגון גמגום וחזרות לא רצוניות על הברות.
  • ביטול אוטומטי של רעשי רקע הנקלטים על ידי המיקרופון ודיכוי הפסקות ארוכות בין מילים.
  • הכנסה מדויקת של נקודות, פסיקים וסימני שאלה על סמך אינטונציה והקשר של המשפט.
  • תיקון שגיאות הסכמה מילולית ונומינלית מבלי לשנות את המשמעות המקורית של ההודעה המוכתבת.
  • תחביר מותאם כדי להבטיח בהירות ולהקל על קריאה מהירה ביישומי מסרים מיידיים.

כיול האלגוריתם מבקש לחדד את הביטוי הכתוב מבלי להסיר את זהותו של מי שמפיק את ההודעה. המערכת הוכשרה לשמר מונחים אזוריים וסלנג, תוך התמקדות בתיקונים על ליקויי שפה באלתור. הטכנולוגיה מבדילה שגיאה דקדוקית מביטוי דיבור מכוון. יכולת זו מייצגת שיפור משמעותי לעומת מתמללים מדור קודם.

עיבוד מקומי מבטיח זריזות בהמרת שמע

ביצוע משימות תמלול ישירות על החומרה מייצג שינוי עבור שירותי הכתבה. Gboard עם Gemini Intelligence משתמש במעבדים העצביים של המכשירים כדי לנתח דיבור מבלי לשלוח מנות שמע קבועות לענן. האסטרטגיה מפחיתה את ההשהיה בין הדיבור להופעת המילים. המשתמש מבחין בתגובה כמעט מיידית.

העצמאות החלקית של האינטרנט פותרת בעיות שימוש באזורים עם כיסוי לא יציב. המערכת יכולה לשמור על דיוק התמלול גם כאשר המכשיר עובר דרך אזורי צל של אותות. רציפות השירות מונעת אובדן של קטעים מוכתבים עקב נפילות חיבור. התכונה מאחסנת מודלים של שפה בזיכרון הפנימי.

גישת העיבוד המקומי עונה על הדרישות ההולכות וגוברות לפרטיות דיגיטלית. המרת הקול לטקסט בתוך המכשיר עצמו מפחיתה סיכונים הקשורים לתעבורה של מידע רגיש. נתונים ביומטריים קוליים ותוכן הודעות נשארים מוגבלים לחומרה של הבעלים. החברה מחזקת את האבטחה על ידי הגבלת התלות בשרתים של צד שלישי.

הרחבת האקוסיסטם מעצימה את התחרות בשוק הטלפונים הסלולריים

הצגת Rambler מגבשת את האסטרטגיה של החברה לשנות את חווית המשתמש באמצעות AI גנרטיבי. הפרויקט, שהוכרז במאי, שמר על הפרטים התפעוליים מוגבלים למעבדות עד להדלפה האחרונה. המקלדת הוירטואלית משמשת כנקודת האינטראקציה העיקרית להזנת נתונים על פני מיליארדי מכשירים. העדכון הופך אפליקציית שירות לעוזר כתיבה.

יישום חותם ה-Gemini Intelligence יוצר יתרון תחרותי ישיר מול פתרונות מקוריים שפותחו על ידי אפל. המאבק על הדומיננטיות בכלי פרודוקטיביות ניידים מקבל פרק חדש עם תעתיקי הקשר בחינם. יצרנית האנדרואיד מבקשת לתקן את חוויית ההקלדה החכמה, תוך מעבר לשינויי תוכנה שיושמו על ידי יצרניות רכב אסייתיות. המקלדת המאוחדת מבטיחה חידושים בו זמנית.

אנליסטים מעריכים כי הפצת המוצר החדש תתרחש בשלבים שונים כדי להבטיח את יציבות השרתים. הצפי הוא שסמארטפונים בקו הפיקסל יקבלו את התכונה אך ורק במהלך התקופה הראשונית. ההרחבה למכשירים אחרים התואמים למערכת ההפעלה צריכה להתרחש בהדרגה. לוח הזמנים המדורג מאפשר למהנדסים לתקן כל ליקוי לפני שחרור המוני.

To Top