ข่าวล่าสุด (TH)

Google เตรียมระบบ Rambler ใหม่บนแป้นพิมพ์ Gboard พร้อม Gemini Intelligence เพื่อปรับปรุงการเขียนตามคำบอกบน Android

Gemini
Gemini - mundissima/ Shutterstock.com

Google กำลังก้าวหน้าในการพัฒนาการอัปเดตสำหรับแป้นพิมพ์เสมือนอย่างเป็นทางการ บริษัทกำลังเตรียมการรวมเครื่องมือ Rambler เข้ากับ Gboard เข้ากับ Gemini Intelligence ซึ่งเป็นระบบที่ออกแบบมาเพื่อปรับเปลี่ยนการเขียนตามคำบอกด้วยเสียงบนสมาร์ทโฟน คุณลักษณะใหม่นี้ปรากฏซ่อนอยู่ในไฟล์ภายในของแอปพลิเคชันระหว่างการวิเคราะห์ทางเทคนิค วัตถุประสงค์หลักเกี่ยวข้องกับการแก้ไขข้อบกพร่องในการถอดเสียงไฟล์เสียงขนาดยาวโดยอัตโนมัติ

การยืนยันเกี่ยวกับโครงการเกิดขึ้นหลังจากการตรวจสอบแพ็คเกจการติดตั้งสำหรับระบบ Android อย่างละเอียด ผู้เชี่ยวชาญจัดการเพื่อเปิดใช้งานอินเทอร์เฟซล่วงหน้าโดยเปิดเผยตัวเลือกใหม่ในเมนูการตั้งค่า ลักษณะของปุ่มการทำงานบ่งชี้ว่าขั้นตอนการทดสอบภายในกำลังดำเนินไปจนเสร็จสิ้น คาดว่าจะมีการจัดจำหน่ายทั่วโลกในอีกไม่กี่เดือนข้างหน้า

วิศวกรรมย้อนกลับเผยอินเทอร์เฟซที่ซ่อนอยู่ในระบบ Android

การค้นพบนี้เกิดขึ้นผ่านการสแกนโค้ดในชุดข้อมูลของแอปพลิเคชัน พอร์ทัล Android Authority ได้ทำการทดสอบที่เปิดเผยบรรทัดคำสั่งที่รับผิดชอบด้านปัญญาประดิษฐ์ใหม่ นักพัฒนาซอฟต์แวร์ใช้วิศวกรรมย้อนกลับเพื่อบังคับให้หน้าจอที่ล็อกปรากฏต่อผู้ใช้ทั่วไป ขั้นตอนนี้อนุญาตให้แมปโครงสร้างภาพของการตั้งค่าของวิซาร์ด

หน้าจอที่เปิดใช้งานจะแสดงเส้นทางที่ Google เลือกเพื่อรวมแป้นพิมพ์เข้ากับรุ่นภาษาล่าสุด เมนูภายในจะแสดงช่องทำเครื่องหมายเฉพาะสำหรับจัดการเสียงที่บันทึกไว้ สถาปัตยกรรมนี้ชี้ให้เห็นถึงการมุ่งเน้นไปที่การประมวลผลข้อมูลอย่างชาญฉลาดภายในเครื่อง วิธีการนี้ช่วยลดการพึ่งพาการเชื่อมต่อกับเซิร์ฟเวอร์ภายนอกสำหรับการรู้จำเสียง

การเข้าถึงระหว่างการพัฒนาแสดงให้เห็นว่าอินเทอร์เฟซจะรักษาเอกลักษณ์ทางภาพที่รู้จักไว้ การรวมระบบเกิดขึ้นอย่างรอบคอบในการกำหนดค่าขั้นสูง โดยต้องมีการเปิดใช้งานสวิตช์ดิจิทัลเท่านั้น ความเรียบง่ายแตกต่างกับความซับซ้อนของอัลกอริธึมที่ทำงานอยู่เบื้องหลังเพื่อถอดรหัสรูปแบบเสียงร้อง โมเดลนี้เพิ่มคุณสมบัติที่แข็งแกร่งโดยไม่สร้างมลภาวะให้กับหน้าจอหลัก

เทคโนโลยี Rambler แก้ไขไวยากรณ์และลดการหยุดชั่วคราวในการพูด

ความแตกต่างทางเทคนิคอยู่ที่ความสามารถในการตีความคำพูดตามบริบทแบบเรียลไทม์ เครื่องมือนี้ช่วยให้ผู้ใช้กำหนดทั้งย่อหน้าได้อย่างเป็นธรรมชาติตามกระแสความคิด ปัญญาประดิษฐ์จะทำหน้าที่รับผิดชอบในการจัดโครงสร้างข้อความสุดท้าย เพื่อให้มั่นใจว่ามีความสอดคล้องกันและความลื่นไหล กลไกทำหน้าที่เป็นตัวพิสูจน์อักษรทันทีที่ประมวลผลคำต่างๆ

ตัวประมวลผลข้อมูลจะดำเนินการแก้ไขอัตโนมัติในขณะที่ไมโครโฟนยังคงเปิดอยู่ หน้าที่หลักได้แก่:

  • ขจัดความลังเลที่พบบ่อยในการสื่อสารด้วยวาจา เช่น การพูดติดอ่างและการพูดพยางค์ซ้ำโดยไม่สมัครใจ
  • กำจัดเสียงรบกวนพื้นหลังที่ไมโครโฟนรับโดยอัตโนมัติ และระงับการหยุดยาวระหว่างคำ
  • การแทรกจุด เครื่องหมายจุลภาค และเครื่องหมายคำถามอย่างแม่นยำ โดยอิงตามบริบทของน้ำเสียงและประโยค
  • การแก้ไขข้อผิดพลาดของข้อตกลงทางวาจาและเล็กน้อยโดยไม่เปลี่ยนความหมายดั้งเดิมของข้อความที่เขียนตามคำบอก
  • ปรับไวยากรณ์เพื่อให้มั่นใจถึงความชัดเจนและทำให้อ่านง่ายขึ้นอย่างรวดเร็วในแอปพลิเคชันข้อความโต้ตอบแบบทันที

การสอบเทียบอัลกอริธึมพยายามปรับแต่งการแสดงออกที่เป็นลายลักษณ์อักษรโดยไม่ต้องลบตัวตนของใครก็ตามที่สร้างข้อความ ระบบได้รับการฝึกอบรมเพื่อรักษาคำศัพท์และคำสแลงของภูมิภาค โดยเน้นการแก้ไขข้อบกพร่องของภาษาด้นสด เทคโนโลยีทำให้ข้อผิดพลาดทางไวยากรณ์แตกต่างจากการแสดงออกทางภาษาโดยเจตนา ความสามารถนี้แสดงถึงการปรับปรุงที่สำคัญเหนือตัวถอดเสียงแบบเดิม

การประมวลผลเฉพาะที่รับประกันความคล่องตัวในการแปลงเสียง

การดำเนินงานถอดเสียงโดยตรงบนฮาร์ดแวร์แสดงถึงการเปลี่ยนแปลงในบริการเขียนตามคำบอก Gboard ที่มี Gemini Intelligence ใช้ตัวประมวลผลประสาทของอุปกรณ์เพื่อวิเคราะห์คำพูดโดยไม่ต้องส่งแพ็คเก็ตเสียงอย่างต่อเนื่องไปยังระบบคลาวด์ กลยุทธ์นี้จะช่วยลดเวลาแฝงระหว่างคำพูดและรูปลักษณ์ของคำ ผู้ใช้สังเกตเห็นการตอบสนองเกือบจะในทันที

ความเป็นอิสระบางส่วนของอินเทอร์เน็ตช่วยแก้ปัญหาการใช้งานในพื้นที่ที่มีความครอบคลุมไม่เสถียร ระบบสามารถรักษาความแม่นยำในการถอดเสียงได้แม้ว่าอุปกรณ์จะผ่านบริเวณเงาของสัญญาณก็ตาม ความต่อเนื่องของการบริการช่วยป้องกันการสูญเสียส่วนที่กำหนดเนื่องจากการเชื่อมต่อขาดหาย คุณลักษณะนี้จัดเก็บโมเดลภาษาไว้ในหน่วยความจำภายใน

วิธีการประมวลผลในท้องถิ่นตอบสนองความต้องการความเป็นส่วนตัวดิจิทัลที่เพิ่มขึ้น การแปลงเสียงเป็นข้อความภายในอุปกรณ์ช่วยลดความเสี่ยงที่เกี่ยวข้องกับการรับส่งข้อมูลที่ละเอียดอ่อน ข้อมูลไบโอเมตริกซ์เสียงและเนื้อหาข้อความยังคงจำกัดอยู่ที่ฮาร์ดแวร์ของเจ้าของเท่านั้น บริษัทเสริมสร้างความปลอดภัยด้วยการจำกัดการพึ่งพาเซิร์ฟเวอร์ของบุคคลที่สาม

การขยายตัวของระบบนิเวศทำให้การแข่งขันในตลาดโทรศัพท์มือถือรุนแรงขึ้น

การเปิดตัว Rambler เป็นการผสานกลยุทธ์ของบริษัทในการเปลี่ยนแปลงประสบการณ์ผู้ใช้ผ่าน AI เชิงสร้างสรรค์ โครงการนี้ซึ่งประกาศเมื่อเดือนพฤษภาคม โดยเก็บรายละเอียดการปฏิบัติงานไว้เฉพาะในห้องปฏิบัติการเท่านั้น จนกระทั่งเกิดการรั่วไหลครั้งล่าสุด แป้นพิมพ์เสมือนทำหน้าที่เป็นจุดหลักในการโต้ตอบสำหรับการป้อนข้อมูลจากอุปกรณ์นับพันล้านเครื่อง การอัปเดตจะเปลี่ยนแอปยูทิลิตี้ให้กลายเป็นผู้ช่วยเขียน

การใช้ตรา Gemini Intelligence สร้างความได้เปรียบทางการแข่งขันโดยตรงกับโซลูชันดั้งเดิมที่พัฒนาโดย Apple การต่อสู้เพื่ออำนาจเหนือในเครื่องมือเพิ่มประสิทธิภาพการทำงานบนมือถือถือเป็นบทใหม่ที่มีการถอดเสียงตามบริบทฟรี ผู้ผลิต Android พยายามที่จะสร้างมาตรฐานให้กับประสบการณ์การพิมพ์อัจฉริยะ ซึ่งเหนือกว่าการดัดแปลงซอฟต์แวร์ที่ผู้ผลิตรถยนต์ในเอเชียนำมาใช้ คีย์บอร์ดแบบรวมช่วยให้มั่นใจได้ถึงนวัตกรรมที่เกิดขึ้นพร้อมกัน

นักวิเคราะห์คาดการณ์ว่าการจำหน่ายผลิตภัณฑ์ใหม่จะเกิดขึ้นในระยะต่างๆ เพื่อรับประกันความเสถียรของเซิร์ฟเวอร์ ความคาดหวังคือสมาร์ทโฟนในตระกูล Pixel จะได้รับฟีเจอร์นี้โดยเฉพาะในช่วงแรกๆ การขยายไปสู่อุปกรณ์อื่นๆ ที่รองรับระบบปฏิบัติการควรจะค่อยๆ เกิดขึ้น กำหนดการที่เซช่วยให้วิศวกรสามารถแก้ไขข้อบกพร่องใดๆ ก่อนเผยแพร่สู่สาธารณะ

To Top