Google กำลังก้าวหน้าในการพัฒนาการอัปเดตโครงสร้างสำหรับแป้นพิมพ์เสมือนอย่างเป็นทางการที่มุ่งเป้าไปที่อุปกรณ์มือถือ บริษัทเทคโนโลยีกำลังเตรียมการบูรณาการดั้งเดิมของเครื่องมือ Rambler กับ Gboard โดยใช้ฐานข้อมูล Gemini Intelligence เพื่อกำหนดรูปแบบระบบการเขียนตามคำบอกด้วยเสียงบนสมาร์ทโฟน คุณลักษณะใหม่ถูกระบุในไฟล์ภายในของแอปพลิเคชันเวอร์ชันล่าสุด และวัตถุประสงค์หลักคือเพื่อแก้ไขความล้มเหลวในการถอดเสียงอัตโนมัติแบบเรื้อรังที่ผู้ใช้ต้องเผชิญระหว่างการสื่อสารรายวัน
การยืนยันทางเทคนิคของโครงการเกิดขึ้นหลังจากผู้เชี่ยวชาญด้านซอฟต์แวร์วิเคราะห์แพ็คเกจการติดตั้งแอปพลิเคชันสำหรับระบบปฏิบัติการ Android การบังคับให้เปิดใช้งานรหัสที่ซ่อนอยู่เผยให้เห็นเมนูที่ไม่เคยมีมาก่อนซึ่งมีไว้สำหรับการปรับแต่งการบันทึกเสียงโดยเฉพาะ ซึ่งบ่งชี้ว่าการเปิดตัวฟังก์ชันสำหรับประชาชนทั่วไปกำลังใกล้เข้ามา กลไกใช้โมเดลภาษาขั้นสูงเพื่อตีความบริบทของประโยคแบบเรียลไทม์ เอาชนะข้อจำกัดของผู้ถอดเสียงแบบดั้งเดิมที่แปลงเสียงที่แยกออกมาเป็นข้อความที่เขียนเท่านั้น
การค้นพบในไฟล์ Android เผยอินเทอร์เฟซการจับภาพใหม่
พอร์ทัลเฉพาะของ Android Authority ได้ทำการทดสอบภาคปฏิบัติซึ่งเปิดเผยบรรทัดคำสั่งที่รับผิดชอบในการสนับสนุนปัญญาประดิษฐ์ใหม่ของแป้นพิมพ์ วิศวกรใช้เทคนิควิศวกรรมย้อนกลับเพื่อหลีกเลี่ยงอุปสรรคในการพัฒนาและเข้าถึงอินเทอร์เฟซแบบกราฟิกที่จะแจกจ่ายให้กับผู้บริโภค ขั้นตอนแบบแมนนวลแสดงให้เห็นว่าโครงสร้างพื้นฐานของระบบอยู่ในขั้นตอนขั้นสูงของการสุกงอมภายในเซิร์ฟเวอร์ของบริษัทแล้ว
หน้าจอการกำหนดค่าที่แสดงโดยการสแกนโค้ดจะแสดงช่องทำเครื่องหมายเฉพาะสำหรับการประมวลผลเสียงอัจฉริยะ สถาปัตยกรรมซอฟต์แวร์ชี้ไปที่การดำเนินการแบบไฮบริด ซึ่งส่วนสำคัญของการตีความข้อมูลเกิดขึ้นโดยตรงบนฮาร์ดแวร์ของโทรศัพท์มือถือ วิธีการทางเทคนิคนี้ช่วยลดการพึ่งพาการเชื่อมต่ออินเทอร์เน็ตที่ไม่สะดุด เวลาตอบสนองระหว่างผู้ใช้พูดและคำที่ปรากฏบนหน้าจอจะลดลงอย่างมาก
การเปลี่ยนจากโมเดลที่พึ่งพาคลาวด์โดยสิ้นเชิงไปเป็นระบบประมวลผลในเครื่อง สะท้อนให้เห็นถึงนวัตกรรมล่าสุดในชิปสำหรับอุปกรณ์มือถือ โปรเซสเซอร์สมัยใหม่มีหน่วยประมวลผลประสาทสำหรับงานการเรียนรู้ของเครื่องโดยเฉพาะ แป้นพิมพ์ Gboard ใช้ประโยชน์จากความจุของฮาร์ดแวร์นี้เพื่อเรียกใช้อัลกอริธึมการรู้จำเสียงที่ซับซ้อน โดยไม่เปลืองแบตเตอรี่ของสมาร์ทโฟนหรือใช้ข้อมูลมือถือมากเกินไป
เทคโนโลยีเสียงช่วยลดการหยุดชั่วคราวและจัดโครงสร้างไวยากรณ์
ความแตกต่างระหว่างระบบ Rambler และความสามารถในการเข้าใจกระแสความคิดของมนุษย์ตามธรรมชาติในระหว่างการสร้างประโยคยาวๆ ปัญญาประดิษฐ์ทำหน้าที่เป็นตัวพิสูจน์อักษรทันที ระบบช่วยให้บุคคลกำหนดเนื้อหาได้อย่างต่อเนื่อง โดยไม่จำเป็นต้องพูดคำสั่งเครื่องหมายวรรคตอนหรือหยุดชั่วคราวเพื่อแก้ไขข้อผิดพลาดในการออกเสียง อัลกอริธึมจะรับผิดชอบในการจัดโครงสร้างข้อความสุดท้ายด้วยการเชื่อมโยงทางวากยสัมพันธ์และความลื่นไหลในการอ่าน
ตัวประมวลผลข้อมูลในตัวของ Gboard ทำหน้าที่แก้ไขหลายอย่างพร้อมกันในขณะที่ไมโครโฟนยังคงทำงานอยู่ การปรับปรุงที่ใช้กับข้อความประกอบด้วย:
- กำจัดความลังเลด้านเสียง การติดอ่าง และการซ้ำพยางค์โดยไม่สมัครใจทันทีในระหว่างการพูด
- การกรองเสียงรบกวนพื้นหลังโดยอัตโนมัติและการยกเว้นการหยุดชั่วคราวระหว่างคำที่เขียนตามคำบอก
- การแทรกจุด เครื่องหมายจุลภาค และเครื่องหมายคำถาม โดยพิจารณาจากการวิเคราะห์บริบทของประโยค
- การแก้ไขข้อตกลงทางวาจาและเล็กน้อยโดยไม่แก้ไขความหมายดั้งเดิมของข้อความที่ส่ง
- การปรับไวยากรณ์ทั่วไปเพื่อให้มีความชัดเจนมากขึ้นเมื่ออ่านอย่างรวดเร็วในแอปพลิเคชันการรับส่งข้อความ
โมเดลภาษาได้รับการปรับเทียบเพื่อปรับแต่งการเขียนโดยไม่ต้องพาสเจอร์ไรส์ตัวตนของผู้ส่ง ระบบจะรักษาการใช้คำสแลง สำนวนภูมิภาค และลักษณะคำศัพท์ของคำศัพท์ส่วนตัวของผู้ใช้ ประสิทธิภาพของปัญญาประดิษฐ์มุ่งเน้นไปที่การขจัดข้อบกพร่องทางภาษาตามแบบฉบับของการสื่อสารด้วยวาจาแบบด้นสดอย่างเคร่งครัด ผลลัพธ์ที่ส่งไปยังหน้าจอการพิมพ์จะดูสวยงามและพร้อมสำหรับการส่งทันที
การประมวลผลภายในช่วยเพิ่มความปลอดภัยของข้อมูลบนอุปกรณ์มือถือ
การตัดสินใจประมวลผลเสียงในเครื่องถือเป็นความก้าวหน้าทางเทคนิคที่สำคัญในการปกป้องข้อมูลส่วนบุคคลของผู้ใช้ โมเดลการถอดเสียงก่อนหน้านี้จำเป็นต้องส่งแพ็กเก็ตเสียงไปยังเซิร์ฟเวอร์ของบริษัทอย่างต่อเนื่อง การปฏิบัตินี้ทำให้เกิดคำถามบ่อยครั้งเกี่ยวกับความเป็นส่วนตัวของการสนทนาส่วนตัว การบูรณาการ Gemini Intelligence เข้ากับแอปพลิเคชันโดยตรงช่วยให้การวิเคราะห์คำศัพท์เกิดขึ้นภายในโปรเซสเซอร์ของสมาร์ทโฟนเอง โดยแยกข้อมูลจากสภาพแวดล้อมภายนอก
ผู้เชี่ยวชาญด้านความปลอดภัยทางดิจิทัลชี้ให้เห็นว่าการเปลี่ยนแปลงในกระบวนทัศน์ทางสถาปัตยกรรมนี้เป็นไปตามข้อกำหนดด้านกฎระเบียบระดับโลกใหม่ที่เกี่ยวข้องกับการประมวลผลข้อมูลไบโอเมตริกซ์ ด้วยการจำกัดการประมวลผลไว้เฉพาะในอุปกรณ์ Google จึงลดความเสี่ยงของการดักฟังเสียงระหว่างการส่งสัญญาณ บริษัทยังลดต้นทุนการดำเนินงานด้วยโครงสร้างพื้นฐานคลาวด์ ประสิทธิภาพการใช้พลังงานของโปรเซสเซอร์โมบายล์ใหม่ทำให้สามารถรันโครงข่ายประสาทเทียมที่ซับซ้อนได้ โดยไม่กระทบต่อประสิทธิภาพโดยรวมของอุปกรณ์
วิวัฒนาการของการจดจำเสียงมาพร้อมกับความต้องการการเข้าถึงระบบดิจิทัลที่เพิ่มขึ้น เครื่องมือเขียนตามคำบอกที่แม่นยำทำให้การสื่อสารง่ายขึ้นสำหรับผู้ที่มีปัญหาด้านการเคลื่อนไหวหรือความบกพร่องทางการมองเห็น การปรับปรุงอย่างต่อเนื่องของ Gboard ช่วยให้มั่นใจได้ว่าประชากรส่วนใหญ่สามารถโต้ตอบกับแพลตฟอร์มดิจิทัลได้อย่างมีประสิทธิภาพ ความแม่นยำทางไวยากรณ์อัตโนมัติช่วยขจัดอุปสรรคในการสื่อสารในสภาพแวดล้อมทางวิชาชีพและทางวิชาการ
กลยุทธ์ของบริษัทมุ่งเน้นไปที่ความพิเศษเบื้องต้นสำหรับกลุ่มผลิตภัณฑ์ Pixel
การใช้งาน Rambler บน Gboard เป็นการผสานกลยุทธ์ของ Google ในการเปลี่ยนแปลงระบบนิเวศของ Android ผ่านเครื่องมือที่ใช้ปัญญาประดิษฐ์เชิงสร้างสรรค์ โครงการนี้เป็นส่วนหนึ่งของความพยายามที่ยิ่งใหญ่กว่าในการรวมบริการของบริษัทไว้ภายใต้กลุ่ม Gemini Intelligence แป้นพิมพ์เสมือนทำหน้าที่เป็นจุดหลักของการโต้ตอบด้วยข้อความบนอุปกรณ์ที่ใช้งานนับพันล้านเครื่อง เครื่องมือนี้กลายเป็นเครื่องมือในอุดมคติสำหรับการขยายเทคโนโลยีการประมวลผลภาษาธรรมชาติใหม่ๆ
บริษัทพยายามที่จะสร้างความได้เปรียบทางการแข่งขันโดยตรงกับโซลูชั่นดั้งเดิมที่พัฒนาโดย Apple และผู้ผลิตในเอเชียที่ใช้ระบบปฏิบัติการเวอร์ชันดัดแปลง ความแม่นยำในการถอดเสียงกลายเป็นตัวเปลี่ยนเกมสำหรับผู้บริโภคที่ต้องพึ่งพาผู้ช่วยเสมือนเพื่อประสิทธิภาพการทำงานในแต่ละวัน การปรับปรุงแป้นพิมพ์อย่างเป็นทางการให้ทันสมัยมีจุดมุ่งหมายเพื่อรักษาผู้ใช้ไว้ในระบบนิเวศของแอปบุคคลที่หนึ่งของบริษัท ป้องกันการโยกย้ายไปยังแป้นพิมพ์ของบุคคลที่สามที่มีอยู่ใน App Store
นักวิเคราะห์ตลาดเทคโนโลยีคาดการณ์ว่าฟังก์ชันดังกล่าวจะเปิดตัวเฉพาะสำหรับสมาร์ทโฟนกลุ่ม Pixel เท่านั้น กลยุทธ์การเปิดตัวแบบควบคุมช่วยให้นักพัฒนาสามารถตรวจสอบประสิทธิภาพของอัลกอริทึมบนฮาร์ดแวร์ที่ได้รับการปรับปรุงก่อนขยายการเข้าถึง ความพร้อมใช้งานของอุปกรณ์จากแบรนด์อื่นที่ใช้ระบบ Android น่าจะค่อยๆ เกิดขึ้น กำหนดการเปิดตัวจะขึ้นอยู่กับความสมบูรณ์ของช่วงการทดสอบขนาดใหญ่ และการรักษาเสถียรภาพของแพ็คเกจอัปเดตบนเซิร์ฟเวอร์ทั่วโลกของบริษัท