ปัญญาประดิษฐ์ Google Gemini เริ่มดำเนินการคำสั่งที่ซับซ้อนบน WhatsApp สำหรับ Android

Aplicativo WhatsApp

Aplicativo WhatsApp - Foto: Worawee Meepian / Shutterstock.com

Google Gemini ได้รับการอัปเดตที่อนุญาตให้เชื่อมต่อโดยตรงกับ WhatsApp บนอุปกรณ์ที่ติดตั้งระบบปฏิบัติการ Android ความแปลกใหม่เปลี่ยนแปลงพลวัตของการใช้งาน ฟังก์ชันการทำงานใหม่นี้จะเปลี่ยนปัญญาประดิษฐ์ให้กลายเป็นตัวแทนที่สามารถทำงานที่ซับซ้อนได้ นอกเหนือไปจากการตอบคำถามหรือป้อนข้อความตามคำบอก คุณสมบัตินี้ทำให้สามารถส่งข้อความ ดึงข้อมูลจากแอพพลิเคชั่นอื่น และดำเนินการคำสั่งแบบเรียลไทม์โดยไม่จำเป็นต้องสลับระหว่างแพลตฟอร์มต่างๆ บนหน้าจอโทรศัพท์มือถือ

การเปลี่ยนแปลงนี้แสดงถึงความก้าวหน้าในวิธีที่ผู้ใช้โต้ตอบกับสมาร์ทโฟนของตน ทำให้เกิดการสื่อสารที่ลื่นไหลระหว่างบริการต่างๆ การบูรณาการทำหน้าที่เป็นสะพานเทคโนโลยีที่ช่วยให้ปัญญาประดิษฐ์สามารถเข้าถึงข้อมูลจากเครื่องมือเช่น Google Keep และ Google Maps เพื่อกำหนดการจัดส่งอัตโนมัติใน Messenger ของ Meta ผู้เชี่ยวชาญด้านเทคโนโลยีชี้ให้เห็นว่าการเคลื่อนไหวนี้เป็นการรวมการเปลี่ยนจากผู้ช่วยด้านเสียงแบบเก่าไปเป็นเจ้าหน้าที่เพิ่มประสิทธิภาพการทำงานแบบอัตโนมัติ

การกำหนดค่าต้องมีการเปิดใช้งานด้วยตนเองในระบบปฏิบัติการ

การเปิดตัวทรัพยากรจะไม่เกิดขึ้นโดยอัตโนมัติสำหรับผู้ใช้ทั้งหมด การกำหนดค่าจำเป็นต้องเข้าถึงแอปพลิเคชัน Google Gemini ที่ติดตั้งบนสมาร์ทโฟนโดยตรง บริษัทยืนยันว่าฟีเจอร์ใหม่นี้มีเฉพาะในระบบนิเวศของ Android เท่านั้น ทำให้เจ้าของ iPhone อยู่ในขั้นตอนการใช้งานเบื้องต้นนี้ ปัญญาประดิษฐ์เวอร์ชันเว็บไม่รองรับฟังก์ชันเฉพาะนี้เช่นกัน

หากต้องการเปิดใช้งานการสื่อสารระหว่างแอปพลิเคชัน เจ้าของอุปกรณ์จำเป็นต้องดำเนินการตามขั้นตอนภายในเมนูการตั้งค่า กระบวนการนี้ทำให้มั่นใจได้ว่าผู้ใช้ให้สิทธิ์ที่จำเป็นสำหรับปัญญาประดิษฐ์ในการเข้าถึงเนื้อหาของการสนทนาและสามารถส่งข้อความในนามของพวกเขาได้ เส้นทางการเปิดใช้งานเป็นไปตามคำสั่งเฉพาะที่กำหนดโดยนักพัฒนา:

  • เปิดแอป Google Gemini บนโทรศัพท์มือถือของคุณ
  • เข้าถึงไอคอนโปรไฟล์ผู้ใช้และเข้าสู่แท็บการตั้งค่า
  • ไปที่ส่วนที่เรียกว่า Personal Intelligence และเลือกแอปการเชื่อมต่อ
  • ค้นหาตัวเลือกสำหรับ WhatsApp และเปิดใช้งานปุ่มสลับ

หลังจากทำตามขั้นตอนเหล่านี้แล้ว ผู้ช่วยเสมือนจะได้รับอนุญาตจากระบบให้ทำงานร่วมกับ Messenger ได้ ข้อกำหนดสำหรับการเปิดใช้งานด้วยตนเองสะท้อนถึงนโยบายความเป็นส่วนตัวของระบบปฏิบัติการ ซึ่งต้องได้รับความยินยอมอย่างชัดเจนก่อนที่จะอนุญาตให้ซอฟต์แวร์บุคคลที่สามจัดการข้อมูลการสื่อสารส่วนบุคคล ระดับการรักษาความปลอดภัยนี้จะป้องกันไม่ให้เครื่องมือดำเนินการใดๆ ที่ไม่พึงประสงค์โดยไม่ได้รับความรู้จากผู้ดูแลระบบอุปกรณ์ก่อน

ความแตกต่างทางโครงสร้างเมื่อเทียบกับ Google Assistant รุ่นเก่า

การทำงานของระบบใหม่แตกต่างอย่างมากจากสถาปัตยกรรมที่ใช้โดยคำสั่งเสียงแบบเดิม Google Assistant รุ่นเก่าทำงานแยกกันภายในสภาพแวดล้อมของสมาร์ทโฟน เครื่องมือก่อนหน้านี้จำกัดอยู่เพียงการเขียนตามคำบอกข้อความหลังจากที่ผู้ใช้โทรหาผู้ติดต่อเฉพาะโดยใช้ชื่อที่ลงทะเบียนไว้ในปฏิทิน มีข้อจำกัดทางเทคนิคที่รุนแรงเกี่ยวกับความสามารถในการเข้าใจบริบทที่กว้างขึ้นหรือข้อมูลอ้างอิงโยงจากแหล่งต่างๆ

Google Gemini ทำงานภายใต้ตรรกะการบูรณาการอย่างต่อเนื่อง ปัญญาประดิษฐ์ทำงานเป็นตัวเชื่อมโยงระหว่างแอปพลิเคชั่นหลายตัวที่ติดตั้งบนโทรศัพท์มือถือ ซอฟต์แวร์สามารถเข้าถึงปฏิทิน แผ่นจดบันทึก และบริการระบุตำแหน่งทางภูมิศาสตร์ไปพร้อมๆ กัน ในขณะที่ยังคงรักษาอินเทอร์เฟซการส่งข้อความให้พร้อมใช้งาน ความสามารถในการประมวลผลแบบขนานนี้เปลี่ยนเครื่องมือให้เป็นตัวแทนที่สามารถจัดการเวิร์กโฟลว์ที่ต้องใช้หลายขั้นตอน รวมทุกอย่างไว้ในคำสั่งเสียงเดียว

วิวัฒนาการทางเทคโนโลยีที่อยู่เบื้องหลังการเปลี่ยนแปลงนี้เกี่ยวข้องกับการใช้แบบจำลองภาษาขนาดใหญ่ อัลกอริธึมเหล่านี้จะประมวลผลความตั้งใจของผู้ใช้ด้วยความแม่นยำมากขึ้น โดยระบุว่าแอปพลิเคชันใดที่ต้องถูกกระตุ้นเพื่อตอบสนองคำสั่งซื้อ ผลลัพธ์ที่ได้คือประสบการณ์ผู้ใช้ที่เป็นธรรมชาติมากขึ้น เครื่องจะเข้ามาทำหน้าที่เปิด คัดลอก วาง และปิดหน้าต่าง โดยส่งเฉพาะผลลัพธ์สุดท้ายไปยังหน้าจอแชท

กรณีการใช้งานเกี่ยวข้องกับการข้ามข้อมูลแบบเรียลไทม์

การประยุกต์ใช้เทคโนโลยีนี้ในทางปฏิบัติจะเปลี่ยนไดนามิกของงานในแต่ละวัน ในสถานการณ์การแชร์ไฟล์ทั่วไป กระบวนการที่ต้องดำเนินการด้วยตนเองจะต้องให้บุคคลออกจากระบบ WhatsApp เปิด Google Keep ค้นหาบันทึกย่อที่ต้องการ คัดลอกข้อความไปยังคลิปบอร์ด และกลับไปที่ Messenger เพื่อวางเนื้อหา ด้วยการอัปเดตใหม่ ผู้ใช้เพียงแค่ต้องกำหนดประโยค: “รับสูตรพิซซ่าของฉันจาก Google Keep และส่งไปที่ Mark บน WhatsApp”

ดูเพิ่มเติม

Google Gemini ดำเนินการตามลำดับการกระทำทั้งหมดในเบื้องหลัง เครื่องมือจะดึงเอกสารที่ร้องขอ จัดรูปแบบข้อความให้ชัดเจน และเตรียมการส่งในแอป Meta ด้วยการแตะเพียงครั้งเดียวเพื่อยืนยัน ตรรกะเดียวกันนี้ใช้กับการแชร์เส้นทางและที่ตั้งทางภูมิศาสตร์ ในขณะที่วางแผนการเดินทาง บุคคลอาจร้องขอ: “ค้นหาระยะทางจากบ้านของฉันไปยังเดย์โทนาบีช และส่งรายละเอียดไปให้เพื่อนของฉันทาง WhatsApp”

เมื่อได้รับคำแนะนำนี้ ผู้ช่วยจะปรึกษาฐานข้อมูล Google Maps ทันที ระบบจะคำนวณเส้นทางที่มีประสิทธิภาพสูงสุด ดึงข้อมูลที่จำเป็นเกี่ยวกับเส้นทาง จัดโครงสร้างข้อความในลักษณะที่อ่านง่าย และเปิดหน้าต่างการสนทนาที่เกี่ยวข้องใน Messenger ความแตกต่างพื้นฐานอยู่ที่การเปลี่ยนจากตัวแปลงคำพูดเป็นข้อความธรรมดาไปเป็นเอเจนต์ปัญญาประดิษฐ์ที่จัดการข้อมูลข้ามแพลตฟอร์มโดยอัตโนมัติ

การใช้งานคำสั่งเสียงมาบนแดชบอร์ด Android Auto

การบูรณาการระหว่างบริการต่างๆ ยังขยายไปสู่สภาพแวดล้อมของยานยนต์ผ่านระบบ Android Auto ผู้ขับขี่สามารถเปิดใช้งานไมโครโฟนได้โดยตรงบนแผงมีเดียของรถ หรือกดปุ่มคำสั่งเสียงที่อยู่บนพวงมาลัยเพื่อออกคำสั่งตามธรรมชาติ ระหว่างการเดินทางกลับจากที่ทำงาน คนขับสามารถเปิดใช้งานระบบและพูดว่า: “ส่งข้อความบน WhatsApp ไปยัง Sonal โดยบอกว่าฉันจะไปถึงในอีกประมาณ 10 นาที”

คอมพิวเตอร์ออนบอร์ดประมวลผลคำพูดทันที ระบบจะยืนยันการดำเนินการที่ร้องขอผ่านอินเทอร์เฟซภาพและเสียงของ Android Auto แล้วส่งข้อความ ขั้นตอนทั้งหมดเกิดขึ้นโดยที่ผู้ใช้ไม่ต้องละสายตาจากถนนหรือสัมผัสหน้าจอโทรศัพท์มือถือ การรักษาความปลอดภัยทางถนนเป็นหนึ่งในจุดสนใจหลักของการดำเนินการนี้ โดยไม่จำเป็นต้องโต้ตอบกับอุปกรณ์ด้วยตนเองขณะขับรถ

ผู้เชี่ยวชาญด้านความปลอดภัยทางถนนประเมินว่าคำสั่งเสียงที่ได้รับการปรับปรุงช่วยลดสิ่งรบกวนหลังพวงมาลัยได้อย่างมาก ความสามารถของ Google Gemini ในการเข้าใจประโยคที่ซับซ้อนในครั้งแรกช่วยลดความคับข้องใจที่มักเกิดขึ้นกับผู้ช่วยรุ่นเก่า เวอร์ชันก่อนหน้านี้มักต้องใช้คำสั่งซ้ำหรือแก้ไขคำที่ซอฟต์แวร์ตีความผิดด้วยตนเอง

การขยายระบบนิเวศครอบคลุมแพลตฟอร์มของบุคคลที่สามอื่นๆ

การเปิดใช้งานคีย์ WhatsApp ในส่วนข่าวกรองส่วนบุคคลของ Google Gemini จะแปลงผู้ช่วยจากความแปลกใหม่ทางเทคโนโลยีที่เรียบง่ายให้กลายเป็นศูนย์บัญชาการที่ใช้งานได้จริงสำหรับชีวิตประจำวัน บริษัทสนับสนุนให้ผู้ใช้สำรวจเมนูส่วนขยายของแอปพลิเคชันเพื่อค้นพบวิธีใหม่ๆ ในการทำงานประจำโดยอัตโนมัติ การส่งข้อความผ่านคำสั่งเสียงที่ซับซ้อนเป็นเพียงระยะเริ่มต้นของโครงการการเชื่อมต่อที่กว้างขึ้น

นอกเหนือจากความร่วมมือด้านการทำงานกับผู้ส่งสารของ Meta แล้ว Google Gemini ยังแสดงให้เห็นถึงความเข้ากันได้ที่เพิ่มขึ้นกับเครื่องมืออื่น ๆ ที่พัฒนาโดยบุคคลที่สาม ระบบมีการผสานรวมกับแพลตฟอร์มสตรีมมิ่งเสียง เช่น Spotify อยู่แล้ว ทำให้สามารถควบคุมเพลงและการเล่นพอดแคสต์ขั้นสูงได้ สถาปัตยกรรมแบบเปิดของระบบปฏิบัติการ Android แสดงให้เห็นว่าแอปพลิเคชันใหม่มีแนวโน้มที่จะใช้โปรโตคอลที่คล้ายกันในอีกไม่กี่เดือนข้างหน้า

การรวมตัวแทนปัญญาประดิษฐ์บนอุปกรณ์เคลื่อนที่บ่งชี้ถึงการเปลี่ยนแปลงในกระบวนทัศน์การออกแบบซอฟต์แวร์ แอปพลิเคชันไม่ได้แยกเกาะแห่งข้อมูลอีกต่อไป และเริ่มทำหน้าที่เป็นฟันเฟืองในระบบนิเวศที่เชื่อมโยงถึงกัน Google ยังคงมุ่งเน้นไปที่การปรับปรุงความสามารถในการทำความเข้าใจบริบทของ Gemini โดยมีเป้าหมายเพื่อให้การตอบสนองที่แม่นยำยิ่งขึ้นและการดำเนินการที่รวดเร็วยิ่งขึ้นแก่ฐานผู้ใช้ทั่วโลกของระบบมือถือ

ดูเพิ่มเติม