ปัญญาประดิษฐ์ของ Google Meet แปลเสียงแบบเรียลไทม์ด้วยเสียงต้นฉบับบนโทรศัพท์มือถือ

Google Meet

Google Meet -Saitee / Shutterstock.com

แอป Google Meet เริ่มเปิดตัวเครื่องมือแปลด้วยเสียงแบบเรียลไทม์ใหม่สำหรับอุปกรณ์ Android และ iOS ฟังก์ชั่นนี้ใช้โมเดลปัญญาประดิษฐ์ Gemini เพื่อประมวลผลคำพูดของผู้เข้าร่วมเกือบจะในทันที ทรัพยากรได้รับการดำเนินการในเวอร์ชันสำหรับเว็บเบราว์เซอร์แล้วตั้งแต่ปีที่แล้ว การอัปเดตนี้ช่วยให้ผู้ใช้ฟังเสียงที่แปลได้โดยตรงบนลำโพงหรือหูฟังที่เชื่อมต่อกับสมาร์ทโฟนและแท็บเล็ต ในตอนแรกระบบรองรับคู่แบบสองทิศทางระหว่างภาษาอังกฤษและภาษาอื่น ๆ ที่ใช้กันอย่างแพร่หลายในสภาพแวดล้อมขององค์กร

เทคโนโลยีนี้ก้าวไปไกลกว่ารูปแบบคำบรรยายอัตโนมัติแบบดั้งเดิมโดยการสร้างเสียงที่รักษาลักษณะเสียงของผู้ออกอากาศ เครื่องมือนี้จะรักษาน้ำเสียง เน้นคำ และจังหวะดั้งเดิมของผู้พูด ผลลัพธ์ที่ได้จะสร้างประสบการณ์การสื่อสารที่ลื่นไหลมากขึ้นในระหว่างการประชุมทางวิดีโอ เสียงที่แปลทำงานเหมือนกับเสียงพากย์มืออาชีพ ในขณะที่เสียงต้นฉบับของผู้เข้าร่วมยังคงได้ยินได้ในระดับเสียงที่เบากว่ามากในพื้นหลังของการโทร

Google Meet – รูปภาพ: Thaspol Sangsee / Shutterstock.com

การประมวลผลเสียงและกำหนดการอัปเดต

การแปลพร้อมกันดำเนินการผ่านสตรีมข้อมูลต่อเนื่องที่ประมวลผลเสียงต้นฉบับและส่งเวอร์ชันที่แปลในหน่วยมิลลิวินาที ผู้เข้าร่วมประชุมเปิดใช้งานการตั้งค่าในแผงควบคุมและเลือกภาษาเป้าหมายที่ต้องการ ระบบจะบันทึกคำพูดที่ได้รับ วิเคราะห์บริบทของประโยค และทำซ้ำเนื้อหาในภาษาที่ผู้ฟังเลือก แนวทางด้านเทคนิคช่วยลดอุปสรรคด้านภาษาในทีมข้ามชาติ ผู้เชี่ยวชาญที่ไม่ได้ใช้ภาษาเดียวกันจะสามารถโต้ตอบด้วยความชัดเจนมากขึ้นและความล่าช้าในการทำความเข้าใจข้อความน้อยลง

กำหนดการเปิดตัวฟีเจอร์จะค่อยๆ เกิดขึ้นสำหรับฐานผู้ใช้ทั่วโลกทั้งหมด โดเมนที่กำหนดค่าด้วยโปรไฟล์การเผยแพร่อย่างรวดเร็วเริ่มได้รับการอัปเดตในแอปพลิเคชันบนมือถือตั้งแต่วันที่ 8 เมษายน 2026 โดเมนองค์กรที่ใช้รูปแบบการเผยแพร่ตามกำหนดการจะสามารถเข้าถึงเครื่องมือได้ตั้งแต่วันที่ 23 เมษายน 2026 ความพร้อมใช้งานขั้นสุดท้ายของฟังก์ชันจะขึ้นอยู่กับการติดตั้งแอปพลิเคชันเวอร์ชันล่าสุด ซึ่งจะต้องดาวน์โหลดโดยตรงจาก Google Play Store หรือ App Store อย่างเป็นทางการ

ภาษาที่รองรับและการพัฒนาเทมเพลต

การสนับสนุนทางเทคนิคในปัจจุบันครอบคลุมคู่การแปลสองทางระหว่างภาษาอังกฤษและภาษาสากลอื่นๆ อีกห้าภาษา รายการความเข้ากันได้เบื้องต้นประกอบด้วยภาษาสเปน ฝรั่งเศส เยอรมัน โปรตุเกส และอิตาลี ความครอบคลุมทางภาษาครอบคลุมส่วนสำคัญของการสื่อสารระหว่างประเทศที่ดำเนินการในสภาพแวดล้อมขององค์กร สถาบันการศึกษา และการเจรจาเชิงพาณิชย์ การเลือกภาษาเหล่านี้สะท้อนถึงความต้องการบริการการประชุมทางวิดีโอของบริษัทจากตลาดผู้บริโภคหลัก

ทีมพัฒนารายงานว่าชุดภาษาใหม่จะเข้าสู่แค็ตตาล็อกแอปพลิเคชันในอีกไม่กี่เดือนข้างหน้า ภาษาตุรกีจะปรากฏเป็นการรวมที่ได้รับการยืนยันครั้งถัดไปในแผนงานการอัปเดตของระบบ วิศวกรทำงานเพื่อปรับปรุงโมเดลปัญญาประดิษฐ์เพื่อให้แน่ใจว่ามีความแม่นยำมากขึ้นในการตรวจจับความแตกต่างในระดับภูมิภาค การประมวลผลสำนวนท้องถิ่นและคำสแลงยังได้รับการปรับปรุงทางเทคนิคเพื่อยกระดับคุณภาพโดยรวมของการแปลที่ส่งมอบให้กับผู้ใช้อุปกรณ์เคลื่อนที่

ข้อกำหนดการเข้าถึงและนโยบายความเป็นส่วนตัว

การใช้การแปลด้วยเสียงต้องมีลิงก์ไปยังแผนระบบนิเวศของ Google Workspace หรือการสมัครใช้บริการที่เน้นเรื่องเครื่องมือปัญญาประดิษฐ์ แพ็คเกจองค์กรที่มีสิทธิ์ประกอบด้วยหมวดหมู่ Business Standard, Business Plus, Enterprise Standard และ Enterprise Plus ตัวเลือกการสมัครส่วนบุคคล เช่น Google AI Pro และ Ultra ยังเปิดตัวฟังก์ชันการทำงานบนโทรศัพท์มือถืออีกด้วย สถาบันการศึกษาที่ลงทะเบียนกับแผน Education Plus จะมีสิทธิ์เข้าถึงฟีเจอร์การพากย์พร้อมกันโดยสมบูรณ์

ดูเพิ่มเติม

การเปลี่ยนแปลงในการดำเนินงานของเครื่องมือกำหนดให้ผู้เข้าร่วมการโทรเพียงรายเดียวเท่านั้นที่มีแผนที่มีสิทธิ์ที่ใช้งานอยู่ในบัญชีของตน การมีผู้สมัครสมาชิกเพียงรายเดียวในห้องเสมือนทำให้สมาชิกคนอื่นๆ ทั้งหมดในการประชุมใช้การแปลได้โดยไม่จำเป็นต้องซื้อใบอนุญาตส่วนบุคคลเพิ่มเติม รูปแบบนี้อำนวยความสะดวกในการสื่อสารกับลูกค้าภายนอกและคู่ค้าทางธุรกิจที่ใช้บัญชีฟรี

สถาปัตยกรรมความปลอดภัยของแอปพลิเคชันกำหนดแนวทางที่เข้มงวดสำหรับการใช้เทคโนโลยีการประมวลผลเสียงพูดในระหว่างแฮงเอาท์วิดีโอขององค์กรและเพื่อการศึกษา:

  • การเปิดใช้งานเครื่องมือต้องได้รับความยินยอมอย่างชัดแจ้งจากผู้ใช้ผ่านปุ่มอนุญาตบนหน้าจอโทรศัพท์มือถือ
  • ผู้เข้าร่วมยังคงควบคุมอย่างเต็มที่ในการเพิกถอนการอนุญาตการแปลได้ตลอดเวลาระหว่างการโทร
  • ผู้ดูแลระบบเทคโนโลยีสารสนเทศมีแผงควบคุมเพื่อบล็อกทรัพยากรทั่วทั้งโครงสร้างพื้นฐานของบริษัท
  • การประมวลผลข้อมูลเสียงเป็นไปตามโปรโตคอลการเข้ารหัสเพื่อหลีกเลี่ยงการจัดเก็บการสนทนาที่ไม่เหมาะสมบนเซิร์ฟเวอร์

กรอบความเป็นส่วนตัวทำให้มั่นใจได้ว่าข้อมูลที่ละเอียดอ่อนที่กล่าวถึงในการประชุมยังคงได้รับการคุ้มครองภายใต้นโยบายการปฏิบัติตามข้อกำหนดของแพลตฟอร์ม บริษัทที่รับผิดชอบแอปพลิเคชันจะดำเนินการตรวจสอบเป็นประจำเพื่อให้แน่ใจว่าโมเดลปัญญาประดิษฐ์จะไม่เก็บเศษเสียงไว้หลังจากการประชุมทางวิดีโอสิ้นสุดลง

การกำหนดค่าเครื่องมือบนอุปกรณ์เคลื่อนที่

กระบวนการเปิดใช้งานการพากย์แบบเรียลไทม์เกิดขึ้นโดยตรงในอินเทอร์เฟซหลักของแอปพลิเคชันระหว่างการโทรที่กำลังสนทนาอยู่ ผู้ใช้ที่เข้าร่วมห้องประชุมผ่านโทรศัพท์มือถือหรือแท็บเล็ตจะต้องแตะไอคอนสามจุดที่ด้านล่างของหน้าจอ เมนูตัวเลือกเพิ่มเติมจะแสดงแท็บการตั้งค่าทั่วไปของแอปพลิเคชัน ผู้เข้าร่วมจะต้องค้นหาส่วนการแปลด้วยเสียงและเปิดใช้งานสวิตช์เสมือนเพื่อเริ่มการประมวลผลเสียง

การไม่มีตัวเลือกในเมนูการตั้งค่าแสดงว่าอุปกรณ์ยังคงใช้งานซอฟต์แวร์เวอร์ชันล้าสมัย ผู้ใช้จะต้องเข้าถึง Application Store ของระบบปฏิบัติการของตน และตรวจสอบความพร้อมใช้งานของแพ็คเกจอัพเดตที่เปิดตัวตั้งแต่เดือนเมษายน 2569 เป็นต้นไป การรีสตาร์ทแอปพลิเคชันหลังจากติดตั้งแพ็คเกจทำให้มั่นใจได้ว่าการโหลดโมดูลปัญญาประดิษฐ์ใหม่ที่รวมเข้ากับซอร์สโค้ดของโปรแกรมนั้นถูกต้อง

ผลกระทบต่อการสื่อสารทางไกลและการศึกษา

การมาถึงของฟังก์ชันการทำงานบนอุปกรณ์เคลื่อนที่ช่วยเพิ่มความเป็นไปได้ในการทำงานให้กับมืออาชีพที่ทำงานนอกสำนักงานแบบเดิมๆ ตัวแทนฝ่ายขาย ผู้ตรวจสอบภาคสนาม และผู้บริหารสามารถมีส่วนร่วมในการประชุมระหว่างประเทศที่ซับซ้อนได้โดยใช้เพียงการเชื่อมต่ออินเทอร์เน็ตบนมือถือและสมาร์ทโฟน นักเรียนที่ลงทะเบียนในหลักสูตรภาษาต่างประเทศหรือโครงการแลกเปลี่ยนเสมือนจริงยังพบเครื่องมือที่ให้การสนับสนุนภาคปฏิบัติสำหรับชั้นเรียนต่อไปนี้ที่สอนโดยครูเจ้าของภาษา

เทคโนโลยีในการรักษาน้ำเสียงต้นฉบับช่วยลดความรู้สึกเทียมที่พบได้ทั่วไปในระบบการแปลด้วยหุ่นยนต์ ความสามารถในการถ่ายทอดความตื่นเต้น ความจริงจัง หรือความประหลาดใจในเสียงที่แปล ช่วยให้คู่สนทนาใกล้ชิดกันมากขึ้น และปรับปรุงการตีความบริบททางอารมณ์ของการสนทนา กลยุทธ์ในการจัดลำดับความสำคัญของการพัฒนาโซลูชันโดยใช้ปัญญาประดิษฐ์จะรวมตำแหน่งของแอปพลิเคชันในตลาดที่มีการแข่งขันสำหรับแพลตฟอร์มการสื่อสารองค์กร โดยส่งมอบเครื่องมือที่ปรับเวลาและความชัดเจนของการโต้ตอบของมนุษย์ในระยะไกล

ดูเพิ่มเติม