Tailandês News

การอัปเดตของ Google แก้ไขเสียง Gemini Live และทำให้เกิดความแตกต่างในเสียงของผู้ช่วย

Gemini
Foto: Gemini - Primakov / Shutterstock.com

แอปพลิเคชันปัญญาประดิษฐ์ของบริษัทยักษ์ใหญ่ด้านเทคโนโลยีแห่งนี้ได้รับการปรับเปลี่ยนล่าสุด ซึ่งได้เปลี่ยนแปลงพฤติกรรมเสียงของอินเทอร์เฟซการสนทนาแบบเรียลไทม์ ผู้ใช้ระบบรายงานว่าตัวเลือกเสียงที่มีอยู่มีความแตกต่างอย่างมากระหว่างตัวอย่างทดสอบและการปฏิบัติจริงในระหว่างการสนทนา การเปลี่ยนแปลงนี้ส่งผลโดยตรงต่อจังหวะคำพูด น้ำเสียง และความชัดเจนของสำเนียงภูมิภาคที่รวมอยู่ในซอฟต์แวร์ช่วยเหลือ

การเปลี่ยนแปลงนี้เกิดขึ้นพร้อมกับการนำโมเดลการประมวลผลภาษาธรรมชาติเวอร์ชันใหม่ไปใช้ ซึ่งเชื่อมโยงกับการอัปเดตโครงสร้างพื้นฐานของระบบหลักโดยเฉพาะ พฤติกรรมที่ไม่คาดคิดของเสียงดังกล่าวจุดประกายให้เกิดการอภิปรายในฟอรัมเทคโนโลยี ซึ่งผู้บริโภคให้รายละเอียดถึงความแตกต่างที่เห็นได้ชัดเจนในด้านน้ำเสียงและจังหวะของการตอบสนองที่สร้างโดยเครื่อง ความคลาดเคลื่อนดังกล่าวส่งผลต่อความสามารถในการคาดการณ์ของเครื่องมือสำหรับผู้ที่ต้องอาศัยการตั้งค่าเสียงเฉพาะในแต่ละวัน

ジェMIニ
双子座 – mundissima/ Shutterstock.com

ผู้เชี่ยวชาญด้านเทคโนโลยีชี้ให้เห็นว่าการปรับเปลี่ยนแพลตฟอร์มการเรียนรู้ของเครื่องอย่างต่อเนื่องมักส่งผลให้เกิดผลข้างเคียงต่ออินเทอร์เฟซผู้ใช้ การปรับเปลี่ยนเสียงทำให้เกิดคำถามเกี่ยวกับการควบคุมคุณภาพในการอัปเดตที่เผยแพร่ไปยังอุปกรณ์มือถือหลายล้านเครื่องทั่วโลก บริษัทที่รับผิดชอบในการพัฒนาผู้ช่วยจะรักษาวงจรการอัปเดตโดยเน้นไปที่การเพิ่มความเร็วให้เหมาะสม ซึ่งอาจอธิบายความแปรผันของการสังเคราะห์เสียงระหว่างการโต้ตอบที่ซับซ้อน

ผลกระทบโดยตรงต่อประสบการณ์การสนทนาที่กำลังดำเนินอยู่

การร้องเรียนหลักที่ผู้ใช้ลงทะเบียนเกี่ยวข้องกับการสูญเสียลักษณะทางอารมณ์และธรรมชาติในระหว่างการโต้ตอบกับระบบเป็นเวลานาน เสียงที่เลือกในเมนูการตั้งค่าฟังดูเป็นมิตร แต่เมื่อเริ่มโหมดบทสนทนาต่อเนื่อง น้ำเสียงจะมีระดับเสียงสูงและเร่งขึ้นอย่างเห็นได้ชัด การเกินความคาดหวังนี้ส่งผลเสียต่อประสบการณ์ของผู้ที่กำลังมองหาผู้ช่วยเสมือนที่มีลักษณะของมนุษย์มากกว่าและใช้เครื่องจักรน้อยลง

รูปแบบนี้จะบ่อนทำลายความลุ่มหลงและประโยชน์ของผู้ช่วยสำหรับงานที่ต้องการความสนใจจากผู้ฟังเป็นเวลานาน ผู้ที่ใช้เครื่องมือนี้ในการศึกษา อ่านเอกสารยาวๆ หรือช่วยเหลือรายวัน สังเกตเห็นว่าคุณภาพของคำศัพท์ลดลงอย่างมาก การขาดความลื่นไหลทำให้การฟังเหนื่อยล้าหลังจากใช้งานต่อเนื่องเพียงไม่กี่นาที

สำเนียงอังกฤษของผู้หญิง ซึ่งเป็นที่รู้จักภายในโดยใช้ระบบการตั้งชื่อเฉพาะ เป็นหนึ่งในสำเนียงที่ได้รับผลกระทบมากที่สุดจากการเปลี่ยนแปลงทางเทคนิคเมื่อเร็วๆ นี้ รายงานระบุว่าความเป็นธรรมชาติของคำพูดจะหายไปหลังจากวินาทีแรกของการโต้ตอบ และถูกแทนที่ด้วยจังหวะเชิงกลทันที และไม่มีการหยุดหายใจจำลอง เอกลักษณ์ของเสียงที่ผู้ใช้เลือกจะสูญเสียคุณลักษณะหลักในระหว่างการประมวลผลการตอบสนอง

ความไม่สอดคล้องกันของเสียงบังคับให้ผู้ใช้หยุดใช้งานหรือมองหาทางเลือกอื่นภายในแอปพลิเคชันเพื่อค้นหาความเสถียร การไม่มีการแจ้งล่วงหน้าเกี่ยวกับการเปลี่ยนแปลงการสังเคราะห์เสียงพูดทำให้ฐานผู้บริโภคที่มีการใช้งานมากที่สุดของแพลตฟอร์มปัญญาประดิษฐ์ผิดหวัง หลายคนกำลังรอการแก้ไขอย่างเป็นทางการที่จะคืนคุณภาพดั้งเดิมของแพ็กเก็ตเสียง

ปัจจัยทางเทคนิคเบื้องหลังการเปลี่ยนแปลงเสียง

การพัฒนาเสียงสังเคราะห์จำเป็นต้องมีความสมดุลที่ซับซ้อนระหว่างการประมวลผลบนคลาวด์และการดำเนินการภายในเครื่องบนอุปกรณ์เคลื่อนที่ การปรับปรุงความเร็วเซิร์ฟเวอร์ล่าสุดที่ออกแบบมาเพื่อลดเวลาตอบสนองของผู้ช่วยเสมือนดูเหมือนว่าจะมีการส่งแพ็กเก็ตเสียงที่ถูกบีบอัดอย่างรุนแรงไปยังผู้ใช้ การบีบอัดนี้ส่งผลให้สูญเสียความถี่เสียงเบสและการเร่งความเร็วของคำโดยธรรมชาติ ช่วยลดการหยุดชั่วคราวตามธรรมชาติซึ่งเป็นลักษณะเฉพาะของคำพูดของมนุษย์ การโต้ตอบกลายเป็นหุ่นยนต์มากกว่าที่วิศวกรซอฟต์แวร์คาดไว้ ซึ่งทำให้ความคาดหวังของบทสนทนาที่ลื่นไหลน่าหงุดหงิด ระบบจะจัดลำดับความสำคัญของการส่งข้อมูลอย่างรวดเร็ว โดยเสียสละการปรับเสียงร้องที่นำความสมจริงมาสู่ปัญญาประดิษฐ์

นอกจากการเปลี่ยนแปลงระดับเสียงและความเร็วแล้ว ปัญหาทางเทคนิคเพิ่มเติมยังเกิดขึ้นเมื่อเล่นเสียงในสภาพแวดล้อมที่แตกต่างกันในแต่ละวัน เสียงพื้นหลัง เสียงป๊อป และความล้มเหลวในการเชื่อมต่อเล็กน้อยถูกระบุในระหว่างการใช้งานหนัก สถานการณ์จะแย่ลงอย่างมากเมื่อแอปพลิเคชันถูกรวมเข้ากับระบบรถยนต์หรือหูฟังไร้สายผ่าน Bluetooth สถาปัตยกรรมระบบพยายามชดเชยเวลาแฝงของอินเทอร์เน็ตด้วยการปรับเสียงแบบไดนามิก แต่การปรับตามเวลาจริงนี้ล้มเหลวอย่างต่อเนื่อง ผลลัพธ์ที่ได้คือความไม่สอดคล้องกันของเสียงที่ผู้บริโภคเลือกในตอนแรกในแผงควบคุมแอปพลิเคชัน

ความท้าทายในการบูรณาการกับระบบยานยนต์

การใช้ผู้ช่วยเสมือนในขณะที่ผู้ใช้ขับรถถือเป็นสถานการณ์ที่สำคัญสำหรับความเสถียรของเสียงที่ประมวลผล การเชื่อมต่อกับแผงหน้าปัดรถยนต์ต้องการความชัดเจนสูงสุดเพื่อหลีกเลี่ยงการรบกวนการจราจร และช่วยให้เข้าใจคำสั่งการนำทางได้ทันที เสียงรบกวนหรือการเร่งความเร็วใดๆ ของเสียงจะส่งผลต่อความปลอดภัยและประสิทธิภาพของเครื่องมือในสภาพแวดล้อมของยานพาหนะ

ช่องว่างในการสร้างเสียงและการเปลี่ยนแปลงระดับเสียงหรือสำเนียงอย่างกะทันหันจะลดความน่าเชื่อถือของเครื่องมือในฐานะเบราว์เซอร์หรือโปรแกรมอ่านข้อความ การบูรณาการยานพาหนะจำเป็นต้องมีมาตรฐานที่เข้มงวด ซึ่งปัจจุบันได้รับความเสียหายจากการอัพเดตเซิร์ฟเวอร์ล่าสุด ไดรเวอร์รายงานว่าต้องปิดใช้งานฟังก์ชันอ่านออกเสียงเนื่องจากการสังเคราะห์เสียงพูดมีคุณภาพต่ำ

ปฏิกิริยาจากชุมชนนักพัฒนา

ผู้เชี่ยวชาญที่ติดตามวิวัฒนาการของแบบจำลองภาษาธรรมชาติเน้นย้ำถึงความยากลำบากในการรักษาเอกลักษณ์ของเสียงร้องในระบบขนาดใหญ่มาก สิ่งสำคัญอันดับแรกของบริษัทเทคโนโลยีขนาดใหญ่ในปัจจุบันคือความเร็วในการตอบสนอง ซึ่งมักจะส่งผลเสียต่อคุณภาพสุนทรียศาสตร์ของเสียงที่สร้างขึ้น ความท้าทายทางเทคนิคอยู่ที่การประมวลผลพารามิเตอร์นับพันล้านโดยไม่ทำให้การส่งเสียงไปยังผู้ใช้ล่าช้า

เอกสารฟอรัมเฉพาะทางพยายามแก้ไขปัญหาโดยการล้างแคชหรือติดตั้งแอปพลิเคชันใหม่ ซึ่งเป็นกลยุทธ์ที่ได้รับการพิสูจน์แล้วว่าไม่ได้ผลโดยสิ้นเชิง รากของการเปลี่ยนแปลงอยู่ที่เซิร์ฟเวอร์กลางของบริษัท ซึ่งทำให้เจ้าของสมาร์ทโฟนไม่สามารถแก้ไขปัญหาท้องถิ่นได้ ชุมชนด้านเทคนิคต้องการความโปร่งใสมากขึ้นเกี่ยวกับการเปลี่ยนแปลงที่ดำเนินการเบื้องหลังในโค้ด

บทบาทของการเข้าถึงเทคโนโลยีเสียง

ความสม่ำเสมอในการสังเคราะห์เสียงมีมากกว่าความพึงพอใจด้านสุนทรียศาสตร์ กลายเป็นองค์ประกอบพื้นฐานสำหรับการเข้าถึงแบบดิจิทัลสำหรับผู้มีความบกพร่องทางการมองเห็นหรือมีปัญหาในการอ่าน เมื่อผู้ช่วยเสมือนเปลี่ยนรูปแบบการพูดในลักษณะที่คาดเดาไม่ได้ ผู้ใช้ที่ต้องพึ่งพาอินเทอร์เฟซเสียงเพียงอย่างเดียวจะต้องเผชิญกับอุปสรรคในการทำความเข้าใจที่จำกัดความเป็นอิสระในการใช้อุปกรณ์เคลื่อนที่ ความชัดเจนในการออกเสียง การเคารพการหยุดไวยากรณ์ และการรักษาเสียงต่ำที่ไพเราะ ถือเป็นข้อกำหนดทางเทคนิคที่จำเป็นสำหรับเครื่องมือเทคโนโลยีช่วยเหลือ ความไม่เสถียรที่พบในซอฟต์แวร์เวอร์ชันล่าสุดแสดงให้เห็นถึงช่องว่างในการทดสอบการใช้งานที่มุ่งเป้าไปที่ผู้ชมเฉพาะกลุ่ม ผู้เชี่ยวชาญในสาขาการรวมระบบดิจิทัลเตือนว่าการเปลี่ยนแปลงอินเทอร์เฟซเสียงอย่างกะทันหันอาจทำให้เกิดอาการสับสนและความเมื่อยล้าในการได้ยินสำหรับผู้ใช้บ่อยๆ ดังนั้นการพัฒนาปัญญาประดิษฐ์จึงต้องสร้างสมดุลระหว่างนวัตกรรมอัลกอริธึมกับความเสถียรทางประสาทสัมผัสที่เสนอให้กับผู้บริโภคปลายทาง การไม่มีตัวเลือกในการย้อนกลับการอัปเดตทำให้สถานการณ์แย่ลงสำหรับผู้ที่คุ้นเคยกับจังหวะก่อนหน้าแล้ว การประกันคุณภาพไม่เพียงแต่ต้องครอบคลุมถึงความถูกต้องแม่นยำของการตอบกลับด้วยข้อความเท่านั้น แต่ยังรวมถึงวิธีการถ่ายทอดข้อมูลนี้ด้วย เครื่องมือสื่อสารแบบเรียลไทม์ต้องการมาตรฐานความเป็นเลิศที่รักษาความมั่นใจของผู้ใช้ในแพลตฟอร์มที่เลือก

ประวัติความเป็นมาของการอัปเดตปัญญาประดิษฐ์

ตลาดผู้ช่วยเสมือนกำลังอยู่ในช่วงเปลี่ยนผ่านที่เร่งขึ้น โดยบริษัทต่างๆ แข่งขันกันเพื่อให้การตอบสนองที่รวดเร็วและแม่นยำที่สุดแก่ผู้บริโภค สภาพแวดล้อมที่มีแรงกดดันสูงนี้ส่งผลให้วงจรการพัฒนาสั้นและการปรับใช้โค้ดอย่างต่อเนื่องไปยังเซิร์ฟเวอร์โดยตรง การแข่งขันทางเทคโนโลยีบังคับให้มีการปลดปล่อยทรัพยากรที่ยังต้องมีการขัดเกลาทางเทคนิค

ในอดีต การก้าวกระโดดครั้งใหญ่ในความสามารถในการประมวลผลเชิงตรรกะของปัญญาประดิษฐ์นั้นมาพร้อมกับการถดถอยชั่วคราวในฟังก์ชันรอง เช่น อินเทอร์เฟซแบบกราฟิกหรือเสียง การจัดลำดับความสำคัญของการใช้เหตุผลของเครื่องส่งผลต่อทรัพยากรการคำนวณที่จัดสรรให้กับการแสดงเสียงพูดแบบเรียลไทม์ เป็นรูปแบบทั่วไปในอุตสาหกรรมซอฟต์แวร์ในช่วงเวลาแห่งนวัตกรรมที่พลิกโฉม

เสียงสังเคราะห์ที่ปรับแต่งอย่างละเอียดต้องใช้ฐานข้อมูลเสียงขนาดใหญ่และการประมวลผลทางประสาทขั้นสูงเพื่อให้เสียงเป็นธรรมชาติ การเปลี่ยนรุ่นเก่าเป็นรุ่นที่เบากว่าและเร็วกว่าอธิบายถึงการสูญเสียความแตกต่างทางอารมณ์ที่ผู้บริโภครายงานในช่วงไม่กี่สัปดาห์ที่ผ่านมา ความคาดหวังก็คือการแก้ไขในอนาคตจะทำให้การปรับเสียงร้องมีความเสถียรโดยไม่ทำให้ความเร็วในการตอบสนองลดลง

การปรับแผงการตั้งค่า

ผู้บริโภคยังคงทดสอบการผสมผสานระหว่างภาษาและสำเนียงต่างๆ ในเมนูแอพ เพื่อค้นหาตัวเลือกที่จะรักษาความเสถียรในการใช้งานเป็นเวลานาน การนำทางผ่านการตั้งค่าเผยให้เห็นว่าทางเลือกเสียงทั้งหมดต้องทนทุกข์ทรมานจากการบีบอัดเสียงแบบเดียวกันและการสูญเสียความเป็นธรรมชาติ ในระดับที่มากขึ้นหรือน้อยลง อินเทอร์เฟซของแอปพลิเคชันยังคงไม่เปลี่ยนแปลง โดยปกปิดการเปลี่ยนแปลงที่สำคัญที่เกิดขึ้นในการประมวลผลบนคลาวด์

Veja Tambem em Tailandês News

การค้าปลีกแบบดิจิทัลลดมูลค่าของสมาร์ทโฟน Galaxy S25 5G ด้วยโบนัสธนาคารและการแลกเปลี่ยนอุปกรณ์

การค้าปลีกแบบดิจิทัลลดมูลค่าของสมาร์ทโฟน Galaxy S25 5G ด้วยโบนัสธนาคารและการแลกเปลี่ยนอุปกรณ์

อะแดปเตอร์ CarPlay ไร้สายของ Amazon มีส่วนลด 50% และคะแนนการอนุมัติสูงจากไดรเวอร์

อะแดปเตอร์ CarPlay ไร้สายของ Amazon มีส่วนลด 50% และคะแนนการอนุมัติสูงจากไดรเวอร์

ส่วนลดที่สำคัญสำหรับ Galaxy S25 Plus ลดมูลค่าลงต่ำกว่า 4,500 เรียลในร้านค้าออนไลน์

ส่วนลดที่สำคัญสำหรับ Galaxy S25 Plus ลดมูลค่าลงต่ำกว่า 4,500 เรียลในร้านค้าออนไลน์

การลดราคาของ PlayStation 5 Pro ช่วยเร่งยอดค้าปลีกดิจิทัลและลดสต็อกทั่วโลก

การลดราคาของ PlayStation 5 Pro ช่วยเร่งยอดค้าปลีกดิจิทัลและลดสต็อกทั่วโลก

การอัปเดตระบบ Apple ใหม่ช่วยเพิ่มประสิทธิภาพการจัดการงานเร่งด่วนสำหรับผู้ใช้ iPhone

การอัปเดตระบบ Apple ใหม่ช่วยเพิ่มประสิทธิภาพการจัดการงานเร่งด่วนสำหรับผู้ใช้ iPhone

รายละเอียดฮาร์ดแวร์รั่วไหลของ PlayStation แบบพกพารุ่นใหม่พร้อมกราฟิกที่เหนือกว่า Xbox Series S

รายละเอียดฮาร์ดแวร์รั่วไหลของ PlayStation แบบพกพารุ่นใหม่พร้อมกราฟิกที่เหนือกว่า Xbox Series S

Oppo เปิดตัว Find X9 Ultra อย่างเป็นทางการทั่วโลกพร้อมเลนส์ Hasselblad และแบตเตอรี่ที่แข็งแกร่ง

Oppo เปิดตัว Find X9 Ultra อย่างเป็นทางการทั่วโลกพร้อมเลนส์ Hasselblad และแบตเตอรี่ที่แข็งแกร่ง

สมาร์ทโฟนแบบพับได้รุ่นใหม่นำสีทองมาสู่ผู้เข้าแข่งขัน Winter Games

สมาร์ทโฟนแบบพับได้รุ่นใหม่นำสีทองมาสู่ผู้เข้าแข่งขัน Winter Games

Tim Cook เผย iPhone และ iPod ต้นแบบใหม่เพื่อเฉลิมฉลองครบรอบ 50 ปีของ Apple

Tim Cook เผย iPhone และ iPod ต้นแบบใหม่เพื่อเฉลิมฉลองครบรอบ 50 ปีของ Apple

Leak เผย Lords of the Fallen และ Sword Art Online ในแค็ตตาล็อก PS Plus Essential ประจำเดือนเมษายน

Leak เผย Lords of the Fallen และ Sword Art Online ในแค็ตตาล็อก PS Plus Essential ประจำเดือนเมษายน

ระบบ Android ได้รับการผสานรวม Gemini Nano 4 สำหรับการประมวลผลแบบออฟไลน์บนสมาร์ทโฟน

ระบบ Android ได้รับการผสานรวม Gemini Nano 4 สำหรับการประมวลผลแบบออฟไลน์บนสมาร์ทโฟน

Samsung อัปเดตโมดูล QuickStar และขยายการควบคุมด้วยภาพของแผงควบคุมในอินเทอร์เฟซ One UI 8.5

Samsung อัปเดตโมดูล QuickStar และขยายการควบคุมด้วยภาพของแผงควบคุมในอินเทอร์เฟซ One UI 8.5