Tailandês News

การเปิดตัว Gemini 3.1 Flash Live เพิ่มประสิทธิภาพการสนทนาด้วยเสียงและเข้าถึงกว่า 200 ประเทศ

Gemini
Foto: Gemini - Mehaniq/shutterstock.com

ยักษ์ใหญ่ด้านเทคโนโลยีในอเมริกาเหนือได้ประกาศอย่างเป็นทางการถึงการมาถึงของสถาปัตยกรรมการประมวลผลเสียงล่าสุดและล้ำหน้าที่สุด ซึ่งถือเป็นวิวัฒนาการครั้งสำคัญในการโต้ตอบแบบเรียลไทม์ โมเดลภาษาหลากหลายรูปแบบใหม่ได้รับการออกแบบมาเพื่อยกระดับคุณภาพของการสนทนาด้วยเสียง ให้การตอบสนองที่รวดเร็วและแม่นยำยิ่งขึ้นแก่ผู้ใช้ในระดับโลก

เทคโนโลยีนี้สัญญาว่าจะเปลี่ยนวิธีที่ระบบเข้าใจคำสั่งเสียงพูด โดยเปิดให้ใช้งานตัวอย่างสำหรับนักพัฒนาผ่านอินเทอร์เฟซการเขียนโปรแกรมเฉพาะ การอัปเดตมุ่งเน้นไปที่การแก้ปัญหาในอดีตด้วยความล่าช้าในการสื่อสารระหว่างมนุษย์และเครื่องจักร เพื่อสร้างมาตรฐานใหม่ของความลื่นไหลสำหรับตลาดผู้ช่วยเสมือน

Google
Google – daily_creativity/shutterstock.com

ระบบที่เพิ่งเปิดตัวโดดเด่นด้วยความสามารถที่ไม่เคยมีมาก่อนในการตีความความแตกต่างทางเสียงที่ซับซ้อน ไม่เพียงแต่จะเข้าใจคำพูดเท่านั้น แต่ยังรวมถึงจังหวะและน้ำเสียงของเสียงของคู่สนทนาด้วย ความไวที่ได้รับการปรับปรุงนี้ช่วยให้ปัญญาประดิษฐ์สามารถปรับการตอบสนองแบบไดนามิก ทำให้ประสบการณ์ผู้ใช้เป็นธรรมชาติและเป็นธรรมชาติมากขึ้นอย่างมาก

ความก้าวหน้าในสถาปัตยกรรมการประมวลผลเสียง

วิศวกรรมที่อยู่เบื้องหลังระบบเสียงเวอร์ชันใหม่มีการปรับเปลี่ยนโครงสร้างที่ลดเวลาตอบสนองอย่างมากในระหว่างการสนทนาต่อเนื่อง การเพิ่มประสิทธิภาพทางเทคนิคนี้ช่วยให้มั่นใจได้ว่าการโต้ตอบจะเกิดขึ้นโดยไม่มีการหยุดชั่วคราวแบบปกติซึ่งเคยทำลายจังหวะการสนทนาในแพลตฟอร์มเสียงเวอร์ชันก่อนหน้า

โมเดลสามารถติดตามเหตุผลของผู้ใช้ได้นานขึ้นสองเท่า ทำให้บริบทใช้งานได้แม้ในเซสชันการแลกเปลี่ยนความคิดที่ยืดเยื้อ คุณลักษณะทางเทคนิคนี้ช่วยลดความจำเป็นในการทำซ้ำข้อมูลอย่างต่อเนื่อง ช่วยอำนวยความสะดวกในการพัฒนาความคิดที่ซับซ้อนและการวางแผนงานในหลายขั้นตอน

ความสามารถในการประมวลผลที่เพิ่มขึ้นมีประโยชน์โดยตรงต่อการดำเนินการคำสั่งแบบแยกย่อย โดยที่ระบบจำเป็นต้องปฏิบัติตามคำแนะนำโดยละเอียดโดยไม่สูญเสียโฟกัสในการปฏิบัติงาน ความเสถียรที่ได้รับในการอัปเดตนี้จะป้องกันไม่ให้ปัญญาประดิษฐ์เบี่ยงเบนไปจากหัวข้อหลักเมื่อบทสนทนาเปลี่ยนไปอย่างไม่คาดคิดหรือได้รับตัวแปรใหม่

การกรองเสียงในสภาพแวดล้อมในเมือง

การปรับปรุงเทคโนโลยีที่โดดเด่นที่สุดประการหนึ่งอยู่ที่ระบบแยกเสียงพูด ซึ่งพัฒนาขึ้นเพื่อให้ทำงานได้อย่างมีประสิทธิภาพสูงในสถานการณ์ที่มีมลภาวะทางเสียงที่รุนแรง อัลกอริธึมสามารถแยกคำพูดหลักออกจากเสียงรอบข้างทั่วไป เช่น เสียงการจราจร การสนทนาด้านข้าง หรือเสียงโทรทัศน์ในพื้นหลัง

ความแม่นยำในการกรองนี้ช่วยให้มั่นใจว่าเข้าใจคำสั่งได้อย่างถูกต้อง แม้ว่าผู้ใช้จะเดินไปตามถนนที่พลุกพล่านหรือใช้ระบบขนส่งสาธารณะก็ตาม ความชัดเจนของการจับเสียงช่วยลดอัตราข้อผิดพลาดในการตีความ ทำให้เครื่องมือนี้เชื่อถือได้สำหรับการใช้งานประจำวันในสภาพแวดล้อมภายนอกหรือภายในที่มีการรบกวนของเสียง

การขยายตัวของระบบค้นหาเชิงโต้ตอบทั่วโลก

การใช้โมเดลภาษาใหม่ถือเป็นพื้นฐานสำหรับการเปิดตัวฟังก์ชันการค้นหาด้วยเสียงแบบเรียลไทม์ทั่วโลก โครงสร้างพื้นฐานที่ได้รับการปรับปรุงช่วยให้ทรัพยากรสามารถเข้าถึงมากกว่าสองร้อยประเทศพร้อมกัน ครอบคลุมทุกดินแดนที่ฟังก์ชันปัญญาประดิษฐ์ขั้นสูงดำเนินการในเชิงพาณิชย์อยู่แล้ว

ส่วนขยายขนาดใหญ่นี้ทำให้การเข้าถึงคำค้นหาหลายรูปแบบเป็นประชาธิปไตย ทำให้ผู้ใช้จากภูมิภาคต่างๆ สามารถทำการค้นหาที่ซับซ้อนโดยใช้คำพูดและกล้องของอุปกรณ์เคลื่อนที่ การบูรณาการภาพและเสียงจะเปลี่ยนวิธีการดึงข้อมูลออกจากสภาพแวดล้อมทางกายภาพและประมวลผลในระบบนิเวศดิจิทัล

การประมวลผลแบบสอบถามแบบเรียลไทม์เพิ่มประสิทธิภาพด้วยสถาปัตยกรรมใหม่ โดยให้ผลลัพธ์ตามบริบทเกือบจะในทันที ความสามารถในการโต้ตอบกับเสิร์ชเอ็นจิ้นเปลี่ยนแปลงไดนามิกแบบดั้งเดิมของการพิมพ์คำหลัก โดยแทนที่ด้วยคำถามที่จัดทำขึ้นในภาษาสนทนาที่เป็นธรรมชาติ

ความพร้อมใช้งานขนาดใหญ่จะทดสอบความแข็งแกร่งของเซิร์ฟเวอร์และความสามารถของอัลกอริธึมในการปรับให้เข้ากับโครงสร้างพื้นฐานเครือข่ายต่างๆ ทั่วโลก การตอบสนองที่รวดเร็วอย่างต่อเนื่องในหลายพื้นที่พิสูจน์ให้เห็นถึงความสมบูรณ์ของเทคโนโลยีการประมวลผลแบบกระจายที่ใช้ในการอัพเกรดระบบครั้งใหญ่นี้

เครื่องมือสำหรับการสร้างแอปพลิเคชันแบบกำหนดเอง

การเปิดตัวอินเทอร์เฟซการเขียนโปรแกรมแอปพลิเคชันในสภาพแวดล้อมการพัฒนาเฉพาะทางทำให้ผู้สร้างซอฟต์แวร์มีโอกาสบูรณาการเทคโนโลยีเสียงขั้นสูงเข้ากับโครงการของตนเอง ผู้เชี่ยวชาญด้านเทคโนโลยีสามารถสร้างโซลูชันที่ต้องใช้การโต้ตอบหลายรูปแบบแบบเรียลไทม์ โดยใช้ประโยชน์จากเวลาแฝงที่ต่ำและความแม่นยำสูงในการจดจำเสียงจากรุ่นใหม่ การเปิดระบบนิเวศนี้ช่วยกระตุ้นนวัตกรรมในภาคส่วนที่ขึ้นอยู่กับบริการอัตโนมัติ การเข้าถึง และอินเทอร์เฟซคำสั่งเสียง ช่วยให้สามารถสร้างผู้ช่วยเสมือนที่ตอบสนองสูงและปรับแต่งได้ตามความต้องการเฉพาะของตลาดองค์กรและผู้บริโภคจำนวนมาก

การสนับสนุนด้านเทคนิคที่เสนอให้กับนักพัฒนาประกอบด้วยเอกสารโดยละเอียดเกี่ยวกับวิธีการเรียกใช้เครื่องมือภายนอกอย่างมีประสิทธิภาพในระหว่างการสนทนาอัตโนมัติ ระบบที่ได้รับการปรับปรุงเป็นไปตามแนวทางการเขียนโปรแกรมอย่างต่อเนื่อง เพื่อให้มั่นใจว่าตัวแทนเสมือนทำงานอย่างเคร่งครัดภายในพารามิเตอร์ที่กำหนดโดยผู้สร้าง ความน่าเชื่อถือในการปฏิบัติงานนี้เป็นพื้นฐานสำหรับการใช้เทคโนโลยีในการใช้งานทางการเงิน การดูแลสุขภาพ หรือบริการสาธารณะ โดยที่ความถูกต้องของข้อมูลและความเสถียรของการโต้ตอบเป็นข้อกำหนดที่ไม่สามารถต่อรองได้เพื่อความปลอดภัยและความพึงพอใจของผู้ใช้ปลายทางที่ต้องพึ่งพาแพลตฟอร์มเหล่านี้ทุกวัน

การสนับสนุนภาษาและรูปแบบภูมิภาค

ความสามารถในการสื่อสารของแพลตฟอร์มได้รับการขยายเพื่อทำความเข้าใจและประมวลผลภาษาต่างๆ มากกว่า 90 ภาษา ซึ่งรวมเอาจุดยืนในฐานะเครื่องมือที่เข้าถึงได้ทั่วโลกอย่างแท้จริง การฝึกอบรมอัลกอริธึมเกี่ยวข้องกับการเปิดรับข้อมูลเสียงที่หลากหลาย ส่งผลให้มีความสามารถที่เหนือกว่าในการจัดการกับสำเนียง ภาษาถิ่น และการออกเสียงในภูมิภาคที่ท้าทายระบบการรู้จำเสียงแบบดั้งเดิม ความครอบคลุมด้านภาษานี้ช่วยขจัดอุปสรรคในการสื่อสาร และช่วยให้ผู้ใช้ที่มีภูมิหลังทางวัฒนธรรมที่แตกต่างกันสามารถโต้ตอบกับเทคโนโลยีได้อย่างเป็นธรรมชาติ โดยไม่จำเป็นต้องปรับวิธีการพูดหรือใช้น้ำเสียงที่เป็นกลาง ปัญญาประดิษฐ์จะปรับพารามิเตอร์การฟังแบบไดนามิกเพื่อจับรายละเอียดปลีกย่อยของแต่ละภาษา เพื่อให้มั่นใจว่าเจตนาเบื้องหลังคำนั้นได้รับการตีความอย่างถูกต้อง โดยไม่คำนึงถึงความซับซ้อนทางไวยากรณ์หรือสัทศาสตร์ของภาษาที่ใช้ในการโต้ตอบ ส่งเสริมการรวมระบบดิจิทัลอย่างที่ไม่เคยมีมาก่อนในส่วนผู้ช่วยเสมือน

การเพิ่มประสิทธิภาพสำหรับระบบนิเวศมือถือ

แอพเนทีฟสำหรับระบบปฏิบัติการสมาร์ทโฟนหลักๆ ได้รับการอัพเดตอินเทอร์เฟซเพื่อรองรับความสามารถในการประมวลผลเสียงใหม่ๆ แผงโต้ตอบแบบลอยได้รับการออกแบบใหม่เพื่ออำนวยความสะดวกในการเข้าถึงคำสั่งเสียงอย่างรวดเร็ว ช่วยให้ผู้ใช้สามารถเริ่มบทสนทนาที่ซับซ้อนได้ด้วยการแตะเพียงครั้งเดียว โดยผสานรวมปัญญาประดิษฐ์เข้ากับการใช้งานปกติของอุปกรณ์มือถือสมัยใหม่

บูรณาการกับบริการดิจิทัลและยูทิลิตี้

วิวัฒนาการของโมเดลอะคูสติกขยายความสามารถของปัญญาประดิษฐ์อย่างมีนัยสำคัญในการโต้ตอบกับแอปพลิเคชันและบริการอื่น ๆ ที่ติดตั้งบนอุปกรณ์หรือโฮสต์ในระบบคลาวด์ การเปิดใช้งานยูทิลิตี้ภายนอกเกิดขึ้นอย่างลื่นไหลในระหว่างการสนทนา ช่วยให้ผู้ช่วยดำเนินการได้จริง เช่น การกำหนดเวลาการนัดหมาย การค้นหาเส้นทาง หรือจัดการไฟล์ โดยไม่รบกวนการไหลของบทสนทนาหลัก

ความสามารถในการทำงานร่วมกันนี้จะเปลี่ยนเครื่องมือเสียงให้เป็นศูนย์บัญชาการที่ครอบคลุม ซึ่งสามารถจัดการงานหลายอย่างพร้อมกันตามคำสั่งด้วยวาจาง่ายๆ ความแม่นยำที่ได้รับการปรับปรุงในการดำเนินการเหล่านี้สะท้อนให้เห็นถึงการเจริญเติบโตของอัลกอริธึมการทำความเข้าใจบริบท ซึ่งกำหนดมาตรฐานระดับสูงสำหรับอนาคตของอินเทอร์เฟซการสนทนาในตลาดเทคโนโลยี

Veja Tambem em Tailandês News

การค้าปลีกแบบดิจิทัลลดมูลค่าของสมาร์ทโฟน Galaxy S25 5G ด้วยโบนัสธนาคารและการแลกเปลี่ยนอุปกรณ์

การค้าปลีกแบบดิจิทัลลดมูลค่าของสมาร์ทโฟน Galaxy S25 5G ด้วยโบนัสธนาคารและการแลกเปลี่ยนอุปกรณ์

อะแดปเตอร์ CarPlay ไร้สายของ Amazon มีส่วนลด 50% และคะแนนการอนุมัติสูงจากไดรเวอร์

อะแดปเตอร์ CarPlay ไร้สายของ Amazon มีส่วนลด 50% และคะแนนการอนุมัติสูงจากไดรเวอร์

ส่วนลดที่สำคัญสำหรับ Galaxy S25 Plus ลดมูลค่าลงต่ำกว่า 4,500 เรียลในร้านค้าออนไลน์

ส่วนลดที่สำคัญสำหรับ Galaxy S25 Plus ลดมูลค่าลงต่ำกว่า 4,500 เรียลในร้านค้าออนไลน์

การลดราคาของ PlayStation 5 Pro ช่วยเร่งยอดค้าปลีกดิจิทัลและลดสต็อกทั่วโลก

การลดราคาของ PlayStation 5 Pro ช่วยเร่งยอดค้าปลีกดิจิทัลและลดสต็อกทั่วโลก

การอัปเดตระบบ Apple ใหม่ช่วยเพิ่มประสิทธิภาพการจัดการงานเร่งด่วนสำหรับผู้ใช้ iPhone

การอัปเดตระบบ Apple ใหม่ช่วยเพิ่มประสิทธิภาพการจัดการงานเร่งด่วนสำหรับผู้ใช้ iPhone

รายละเอียดฮาร์ดแวร์รั่วไหลของ PlayStation แบบพกพารุ่นใหม่พร้อมกราฟิกที่เหนือกว่า Xbox Series S

รายละเอียดฮาร์ดแวร์รั่วไหลของ PlayStation แบบพกพารุ่นใหม่พร้อมกราฟิกที่เหนือกว่า Xbox Series S

Oppo เปิดตัว Find X9 Ultra อย่างเป็นทางการทั่วโลกพร้อมเลนส์ Hasselblad และแบตเตอรี่ที่แข็งแกร่ง

Oppo เปิดตัว Find X9 Ultra อย่างเป็นทางการทั่วโลกพร้อมเลนส์ Hasselblad และแบตเตอรี่ที่แข็งแกร่ง

สมาร์ทโฟนแบบพับได้รุ่นใหม่นำสีทองมาสู่ผู้เข้าแข่งขัน Winter Games

สมาร์ทโฟนแบบพับได้รุ่นใหม่นำสีทองมาสู่ผู้เข้าแข่งขัน Winter Games

Tim Cook เผย iPhone และ iPod ต้นแบบใหม่เพื่อเฉลิมฉลองครบรอบ 50 ปีของ Apple

Tim Cook เผย iPhone และ iPod ต้นแบบใหม่เพื่อเฉลิมฉลองครบรอบ 50 ปีของ Apple

ระบบ Android ได้รับการผสานรวม Gemini Nano 4 สำหรับการประมวลผลแบบออฟไลน์บนสมาร์ทโฟน

ระบบ Android ได้รับการผสานรวม Gemini Nano 4 สำหรับการประมวลผลแบบออฟไลน์บนสมาร์ทโฟน

Leak เผย Lords of the Fallen และ Sword Art Online ในแค็ตตาล็อก PS Plus Essential ประจำเดือนเมษายน

Leak เผย Lords of the Fallen และ Sword Art Online ในแค็ตตาล็อก PS Plus Essential ประจำเดือนเมษายน

Samsung อัปเดตโมดูล QuickStar และขยายการควบคุมด้วยภาพของแผงควบคุมในอินเทอร์เฟซ One UI 8.5

Samsung อัปเดตโมดูล QuickStar และขยายการควบคุมด้วยภาพของแผงควบคุมในอินเทอร์เฟซ One UI 8.5