ไม่มีปัญญาประดิษฐ์ใหม่ใดที่จะแปลงเสียงให้เป็นข้อความที่มีโครงสร้างบนโทรศัพท์มือถือ

Nothing phone 3

Nothing phone 3 - Reprodução Youtube

ผู้ผลิตสมาร์ทโฟน ไม่มีอะไรเริ่มจำหน่ายเครื่องมือใหม่ที่ใช้ปัญญาประดิษฐ์สำหรับอุปกรณ์ใหม่ล่าสุด ฟีเจอร์ที่ไม่เคยมีมาก่อนนี้สัญญาว่าจะเปลี่ยนวิธีที่ผู้ใช้โต้ตอบกับการพิมพ์บนหน้าจอขนาดเล็ก คุณสมบัติใหม่นี้มาถึงครั้งแรกในรุ่น Phone (3) ผ่านการอัพเดตระบบปฏิบัติการ

เทคโนโลยีที่เรียกว่า Essential Voice จะแปลงคำสั่งเสียงเป็นข้อความที่มีโครงสร้างพร้อมสำหรับการส่งทันที ระบบทำงานในลักษณะบูรณาการกับแอพพลิเคชั่นที่ติดตั้งบนอุปกรณ์ กลไกนี้จะกรองข้อบกพร่องทางภาษาและจัดระเบียบประโยคโดยอัตโนมัติซึ่งแตกต่างจากการเขียนตามคำบอกแบบดั้งเดิม บริษัทวางแผนที่จะขยายฟังก์ชันการทำงานไปยังกลุ่มผลิตภัณฑ์อื่นๆ ในอีกไม่กี่สัปดาห์ข้างหน้า

ไม่มีอะไรโทรศัพท์ – รูปถ่าย: การทำสำเนา

ปัญญาประดิษฐ์เปลี่ยนเสียงให้เป็นข้อความที่สะอาดตาได้อย่างไร

การดำเนินงานของ Essential Voice เป็นส่วนหนึ่งของชุดนวัตกรรมที่เรียกว่า Essential Space แพลตฟอร์มดังกล่าวใช้โมเดลภาษา Gemini 3 Flash เพื่อประมวลผลข้อมูลที่ไมโครโฟนของโทรศัพท์มือถือจับไว้ เมื่อผู้ใช้พูดระบบจะเข้าใจบริบททั่วไปของข้อความก่อนที่จะถอดเสียงข้อความลงบนหน้าจอ การแสดงออกของความลังเลที่พบบ่อยในคำพูดของมนุษย์จะหายไปในผลลัพธ์สุดท้าย

วัตถุประสงค์หลักของผู้ผลิตคือการทำให้การสื่อสารด้วยเสียงเป็นทางเลือกที่เป็นมืออาชีพและเป็นไปได้ บุคคลสามารถเขียนอีเมลยาวๆ ขณะเดินไปตามถนนได้ ซอฟต์แวร์ใช้กฎไวยากรณ์ที่ถูกต้องและแทรกเครื่องหมายวรรคตอนที่เหมาะสมโดยไม่จำเป็นต้องมีคำสั่งเฉพาะ ในบางสถานการณ์ ระบบจะจัดรูปแบบเนื้อหาเป็นย่อหน้าที่มีการจัดระเบียบเอง

การเปิดใช้งานระบบทำได้สองวิธีง่ายๆ และตรงไปตรงมา ผู้ใช้สามารถกดปุ่ม Essential Key ค้างไว้หรือแตะไอคอนเฉพาะที่มุมด้านล่างของแป้นพิมพ์เสมือน การบันทึกจะสิ้นสุดทันทีที่บุคคลนั้นหยุดพูด ข้อความที่ประมวลผลจะปรากฏขึ้นทันทีในช่องพิมพ์ของแอปพลิเคชันที่เปิดอยู่

อัพเดตตารางเครื่องของแบรนด์

ทรัพยากรจะค่อยๆ ปล่อยออกมาเพื่อให้มั่นใจถึงเสถียรภาพของระบบปฏิบัติการ ขณะนี้เจ้าของโทรศัพท์ไม่มีสิ่งใด (3) จะสามารถดาวน์โหลดคุณสมบัติใหม่ผ่านเมนูการตั้งค่าของอุปกรณ์ได้ แพ็คเกจการติดตั้งมีหมายเลขบิวด์ Metroid-B4.1-260408-1909-IND หลังจากดาวน์โหลดและรีสตาร์ทอุปกรณ์ เครื่องมือจะพร้อมใช้งานทันที

อุปกรณ์อื่นๆ ในกลุ่มผลิตภัณฑ์ล่าสุดของแบรนด์ยังได้กำหนดวันที่ในการรับเทคโนโลยีด้วย โทรศัพท์รุ่น Phone (4a) Pro มีกำหนดการอัปเดตปลายเดือนเมษายน 2569 ผู้ใช้โทรศัพท์มาตรฐาน (4a) ต้องรอจนถึงต้นเดือนพฤษภาคม บริษัทไม่ได้ให้ข้อมูลเกี่ยวกับความเข้ากันได้กับสมาร์ทโฟนรุ่นก่อนหน้า

การอัปเดตซอฟต์แวร์ยังนำการปรับปรุงเล็กๆ น้อยๆ อื่นๆ มาสู่อินเทอร์เฟซ Nothing OS การปรับระบบไฟท้าย Glyph มาพร้อมแพ็คเกจหลัก อย่างไรก็ตาม จุดเด่นหลักของเวอร์ชันยังคงมุ่งเน้นไปที่ประสิทธิภาพการทำงานที่เกิดจากเครื่องมือเสียงใหม่

ดูเพิ่มเติม

ข้อดีหลักของเครื่องมือในการใช้งานประจำวัน

เอกสารอย่างเป็นทางการของผู้ผลิตให้รายละเอียดเกี่ยวกับความสามารถต่างๆ ที่มีอยู่ในเทคโนโลยีการถอดรหัสแบบใหม่ กลไกนี้พยายามขจัดเวลาที่สูญเปล่าด้วยการแก้ไขด้วยตนเองบ่อยครั้งบนหน้าจอสัมผัส

  • รองรับภาษาท้องถิ่นมากกว่าร้อยภาษาพร้อมระบบตรวจจับคำพูดอัตโนมัติ
  • การแปลเสียงที่บันทึกไว้เป็นภาษาต่างประเทศพร้อมกันโดยไม่ต้องใช้แอปพลิเคชันรอง
  • การสร้างทางลัดเสียงแบบกำหนดเองเพื่อกรอกแบบฟอร์มหรือแทรกลิงก์ที่เกิดซ้ำ
  • โครงสร้างอัจฉริยะที่สามารถเปลี่ยนการเขียนตามคำบอกอย่างต่อเนื่องเป็นรายการงานหรือบันทึกเฉพาะได้
  • ใช้งานได้ในระดับสากลในแอปพลิเคชันบุคคลที่สามที่มีช่องป้อนข้อความ

ฟีเจอร์เหล่านี้ทำให้เครื่องมืออยู่ในหมวดหมู่ที่แตกต่างจากผู้ช่วยเสมือนทั่วไป การมุ่งเน้นยังคงเคร่งครัดในด้านประสิทธิภาพการผลิตและการสร้างเนื้อหาที่เป็นลายลักษณ์อักษรที่มีความแม่นยำสูง

ข้อกำหนดความเป็นส่วนตัวของข้อมูลและการประมวลผล

สถาปัตยกรรมระบบต้องการการเชื่อมต่ออินเทอร์เน็ตคงที่เพื่อให้ทำงานได้อย่างถูกต้อง การประมวลผลปัญญาประดิษฐ์จำนวนมากเกิดขึ้นบนเซิร์ฟเวอร์ในระบบคลาวด์ ไม่ใช่บนฮาร์ดแวร์ในเครื่องของโทรศัพท์ หากไม่มีการเข้าถึงเครือข่ายมือถือหรือ Wi-Fi ปุ่มการเขียนตามคำบอกอัจฉริยะจะยังคงไม่ทำงาน ความเร็วการถอดเสียงขึ้นอยู่กับคุณภาพของสัญญาณที่มีในขณะใช้งานโดยตรง

ปัญหาด้านความปลอดภัยของข้อมูลได้รับความสนใจเป็นพิเศษในระหว่างการพัฒนาโครงการ ไม่มีสิ่งใดรับประกันว่าจะไม่มีไฟล์เสียงใดเก็บไว้ในฐานข้อมูลหลังการแปลง เสียงเดินทางไปยังคลาวด์ ผ่านการถอดรหัสโมเดล Gemini และส่งกลับเป็นข้อความไปยังสมาร์ทโฟน กระบวนการทั้งหมดใช้เวลาเพียงเสี้ยววินาทีจึงจะเสร็จสมบูรณ์

ไมโครโฟนของอุปกรณ์จะปิดอยู่เกือบตลอดเวลา การฟังอย่างกระตือรือร้นจะเริ่มเมื่อผู้ใช้เรียกใช้คำสั่งด้วยตนเองเท่านั้น วิธีการนี้หลีกเลี่ยงการใช้แบตเตอรี่โดยไม่จำเป็นและป้องกันการบันทึกการสนทนาโดยไม่ตั้งใจในสภาพแวดล้อมส่วนตัว

ความแตกต่างในทางปฏิบัติจากคีย์บอร์ดทั่วไป

คีย์บอร์ดเสมือนแบบดั้งเดิมจะถอดเสียงทุกอย่างที่ไมโครโฟนจับได้อย่างแท้จริง หากบุคคลนั้นพูดติดอ่างหรือพูดซ้ำคำ ข้อผิดพลาดจะปรากฏบนหน้าจอในลักษณะเดียวกันทุกประการ Essential Voice ทำลายรูปแบบนี้โดยทำหน้าที่เป็นผู้พิสูจน์อักษรแบบเรียลไทม์ อัลกอริทึมเข้าใจเจตนาของประโยคและให้ผลลัพธ์ที่สวยงาม

ผู้เชี่ยวชาญด้านเทคโนโลยีที่ทดสอบเวอร์ชันเริ่มต้นรายงานว่าความต้องการรุ่นต่อๆ ไปลดลงอย่างมาก เอาต์พุตข้อความมีน้ำเสียงที่เป็นทางการและตรงไปตรงมามากขึ้นอย่างเป็นธรรมชาติ คุณสมบัตินี้สนับสนุนการเขียนเอกสารขององค์กร อีเมลระดับมืออาชีพ และรายงานการทำงานเป็นอย่างมาก ระดับความแม่นยำนั้นน่าประทับใจเมื่อผู้พูดพูดคำศัพท์ได้อย่างชัดเจนในสภาพแวดล้อมที่เงียบ ปัญญาประดิษฐ์สามารถแยกแยะบริบทได้แม้จะมีเสียงรบกวนรอบข้างเล็กน้อยก็ตาม

อย่างไรก็ตาม พิธีการที่มากเกินไปอาจต้องมีการปรับเปลี่ยนในบริบทเฉพาะของการสื่อสารในแต่ละวัน การสนทนาที่ผ่อนคลายกับสมาชิกในครอบครัวในแอปส่งข้อความอาจฟังดูไม่เข้าท่าหากระบบลบคำสแลงและการหยุดชั่วคราวตามธรรมชาติออกทั้งหมด ผู้ผลิตตระหนักถึงลักษณะพฤติกรรมของอัลกอริทึมนี้ วิศวกรของบริษัทแนะนำว่าการอัปเดตซอฟต์แวร์ในอนาคตอาจรวมถึงการปรับโทนเสียงด้วยตนเองเพื่อปรับการเขียนให้เข้ากับปฏิสัมพันธ์ทางสังคมประเภทต่างๆ

ดูเพิ่มเติม