Tailandês News

Apple เปิดตัวเทคโนโลยี LiTo เพื่อสร้างวัตถุสามมิติที่มีการสะท้อนจริงด้วยการคลิกเพียงครั้งเดียว

Apple logo
Foto: Apple logo -fireFX / Shutterstock.com

ในเดือนมีนาคม 2026 Apple Research ได้เปิดตัว LiTo อย่างเป็นทางการ ซึ่งเป็นเทคโนโลยีปัญญาประดิษฐ์เชิงนวัตกรรมที่มุ่งสร้างวัตถุสามมิติที่มีความเที่ยงตรงสูง ระบบใช้วิธีการที่ใช้สนามแสงบนพื้นผิวเพื่อแปลงภาพถ่ายสองมิติเดียวให้เป็นแบบจำลอง 3 มิติที่มีรายละเอียดครบถ้วนสมบูรณ์ เครื่องมือนี้สามารถประมวลผลเรขาคณิตของวัตถุและรูปลักษณ์ที่มองเห็นได้ไปพร้อมๆ กัน ทำให้มั่นใจได้ว่าองค์ประกอบที่ซับซ้อน เช่น ความสว่างและการสะท้อนจะถูกรักษาไว้อย่างเป็นธรรมชาติ

การพัฒนามีรายละเอียดอยู่ในบทความทางวิทยาศาสตร์ที่ตีพิมพ์ในพื้นที่เก็บข้อมูล arXiv และได้รับการยอมรับให้นำเสนอในการประชุมนานาชาติ ICLR 2026 ต่างจากวิธีการก่อนหน้านี้ที่เน้นเฉพาะการสร้างรูปร่างใหม่เท่านั้น LiTo มุ่งเน้นไปที่การแสดงแสงแฝงที่รวมแสงและมุมมองเข้าด้วยกัน ผลลัพธ์ที่ได้ช่วยให้ผู้ใช้และนักพัฒนาสามารถสร้างสินทรัพย์ดิจิทัลที่ตอบสนองต่อแสงของสภาพแวดล้อมเสมือนจริงในลักษณะที่เหมือนกับโลกแห่งความเป็นจริง

ระบบโทเค็นไนเซชันสนามแสงทำงานอย่างไร

สถาปัตยกรรม LiTo ทำงานโดยปฏิบัติต่อภาพ RGB-D เป็นตัวอย่างของสนามแสงพื้นผิวที่ซับซ้อน โดยแปลงข้อมูลนี้เป็นเวกเตอร์แฝงที่มีขนาดกะทัดรัด เทคนิคที่เป็นนวัตกรรมใหม่นี้ช่วยให้ปัญญาประดิษฐ์เข้าใจว่าแสงมีปฏิกิริยาอย่างไรกับวัสดุต่างๆ ตั้งแต่พื้นผิวโลหะที่มีการสะท้อนแสงสูงไปจนถึงพื้นผิวด้านและทึบแสง ด้วยการรวมรูปทรงเรขาคณิตและลักษณะที่ปรากฏไว้ในเอนทิตีข้อมูลเดียว Apple จึงขจัดความผิดเพี้ยนที่มักพบในซอฟต์แวร์การสร้างแบบจำลองอัตโนมัติแบบดั้งเดิม

ความแตกต่างอย่างมากของเทคโนโลยีนี้อยู่ที่ความสามารถในการสร้างสิ่งที่นักวิจัยเรียกว่ารูปลักษณ์ที่ขึ้นอยู่กับมุมมอง ในโมเดล 3D ทั่วไป แสงเรืองแสงมักจะคงที่หรือ “ทาสี” ลงในพื้นผิว ซึ่งจะทำให้ความดำมืดหายไปเมื่อกล้องเคลื่อนที่ไปรอบๆ วัตถุ เมื่อใช้ LiTo ไฮไลท์แบบ Specular จะเคลื่อนที่ตามมุมมองของผู้สังเกต โดยจำลองพฤติกรรมของโฟตอนเมื่อกระทบกับพื้นผิวแข็งในพื้นที่สามมิติด้วยความแม่นยำทางกายภาพ

  • การประมวลผลทางเรขาคณิตแบบบูรณาการและแสงแบบไดนามิก
  • การสร้างโมเดลจากอิมเมจอินพุตเดียว
  • Preservação de reflexos especulares em superfícies complexas.
  • ลดเวลาในการสร้างเนื้อหาสำหรับความเป็นจริงเสริมลงอย่างมาก

ความแม่นยำในการสร้างพื้นผิวและการสะท้อนกลับ

การทดสอบที่ดำเนินการโดยทีมงาน Cupertino แสดงให้เห็นว่า LiTo มีประสิทธิภาพเหนือกว่าเทคนิคการสร้างใหม่ในปัจจุบันในสถานการณ์ที่ซับซ้อนมองเห็นได้สูง เมื่อเปรียบเทียบกับวิธีการที่ใช้กันอย่างแพร่หลายในอุตสาหกรรม เครื่องมือใหม่ของ Apple ยังคงรักษาความสมบูรณ์ของขอบและความราบรื่นของการเปลี่ยนแสงแม้ในวัตถุที่มีรูปทรงไม่สม่ำเสมอ วิธีนี้จะช่วยแก้ปัญหาเรื้อรังในโฟโตแกรมเมทรีและการสร้าง AI ซึ่งพื้นผิวมันวาวมักจะสร้างสัญญาณรบกวนหรือการเสียรูปในตาข่ายสุดท้ายของวัตถุที่สร้างขึ้น

ทีมวิจัยเน้นย้ำว่าตำแหน่งของการสะท้อนบนพื้นผิวของวัตถุเปลี่ยนแปลงไปตามธรรมชาติตามกฎของทัศนศาสตร์ในลักษณะอัลกอริธึม คุณลักษณะนี้เป็นพื้นฐานสำหรับการบูรณาการวัตถุเสมือนในสภาพแวดล้อมความเป็นจริงผสม โดยที่ความสอดคล้องของภาพจะกำหนดคุณภาพของประสบการณ์ผู้ใช้ ระบบได้รับการทดสอบในหลากหลายหมวดหมู่ รวมถึงอุปกรณ์อิเล็กทรอนิกส์ ของใช้ในครัวเรือน และเสื้อผ้า โดยให้ผลลัพธ์ที่สม่ำเสมอในทุกกลุ่มตัวอย่าง

Apple logo
โลโก้ Apple – umitc / Shutterstock.com

การใช้งานจริงในระบบนิเวศของอุปกรณ์

การนำ LiTo ไปใช้เปิดประตูสู่การปรับปรุงที่สำคัญในด้านเทคโนโลยีต่างๆ โดยเฉพาะอย่างยิ่งในการพัฒนาแอปพลิเคชันสำหรับอุปกรณ์คอมพิวเตอร์เชิงพื้นที่ นักพัฒนาเกมและผู้เชี่ยวชาญด้านการออกแบบผลิตภัณฑ์จะสามารถเร่งขั้นตอนการทำงานที่ก่อนหน้านี้ต้องใช้เวลาหลายชั่วโมงในการสร้างแบบจำลองด้วยตนเองและการปรับเชดเดอร์ ด้วยความสามารถในการสร้างเทมเพลตที่พร้อมใช้งานจากภาพถ่าย อุปสรรคในการเข้าสู่การสร้างเนื้อหาที่สมจริงจึงลดลงอย่างมากสำหรับธุรกิจขนาดเล็กและผู้สร้างรายบุคคล

นอกเหนือจากการใช้งานระดับมืออาชีพแล้ว เทคโนโลยีนี้ยังมีศักยภาพที่จะรวมเข้ากับระบบปฏิบัติการโดยตรงที่มุ่งเป้าไปที่ผู้บริโภคปลายทาง โดยอำนวยความสะดวกในการแปลงวัตถุส่วนบุคคลให้เป็นดิจิทัล ลองนึกภาพการถ่ายภาพสิ่งของที่จับต้องได้และแปลงเป็นวัตถุดิจิทัลในทันทีเพื่อแชร์บนโซเชียลมีเดียหรือใช้ในสภาพแวดล้อมการทำงานเสมือนจริง ประสิทธิภาพของโมเดลแฝงขนาดกะทัดรัดยังชี้ให้เห็นว่าการประมวลผลสามารถปรับให้เหมาะสมเพื่อให้เกิดขึ้นภายในเครื่องได้ โดยใช้ประโยชน์จากฮาร์ดแวร์เร่งความเร็วปัญญาประดิษฐ์ที่มีอยู่ในโปรเซสเซอร์สมัยใหม่

ผลกระทบทางเทคนิคต่อการประชุม ICLR 2026

การยอมรับโครงการในการประชุม ICLR 2026 ตอกย้ำความสำคัญทางวิชาการและทางเทคนิคของการค้นพบในด้านคอมพิวเตอร์วิทัศน์ งานนี้ขึ้นชื่อในการคัดเลือกเฉพาะงานวิจัยที่แข็งแกร่งและสร้างสรรค์ที่สุดในสาขาการนำเสนอการเรียนรู้เชิงลึก ด้วยการเปิดตัว LiTo นั้น Apple รวบรวมตำแหน่งของตนในระดับแนวหน้าของการวิจัยในด้าน AI เชิงสร้างสรรค์ที่นำไปใช้กับ 3D โดยแข่งขันโดยตรงกับยักษ์ใหญ่ด้านเทคโนโลยีอื่น ๆ ที่ต้องการลดความซับซ้อนในการสร้างโลกเสมือนจริง

ผู้เชี่ยวชาญในอุตสาหกรรมระบุว่าการสร้างโทเค็นของสนามแสงอาจกลายเป็นมาตรฐานใหม่สำหรับการบีบอัดและส่งข้อมูลสามมิติบนอินเทอร์เน็ต เนื่องจาก LiTo ใช้เวกเตอร์ขนาดกะทัดรัด ขนาดของไฟล์ที่สร้างขึ้นจึงมีขนาดเล็กกว่ารูปแบบเมชแบบดั้งเดิมที่มีพื้นผิวที่มีความละเอียดสูงอย่างมาก การประหยัดแบนด์วิดท์ข้อมูลนี้มีความสำคัญอย่างยิ่งต่อความเป็นไปได้ทางเทคนิคของ metaverses และแพลตฟอร์มการทำงานร่วมกันระยะไกลที่จำเป็นต้องมีการเรนเดอร์แบบเรียลไทม์โดยไม่มีความล่าช้าอย่างเห็นได้ชัดสำหรับผู้เข้าร่วม

วิวัฒนาการของปัญญาประดิษฐ์กำเนิด 3 มิติ

เส้นทางที่ปัญญาประดิษฐ์ดำเนินการในช่วงไม่กี่ปีที่ผ่านมามีจุดสุดยอดอยู่ที่เครื่องมือเช่น LiTo ซึ่งก้าวไปไกลกว่าขั้นตอนของภาพนิ่งและเข้าสู่ยุคของการโต้ตอบเต็มรูปแบบ การเปลี่ยนจาก 2D เป็น 3D ต้องใช้ความเข้าใจอย่างลึกซึ้งว่าสมองของมนุษย์รับรู้ความลึกและสาระสำคัญของวัตถุรอบตัวเราอย่างไร ด้วยการมุ่งเน้นไปที่สนามแสง Apple จัดการกับรากเหง้าของการรับรู้ทางสายตา โดยมอบระดับความสมจริงที่ก่อนหน้านี้สงวนไว้สำหรับการเรนเดอร์ภาพยนตร์ที่ประมวลผลล่วงหน้าเท่านั้น

การวิจัยที่กำลังดำเนินอยู่บ่งชี้ว่าเวอร์ชันในอนาคตของระบบนี้จะสามารถจัดการกับฉากทั้งหมดได้ แทนที่จะเป็นเพียงวัตถุที่แยกออกมา ทำให้สามารถสร้างสภาพแวดล้อมทั้งหมดขึ้นมาใหม่ด้วยความเที่ยงตรงแบบเดียวกันได้ ในตอนนี้ การมุ่งเน้นไปที่วัตถุแต่ละชิ้นทำหน้าที่เป็นข้อพิสูจน์แนวคิดอันทรงพลังว่าปัญญาประดิษฐ์สามารถเรียนรู้ฟิสิกส์เชิงแสงได้ด้วยตนเอง ขณะนี้ตลาดกำลังรอขั้นตอนต่อไปในการทำให้ไลบรารีซอฟต์แวร์เหล่านี้พร้อมใช้งานในเชิงพาณิชย์สำหรับนักพัฒนาในวงกว้าง

  • เวกเตอร์แฝงขนาดกะทัดรัดช่วยให้มั่นใจได้ถึงประสิทธิภาพการจัดเก็บ
  • ความเข้ากันได้กับเอ็นจิ้นการเรนเดอร์เจเนอเรชั่นถัดไป
  • การลดการมองเห็นในวัสดุโลหะและแก้ว
  • อินเทอร์เฟซแบบง่ายที่ต้องใช้เพียงภาพอ้างอิงเท่านั้น

ความสม่ำเสมอของการมองเห็นและความท้าทายในอุตสาหกรรม

หนึ่งในความท้าทายที่ใหญ่ที่สุดของอุตสาหกรรมเทคโนโลยีมักเรียกว่า “หุบเขาลึกลับ” ในคอมพิวเตอร์กราฟิก ซึ่งบางสิ่งดูเกือบจะจริงแต่ทำให้เกิดความรู้สึกไม่สบายเนื่องจากข้อบกพร่องเล็กๆ น้อยๆ LiTo จัดการกับปัญหานี้โดยตรงโดยทำให้แน่ใจว่าแสงสว่างนั้นเป็นไปได้ทางกายภาพในทุกช่วงเวลาของการโต้ตอบ ด้วยการหลีกเลี่ยงรูปลักษณ์ที่บิดเบี้ยวซึ่งพบได้ทั่วไปในวิธีการแข่งขัน ระบบจะรับประกันว่าการเปลี่ยนผ่านระหว่างของจริงและของเสมือนจะราบรื่นที่สุดเท่าที่จะเป็นไปได้สำหรับสายตามนุษย์

ทีมพัฒนาเน้นย้ำว่าแม้ในรูปทรงเรขาคณิตที่ซับซ้อนและเต็มไปด้วยรายละเอียด ความสอดคล้องยังคงอยู่ระหว่างการทดสอบความเครียดของอัลกอริทึม ซึ่งหมายความว่าวัตถุที่มีรู รอยพับ หรือวัสดุซ้อนทับกันจะได้รับการประมวลผลโดยไม่สูญเสียข้อมูลสำคัญเกี่ยวกับพฤติกรรมของแสง ความทนทานนี้เป็นสิ่งที่ทำให้การวิจัยทางวิชาการแตกต่างจากเครื่องมือที่พร้อมที่จะบูรณาการเข้ากับผลิตภัณฑ์อุปโภคบริโภคที่ต้องการความน่าเชื่อถือสูง

อนาคตของการสร้างแบบจำลองดิจิทัลและการเข้าถึง

การทำให้การสร้าง 3 มิติเป็นประชาธิปไตยเป็นหนึ่งในเสาหลักที่ได้รับการสนับสนุนจากความก้าวหน้าของ LiTo ในการพัฒนาในปีต่อๆ ไป เครื่องมือที่ทำให้งานด้านเทคนิคที่ซับซ้อนเป็นไปโดยอัตโนมัติช่วยให้ความคิดสร้างสรรค์ของมนุษย์มุ่งเน้นไปที่การเล่าเรื่องและการทำงานของโครงการ ความสะดวกในการใช้งานที่เสนอโดย Apple แสดงให้เห็นอนาคตที่อุปสรรคทางเทคนิคในการผลิตเนื้อหาคุณภาพสูงจะไม่มีอีกต่อไป โดยมีเพียงพรสวรรค์ของผู้สร้างเท่านั้นที่ยังคงอยู่ในฐานะผู้สร้างความแตกต่างในการแข่งขัน

ด้วยการตีพิมพ์บทความและการรับรองโดยชุมชนวิทยาศาสตร์ LiTo เริ่มต้นการเดินทางในฐานะหนึ่งในเทคโนโลยีที่มีแนวโน้มมากที่สุดแห่งทศวรรษสำหรับคอมพิวเตอร์กราฟิก ความคาดหวังก็คือข้อมูลใหม่เกี่ยวกับการบูรณาการ AI นี้เข้ากับขั้นตอนการออกแบบจะถูกเปิดเผยในไม่ช้า ซึ่งอาจเป็นไปได้ในกิจกรรมที่มุ่งเป้าไปที่นักพัฒนา อุตสาหกรรมยังคงระมัดระวังในการอัปเดต เนื่องจากความสมจริงของภาพเป็นขอบเขตต่อไปที่จะถูกควบคุมโดยปัญญาประดิษฐ์สมัยใหม่

Veja Tambem em Tailandês News

การค้าปลีกแบบดิจิทัลลดมูลค่าของสมาร์ทโฟน Galaxy S25 5G ด้วยโบนัสธนาคารและการแลกเปลี่ยนอุปกรณ์

การค้าปลีกแบบดิจิทัลลดมูลค่าของสมาร์ทโฟน Galaxy S25 5G ด้วยโบนัสธนาคารและการแลกเปลี่ยนอุปกรณ์

อะแดปเตอร์ CarPlay ไร้สายของ Amazon มีส่วนลด 50% และคะแนนการอนุมัติสูงจากไดรเวอร์

อะแดปเตอร์ CarPlay ไร้สายของ Amazon มีส่วนลด 50% และคะแนนการอนุมัติสูงจากไดรเวอร์

ส่วนลดที่สำคัญสำหรับ Galaxy S25 Plus ลดมูลค่าลงต่ำกว่า 4,500 เรียลในร้านค้าออนไลน์

ส่วนลดที่สำคัญสำหรับ Galaxy S25 Plus ลดมูลค่าลงต่ำกว่า 4,500 เรียลในร้านค้าออนไลน์

การลดราคาของ PlayStation 5 Pro ช่วยเร่งยอดค้าปลีกดิจิทัลและลดสต็อกทั่วโลก

การลดราคาของ PlayStation 5 Pro ช่วยเร่งยอดค้าปลีกดิจิทัลและลดสต็อกทั่วโลก

การอัปเดตระบบ Apple ใหม่ช่วยเพิ่มประสิทธิภาพการจัดการงานเร่งด่วนสำหรับผู้ใช้ iPhone

การอัปเดตระบบ Apple ใหม่ช่วยเพิ่มประสิทธิภาพการจัดการงานเร่งด่วนสำหรับผู้ใช้ iPhone

รายละเอียดฮาร์ดแวร์รั่วไหลของ PlayStation แบบพกพารุ่นใหม่พร้อมกราฟิกที่เหนือกว่า Xbox Series S

รายละเอียดฮาร์ดแวร์รั่วไหลของ PlayStation แบบพกพารุ่นใหม่พร้อมกราฟิกที่เหนือกว่า Xbox Series S

Oppo เปิดตัว Find X9 Ultra อย่างเป็นทางการทั่วโลกพร้อมเลนส์ Hasselblad และแบตเตอรี่ที่แข็งแกร่ง

Oppo เปิดตัว Find X9 Ultra อย่างเป็นทางการทั่วโลกพร้อมเลนส์ Hasselblad และแบตเตอรี่ที่แข็งแกร่ง

สมาร์ทโฟนแบบพับได้รุ่นใหม่นำสีทองมาสู่ผู้เข้าแข่งขัน Winter Games

สมาร์ทโฟนแบบพับได้รุ่นใหม่นำสีทองมาสู่ผู้เข้าแข่งขัน Winter Games

Tim Cook เผย iPhone และ iPod ต้นแบบใหม่เพื่อเฉลิมฉลองครบรอบ 50 ปีของ Apple

Tim Cook เผย iPhone และ iPod ต้นแบบใหม่เพื่อเฉลิมฉลองครบรอบ 50 ปีของ Apple

ระบบ Android ได้รับการผสานรวม Gemini Nano 4 สำหรับการประมวลผลแบบออฟไลน์บนสมาร์ทโฟน

ระบบ Android ได้รับการผสานรวม Gemini Nano 4 สำหรับการประมวลผลแบบออฟไลน์บนสมาร์ทโฟน

Leak เผย Lords of the Fallen และ Sword Art Online ในแค็ตตาล็อก PS Plus Essential ประจำเดือนเมษายน

Leak เผย Lords of the Fallen และ Sword Art Online ในแค็ตตาล็อก PS Plus Essential ประจำเดือนเมษายน

Samsung อัปเดตโมดูล QuickStar และขยายการควบคุมด้วยภาพของแผงควบคุมในอินเทอร์เฟซ One UI 8.5

Samsung อัปเดตโมดูล QuickStar และขยายการควบคุมด้วยภาพของแผงควบคุมในอินเทอร์เฟซ One UI 8.5