2026 年 3 月,苹果研究院正式推出 LiTo,这是一项旨在创建高保真三维物体的创新人工智能技术。该系统使用基于表面光场的方法将单个二维照片转换为完整、详细的 3D 模型。该工具可以同时处理对象的几何形状及其视觉外观,确保以自然的方式保留亮度和反射等复杂元素。
arXiv 存储库中发表的一篇科学文章详细介绍了这一进展,并被接受在 ICLR 2026 国际会议上发表。与之前仅关注物理形状重建的方法不同,LiTo 专注于整合光线和视角的潜在表示。结果允许用户和开发人员创建数字资产,以与现实世界相同的方式对虚拟环境的照明做出反应。
光场标记化系统如何工作
LiTo 架构的工作原理是将 RGB-D 图像视为复杂表面光场的样本,并将这些数据转换为紧凑的潜在向量。这种创新技术使人工智能能够了解光如何与不同材料相互作用,从高反射金属表面到哑光和不透明纹理。通过将几何形状和外观统一到单个数据实体中,Apple 消除了传统自动建模软件中常见的扭曲。
这项技术的巨大区别在于能够重现研究人员所说的视点相关外观。在传统的 3D 模型中,发光通常是静态的或“绘制”到纹理中,当相机在对象周围移动时,这会破坏沉浸感。使用 LiTo,镜面高光会根据观察者的视角移动,以物理精度模拟光子撞击三维空间中的固体表面时的行为。
- 集成几何处理和动态照明。
- 从单个输入图像生成模型。
- 保留复杂表面上的镜面反射。
- 显着减少增强现实的资产创建时间。
重建表面和反射的准确性
库比蒂诺团队进行的测试表明,LiTo 在高度视觉复杂的场景中优于当前的重建技术。与业界广泛使用的方法相比,苹果的新工具即使在具有不规则几何形状的物体中也能保持边缘的完整性和光线过渡的平滑度。这解决了摄影测量和人工智能生成中的一个长期问题,其中闪亮的表面通常会在生成对象的最终网格中产生噪音或变形。
研究小组强调,物体表面的反射位置会自然变化,以算法的方式遵循光学定律。此功能对于在混合现实环境中集成虚拟对象至关重要,其中视觉一致性决定了用户体验的质量。该系统在电子产品、家居用品和服装等多种类别中进行了测试,在所有样本组中提供了一致的结果。
设备生态系统中的实际应用
LiTo 的实施为多个技术领域的重大改进打开了大门,特别是在空间计算设备应用程序的开发方面。游戏开发人员和产品设计专业人员将能够加快以前需要数小时的手动建模和着色器调整的工作流程。由于能够从照片生成现成的模板,对于小型企业和个人创作者来说,创建沉浸式内容的门槛变得相当低。
除了专业用途外,该技术还有可能直接集成到面向最终消费者的操作系统中,从而促进个人物品的数字化。想象一下捕获物理物品的照片并立即将其转换为数字对象,以便在社交媒体上共享或在虚拟生产力环境中使用。紧凑潜在模型的效率还表明,可以利用现代处理器中存在的人工智能加速硬件,优化处理以在本地进行。
对 ICLR 2026 会议的技术影响
该项目在 ICLR 2026 会议上的接受强化了这一发现对于计算机视觉领域的学术和技术重要性。该活动以仅选择深度学习表示领域最稳健和创新的研究而闻名。通过推出 LiTo,Apple 巩固了其在 3D 生成人工智能研究领域的前沿地位,与其他寻求简化虚拟世界创建的科技巨头直接竞争。
业内专家表示,光场的通证化可能成为互联网上压缩和传输三维数据的新标准。由于 LiTo 使用紧凑向量,因此生成的文件的大小明显小于具有高分辨率纹理的传统网格格式。这种数据带宽节省对于元宇宙和远程协作平台的技术可行性至关重要,这些平台需要实时渲染,且参与者不会出现明显的延迟。
3D生成人工智能的演变
近年来人工智能所走的道路最终出现在LiTo等工具上,它超越了静态图像阶段,进入了全交互时代。从 2D 到 3D 的转变需要深入了解人脑如何感知周围物体的深度和物质性。通过专注于光场,Apple 解决了视觉感知的根源,提供了以前仅用于预处理电影渲染的真实感。
正在进行的研究表明,该系统的未来版本将能够处理整个场景,而不仅仅是孤立的对象,从而能够以相同的保真度重建整个环境。目前,对单个物体的关注可以作为人工智能可以自主学习光学物理的有力概念证明。市场现在正在等待下一步的行动,以使这些软件库向广大开发者提供商业化。
- 紧凑的潜在向量确保了存储效率。
- 与下一代渲染引擎的兼容性。
- 减少金属材料和玻璃中的视觉伪影。
- 简化的界面,仅需要参考图像。
视觉一致性和行业挑战
科技行业面临的最大挑战之一一直是计算机图形学中所谓的“恐怖谷”,即某些东西看起来几乎真实,但由于小缺陷而引起不适。 LiTo 通过确保光照在所有交互时刻的物理合理性来直接解决这个问题。通过避免竞争方法中常见的扭曲外观,该系统确保真实与虚拟之间的过渡对于人眼来说尽可能平滑。
开发团队强调,即使在复杂的几何形状和充满细节的情况下,算法的压力测试过程中也能保持一致性。这意味着处理带有孔、折叠或材料重叠的物体时不会丢失有关光应如何表现的关键信息。这种稳健性是学术研究与准备集成到需要高可靠性的消费产品中的工具的区别。
数字建模和可访问性的未来
3D 创作的民主化是 LiTo 在未来几年发展中可以支持的支柱之一。自动执行复杂技术任务的工具使人类的创造力能够专注于项目的叙述和功能。苹果提出的易用性表明,未来制作高质量内容的技术障碍将不再存在,只有创作者的才能才能成为竞争优势。
随着文章的发表和科学界的验证,LiTo 开始了其作为计算机图形学十年来最有前途的技术之一的旅程。预计有关将人工智能集成到设计工作流程中的新数据将很快公布,可能是针对开发人员的活动。该行业仍然对更新保持警惕,因为视觉现实主义是现代生成人工智能要掌握的下一个前沿领域。

