最新新闻 (CN)

Bolt Graphics 完成了 Zeus GPU 设计,路径追踪速度加快了 10 倍

GPU Zeus da Bolt Graphics
照片: GPU Zeus da Bolt Graphics - Reprodução

Bolt Graphics 已完成 Zeus 平台测试芯片的流片,进入制造阶段。这家美国初创公司开发了一款图形处理单元,旨在高性能计算、人工智能和高级渲染应用程序。本周的公告标志着迈向商业化的具体一步,强化了路径追踪(一种模拟虚拟环境中光行为的技术)等特定任务中能源效率和高性能的承诺。

注重效率的定制架构

Zeus 采用创新架构,配备基于 RISC-V 的命令处理器和用于特殊任务的专用加速器。该设计在初始芯片中使用台积电的 12 纳米工艺,但该平台已经准备迁移到更先进的技术节点。该公司强调使用 LPDDR5X 和 DDR5 内存代替传统 GDDR,与竞争解决方案相比,降低了生产成本并允许更大的内存容量。

采用可扩展小芯片的模块化方法提供一核、二核或四核配置,适应不同的企业使用场景。这种灵活性使客户能够根据其特定需求选择最合适的解决方案,从更简单的操作到海量数据处理。

提供不同规格的型号

  • Bolt Zeus 1c26:占用1个PCIe插槽,功耗120W,提供32GB LPDDR5X,FP16精度下可实现20TFLOP。
  • Bolt Zeus 2c26:使用两个插槽,功耗 250 W,提供 64 GB 或 128 GB LPDDR5X,最高 256 MB 片上缓存,在 FP16 中达到 40 TFLOP。
  • Bolt Zeus 4c26:达到 500 W 功耗,支持 256 GB LPDDR5X、512 MB 缓存和 FP16 中的 80 TFLOP。

2U 格式的服务器版本显着扩展了数量,有望提供高达 2 GB 的缓存、1 TB 的 LPDDR5X 内存和 5.8 TB/s 的带宽。这些配置优先考虑需要大量内存和密集并行计算的任务,这是数据中心和研究实验室的常见场景。

与当前解决方案的性能比较

Bolt Graphics 将 250 W 2c26 配置与 RTX 5090 进行对比,RTX 5090 的运行功耗约为 575 W。据该公司称,Zeus 在路径跟踪方面的性能提高了 5 倍,在高性能计算工作负载方面的性能提高了 6 倍。在具有四个小芯片的 4c26 版本中,路径跟踪增益高达 10 倍,考虑到较低的能耗,这是一个显着的差异。

该初创公司还提到,与 NVIDIA 机架解决方案相比,复杂操作的总拥有成本最多可降低 17 倍。更大的内存容量似乎是该等式中的决定性因素。在机架中,Zeus 提供的内存比同类竞争系统多出 19 倍,这对于处理大量数据的应用程序来说是一个关键方面。

专家指出,所提供的结果来自硅前模拟,即芯片物理制造之前。还需要对物理硬件进行真实测试来证实厂商的承诺。 Bolt 认识到,预计要到 2027 年底才会进行商业发布,从而有时间进行验证和最终调整。

市场策略和差异化

Bolt Graphics 将 Zeus 主要定位于企业市场,在这些市场中,传统应用程序中的能源效率和内存容量比原始性能更重要。高性能计算和人工智能似乎是优先考虑的事项,而它们在游戏中的使用在商业策略中则次要提及。该提案旨在提供比当前 NVIDIA 和 AMD 解决方案更便宜、更高效的替代方案,探索定制架构提供真正优势的特定利基市场。

对路径跟踪的关注探索了不遵循传统 GPU 的传统着色器模型的专用加速器。相反,Zeus 将 RISC-V 内核与针对光线追踪和物理模拟优化的模块相结合。这种专门的方法解释了特定工作负载的预计收益,但可能会限制依赖纹理和光栅化的传统游戏的性能,这是公司有意识的权衡。

该行业的后续步骤和前景

台积电 12 纳米工艺的流片标志着这家初创公司的发展轨迹取得了具体进展。该公司计划未来转向更先进的技术节点,这可以进一步提高能源效率和整体性能。目前,测试芯片允许在批量生产之前验证设计,从而降低出现大规模问题的风险。据制造商称,客户已经对该平台进行了大约四年的测试,为最终优化提供了宝贵的反馈。

一家提出雄心勃勃提案的初创公司的出现,给图形处理器市场上的 NVIDIA-AMD 双头垄断带来了压力。 Zeus 专注于能源效率和内存容量至关重要的利基市场,为专业渲染和科学计算领域更实惠的选择铺平道路。如果这些承诺在独立测试中得到证实,该平台可能会改变世界各地数据中心和研究实验室可用的解决方案的格局。