News (CN)

谷歌新算法通过减少人工智能中的内存使用来降低西部数据的股票

Google
照片: Google - Around the World Photos/shutterstock.com

科技巨头谷歌宣布开发出一种首创的压缩算法,该算法可以改变人工智能的基础设施动态。该工具直接工作,大大减少了大规模语言模型和复杂向量搜索系统操作的内存需求。技术进步提出了一种基于软件的解决方案来解决这个问题,在此之前,该问题主要是通过在处理中心添加物理组件来解决的。

该公告引发了全球技术和基础设施市场的重新评估浪潮。投资者和分析师已开始重新计算未来几个季度物理硬件的需求预测,调整对制造云运行所需关键组件的公司的收入预期。

市场关注的焦点集中在具体操作因素上:

– 减少新项目中对超大容量硬盘的依赖。

– 即使在极端压缩级别下也能保持模型准确性。

– 无需重新训练已经运行的人工智能。

传统存储提供商立即在股票市场上感受到了创新的冲击。这种范式转变表明,编程代码可以取代数据中心物理扩展的很大一部分,从而改变大型科技公司的投资路线。

金融市场反应和资产下降

新算法细节公布后不久,西部数据股价大幅下跌。该公司是全球大型企业硬盘和闪存存储解决方案的主要供应商之一,在旨在处理海量数据的数据中心领域拥有广泛的业务。

股票出售走势反映出投资者对硬件需求下降的任何迹象都极为敏感。由于云运营商希望扩大其处理能力而持续大规模采购的预期,内存行业经历了一段高估值时期。

存储领域的其他公司在同一交易时段也出现了价格的负面变化。这种广泛的下跌是孤立发生的,因为当天广泛的技术指数在正值区域运行,表明担忧仅限于物理组件制造商。

市场分析师指出,贬值是对计算机设备领域现实的调整。在这项软件创新向公众推出之前,硬件公司加速增长的许多假设已经反映在股价中。

新压缩系统的技术运作

TurboQuant 通过先进的理论量化技术进行操作,该技术专注于压缩人工智能模型架构中的键值缓存。实际上,谷歌开发的技术在实际操作场景中可以将内存需求减少至少六倍。严格的基准测试表明,在特定图形处理单元上运行时,以四位配置的版本可以提供高达八倍的处理速度增益,从而优化数据流,而无需立即更换设施中的现有机器。

这种新颖性背后的工程结合了复杂的数学方法,例如量化 Johnson-Lindenstrauss 和 PolarQuant,这些方法可以优化上下文信息的存储。吸引开发人员的巨大技术差异是能够实现这种极端压缩,而不会降低机器生成的响应的精度。自动生成编程代码和解决复杂查询等关键任务保持相同的质量水平,从而促进世界各地的软件工程团队立即采用该工具。

西部数据在行业中的商业地位

西部数据在为世界科技巨头提供基础设施方面发挥着核心作用。该公司与大型云服务提供商签订了长期合同,确保其工业运营在短期内有稳定且可预测的收入来源。

该制造商最近的报告显示,其今年预计的所有硬盘产能已全部交付给人工智能领域的买家。这些数据强化了当前对物理存储空间需求的稳健性以及对高性能物理组件的持续依赖。

尽管有这种直接的合同安全性,但压缩算法的进步提出了有关中期设备更新周期的问题。如果软件在即将到来的服务器操作系统更新中在效率方面处于领先地位,那么对存储位持续扩展的需求可能会放缓。

全球数据中心的成本动态

数据中心运营商不断寻找降低物理设施运营成本的方法。硬件的采购是这些科技公司资本预算的最大份额之一,需要不断的财务贡献来保持数据处理的竞争力。

减少对物理服务器需求的算法的实施可以直接节省财务报表。这种优化使公司能够将投资转向新数字服务的开发和先进的机器学习研究。

能源效率和服务器优化

除了节省设备采购费用外,硬件体积的减少还对设施的电能消耗产生积极影响。人工智能工厂需要大量能源来进行连续处理和复杂的工业制冷系统。

运行中的硬盘驱动器和内存模块更少意味着能源需求更低,并且更符合企业可持续发展目标。压缩软件充当信息技术领域的间接能源效率工具。

预计今年的技术演示

谷歌制定了一个时间表,在未来几个月的几次软件工程会议上详细介绍 TurboQuant 和其他相关算法的工作原理。这些活动将展示该技术在受控环境中的实际应用,并鼓励全球技术生态系统中的其他开发人员采用该标准,从而扩大压缩工具的范围。

数据处理基础设施的变化

当前的情况凸显了技术行业为先进人工智能扩展计算资源的方式的转变。从历史上看,对更复杂模型的标准反应是原始增加更多的物理存储和处理能力,直接使组件制造商受益并推动新服务器仓库的建设。现在,天平向代码的复杂性倾斜,应用数学解决了以前需要对物质基础设施进行大量投资的物理瓶颈。传统供应商需要调整其产品组合,以专注于超高性能和低延迟解决方案,而不是仅仅押注于出售给大型互联网公司的大量 TB 数据。软件创新与硬件物理需求的共存将继续决定金融市场的节奏,要求投资者对数字平台的真实基础设施需求以及技术型行业面对独立于不成比例的物理扩张的日益高效的算法的适应能力进行深入的技术分析。