最新新闻 (CN)

DeepSeek推出V4但AI界对此消息漠不关心

DeepSeek
照片: DeepSeek - Juan Alejandro Bernal/sHUTTERSTOCK.COM

中国初创公司 DeepSeek 于 4 月 24 日星期五发布了其 V4 人工智能模型的预览版。该公告包括两个变体:V4 Pro 和 V4 Flash。专家和投资者观察了这一事件,没有像一年多前那样引起轩然大波,当时该公司之前的发布暂时降低了英伟达等巨头的股票价值。

这家杭州公司承诺在数学、编码和推理任务方面具有竞争力的表现。 V4 Pro 总共有 1.6 万亿个参数,而 Flash 提供了更轻、更经济的选择。两者都支持最多一百万个令牌的上下文窗口。尽管如此,市场反应平静。惊讶的时刻已经过去了。

中国国内竞争加剧

近几个月来,其他中国公司也推出了自己的模式。 Moonshot AI 的 Kimi 和阿里巴巴的 Qwen 改进了他们的产品并缩小了与 DeepSeek 的差距。独立基准测试将 V4 Pro 列为最佳开放型号之一,但与国内竞争对手相比没有明显领先优势。

  • Kimi 和 Qwen 在最近的测试中缩小了性能差距
  • 自 2025 年初以来,多家中国初创公司定期发布更新
  • 市场焦点已转向在本地硬件上运行的能力

这种动态改变了情况。曾经看似孤立的飞跃现在已成为中国企业寻求技术主权的集体运动的一部分。

快速进步使期望正常化

去年的推出让业界措手不及。 DeepSeek 模型以一小部分计算成本提供了接近最佳西方模型的结果。当时的投资者对人工智能基础设施上数十亿美元的支出提出了质疑。这一次,V4 代表了一种自然的演变,而不是一种冲击。

分析师强调,该行业已经融入了新参与者将频繁出现的想法。科技公司的估值反映了这一现实。 V4 发动机的使用成本比许多美国替代产品要低,但它并没有显着改变力量平衡。

较长的段落有助于了解行业的发展步伐。 OpenAI 和 Anthropic 等全球公司不断发布频繁的更新。与此同时,中国实验室对国家芯片的架构进行了调整,尤其是华为的芯片。速度和适应性的结合减少了任何单个广告的影响。新的事情变成了惯例。

对本地芯片的适应获得了地缘政治相关性

V4已经过优化,可以在中国硬件上良好运行。这是对美国对先进芯片出口限制的回应。专家认为此举是中国技术自给自足的更大战略的一部分。这方面的成功将产生超出人工智能市场的影响。

DeepSeek 在之前和当前的发布期间一直保持低调。报告提到员工离职和日程安排延误。尽管如此,该公司在处理长提示和代理任务方面还是做出了改进。据该公司称,Pro 模型在编码基准测试中脱颖而出。

V4 Pro 和 Flash 技术细节

Pro版本采用Mixture-of-Experts架构,拥有490亿个活动参数。闪存更轻,拥有 130 亿个活动参数,优先考虑速度和低成本。两者都继承了 DeepSeek 之前版本的效率理念。

  • 两种变体中的百万令牌上下文窗口
  • 专注于推理任务和代理能力
  • 通过 API 使用价格实惠

这些规格吸引了寻求经济高效选择的开发人员。然而,仍需要独立评估来证实该公司关于与封闭的西方模型同等的说法。

市场反应反映行业成熟度

消息公布后,亚洲半导体公司的股价几乎没有波动。晨星等券商的分析师指出,“惊喜因素”已经消失。过去导致估值下降的因素现在被视为已经定价趋势的延续。

在杭州,DeepSeek 仍然是中国人工智能进步的象征。据观察人士称,V4 并没有缩小与美国领先者在前沿能力方面的差距。尽管如此,它还是增强了中国生态系统即使在硬件限制下也能取得进步的能力。

一个简短的段落概括了中心思想。此次推出符合预期。他没有克服它们。这种差异解释了本周五该行业的平静基调。

用户和开发者会发生什么变化

开发人员今天可以测试预览版本。 Flash 选项吸引了需要快速响应和低成本的项目。 Pro 适合那些处理大量文档或大型代码库的人。两者都可以在开放平台上使用。

对效率的关注继续使中国的做法与众不同。虽然西方实验室利用更多的计算资源进行扩展,但像 DeepSeek 这样的公司却寻求充分利用有限的硬件。这一战略影响了关于人工智能未来的整个全球辩论。

↓ Continue lendo ↓