最新新聞 (TW)

DeepSeek推出V4但AI界對此消息漠不關心

DeepSeek
Foto: DeepSeek - Juan Alejandro Bernal/sHUTTERSTOCK.COM

中國新創公司 DeepSeek 於 4 月 24 日星期五發布了其 V4 人工智慧模型的預覽版。該公告包括兩個變體:V4 Pro 和 V4 Flash。專家和投資者觀察了這一事件,沒有像一年多前那樣引起軒然大波,當時該公司之前的發布暫時降低了英偉達等巨頭的股票價值。

這家杭州公司承諾在數學、編碼和推理任務方面具有競爭力的表現。 V4 Pro 總共有 1.6 兆個參數,而 Flash 提供了更輕、更經濟的選擇。兩者都支援最多一百萬個令牌的上下文視窗。儘管如此,市場反應平靜。驚訝的時刻已經過去了。

中國國內競爭加劇

近幾個月來,其他中國公司也推出了自己的模式。 Moonshot AI 的 Kimi 和阿里巴巴的 Qwen 改進了他們的產品並縮小了與 DeepSeek 的差距。獨立基準測試將 V4 Pro 列為最佳開放型號之一,但與國內競爭對手相比沒有明顯領先優勢。

  • Kimi 和 Qwen 在最近的測試中縮小了表現差距
  • 自 2025 年初以來,多家中國新創公司定期發布更新
  • 市場焦點已轉向在本地硬體上運行的能力

這種動態改變了情況。曾經看似孤立的飛躍現在已成為中國企業尋求技術主權的集體運動的一部分。

快速進步使期望正常化

去年的推出讓業界措手不及。 DeepSeek 模型以一小部分計算成本提供了接近最佳西方模型的結果。當時的投資者對人工智慧基礎設施上數十億美元的支出提出了質疑。這一次,V4 代表了一種自然的演變,而不是一種衝擊。

分析師強調,該行業已經融入了新參與者將頻繁出現的想法。科技公司的估值反映了這個現實。 V4 引擎的使用成本比許多美國替代產品要低,但它並沒有顯著改變力量平衡。

較長的段落有助於了解產業的發展步伐。 OpenAI 和 Anthropic 等全球公司不斷發布頻繁的更新。同時,中國實驗室對國家晶片的架構進行了調整,尤其是華為的晶片。速度和適應性的結合減少了任何單一廣告的影響。新的事情變成了慣例。

對本地晶片的適應獲得了地緣政治相關性

V4已經過優化,可以在中國硬體上運作良好。這是對美國對先進晶片出口限制的回應。專家認為此舉是中國技術自給自足的更大戰略的一部分。這方面的成功將產生超越人工智慧市場的影響。

DeepSeek 在之前和當前的發布期間一直保持低調。報告提到員工離職和日程安排延誤。儘管如此,該公司在處理長提示和代理任務方面還是做出了改進。據該公司稱,Pro 模型在編碼基準測試中脫穎而出。

V4 Pro 和 Flash 技術細節

Pro版本採用Mixture-of-Experts架構,擁有490億個活動參數。快閃記憶體更輕,擁有 130 億個活動參數,優先考慮速度和低成本。兩者都繼承了 DeepSeek 之前版本的效率理念。

  • 兩種變體中的百萬令牌上下文視窗
  • 專注於推理任務和代理能力
  • 透過 API 使用價格實惠

這些規格吸引了尋求經濟高效選擇的開發人員。然而,仍需要獨立評估來證實該公司關於與封閉的西方模型同等的說法。

市場反應反映產業成熟度

消息公佈後,亞洲半導體公司的股價幾乎沒有波動。晨星等券商的分析師指出,「驚喜因素」已經消失。過去導致估值下降的因素現在被視為已定價趨勢的延續。

在杭州,DeepSeek 仍然是中國人工智慧進步的象徵。據觀察者稱,V4 並沒有縮小與美國領先者在前沿能力方面的差距。儘管如此,它還是增強了中國生態系統即使在硬體限制下也能取得進展的能力。

一個簡短的段落概括了中心思想。此次推出符合預期。他沒有克服它們。這種差異解釋了本週五該行業的平靜基調。

使用者和開發者會發生什麼變化

開發人員今天可以測試預覽版本。 Flash 選項吸引了需要快速反應和低成本的專案。 Pro 適合處理大量文件或大型程式碼庫的人。兩者都可以在開放平台上使用。

對效率的關注繼續使中國的做法與眾不同。雖然西方實驗室利用更多的運算資源進行擴展,但像 DeepSeek 這樣的公司卻尋求充分利用有限的硬體。這項策略影響了關於人工智慧未來的整個全球辯論。

↓ Continue lendo ↓