DeepSeek的昂貴創作:AI開發成本飆升至1.6B美元

作者: Gabriella Feb 25,2025

DeepSeek令人驚訝的是廉價的AI模型DeepSeek V3正在搖晃AI行業並引起了巨大的漣漪,尤其是NVIDIA的主要股價下跌。盡管DeepSeek最初使用2048 GPU聲稱培訓成本僅為600萬美元,但仔細觀察顯示出了更大的投資。

DeepSeek Test圖像:ensigame.com

DeepSeek V3的創新架構是其性能的關鍵。它利用:

  • 多語預測(MTP):同時預測多個單詞以提高速度和準確性。
  • 專家(MOE)的混合物:使用256個神經網絡,每個令牌激活8個,提高訓練速度和性能。
  • 多頭潛在注意力(MLA):反複從文本片段中提取關鍵信息,以最大程度地降低忽略關鍵細節的風險。

DeepSeek V3圖像:ensigame.com

但是,半分析發現DeepSeek使用了大約50,000個NVIDIA HOPPER GPU(包括10,000 H800、10,000 H100和其他H20 GPU),分布在多個數據中心。這項大規模的基礎設施代表了大約16億美元的服務器投資,運營成本估計為9.44億美元。中國對衝基金High-Flyer的子公司DeepSeek擁有這些數據中心,提供了無與倫比的控製和創新速度。公司的自籌資金地位進一步增強了其敏捷性。

DeepSeek圖像:ensigame.com

DeepSeek的高薪(一些研究人員每年收入超過130萬美元),吸引了中國頂級人才,進一步促進了其成功。最初的600萬美元數字僅反映了培訓前的GPU成本,省略了研究,改進,數據處理和基礎架構。 DeepSeek對AI開發的實際投資超過5億美元。盡管如此,與更大的官僚競爭者相比,其精益結構可以有效地創新。

DeepSeek圖像:ensigame.com

DeepSeek的故事突出了資金龐大,獨立的AI公司與已建立巨頭競爭的潛力。雖然“預算友好”的敘述有些誇大了,但與競爭對手相比(例如,DeepSeek的R1與Chatgpt的Chatgpt $ 1億美元的Chatgpt4o)相比,成本優勢仍然很大。該公司的成功最終源於大量投資,技術進步和高技能的團隊。