首頁新聞 DeepSeek的昂貴創作：AI開發成本飆升至1.6B美元

DeepSeek的昂貴創作：AI開發成本飆升至1.6B美元

作者: Gabriella Feb 25,2025

DeepSeek令人驚訝的是廉價的AI模型DeepSeek V3正在搖晃AI行業並引起了巨大的漣漪，尤其是NVIDIA的主要股價下跌。盡管DeepSeek最初使用2048 GPU聲稱培訓成本僅為600萬美元，但仔細觀察顯示出了更大的投資。

DeepSeek Test 圖像：ensigame.com

DeepSeek V3的創新架構是其性能的關鍵。它利用：

多語預測（MTP)：同時預測多個單詞以提高速度和準確性。
專家（MOE)的混合物：使用256個神經網絡，每個令牌激活8個，提高訓練速度和性能。
多頭潛在注意力（MLA)：反複從文本片段中提取關鍵信息，以最大程度地降低忽略關鍵細節的風險。

DeepSeek V3 圖像：ensigame.com

但是，半分析發現DeepSeek使用了大約50,000個NVIDIA HOPPER GPU（包括10,000 H800、10,000 H100和其他H20 GPU)，分布在多個數據中心。這項大規模的基礎設施代表了大約16億美元的服務器投資，運營成本估計為9.44億美元。中國對衝基金High-Flyer的子公司DeepSeek擁有這些數據中心，提供了無與倫比的控製和創新速度。公司的自籌資金地位進一步增強了其敏捷性。

DeepSeek 圖像：ensigame.com

DeepSeek的高薪（一些研究人員每年收入超過130萬美元)，吸引了中國頂級人才，進一步促進了其成功。最初的600萬美元數字僅反映了培訓前的GPU成本，省略了研究，改進，數據處理和基礎架構。 DeepSeek對AI開發的實際投資超過5億美元。盡管如此，與更大的官僚競爭者相比，其精益結構可以有效地創新。

DeepSeek 圖像：ensigame.com

DeepSeek的故事突出了資金龐大，獨立的AI公司與已建立巨頭競爭的潛力。雖然“預算友好”的敘述有些誇大了，但與競爭對手相比（例如，DeepSeek的R1與Chatgpt的Chatgpt $ 1億美元的Chatgpt4o)相比，成本優勢仍然很大。該公司的成功最終源於大量投資，技術進步和高技能的團隊。

最新文章