Deepseekの高価な作成:AI開発コストは16億ドルに急上昇します

著者: Gabriella Feb 25,2025

Deepseekの驚くほど安価なAIモデルであるDeepseek V3は、AI産業を揺さぶり、特にNvidiaの大幅な株価下落を引き起こしています。 Deepseekは当初、2048 GPUを使用してわずか600万ドルのトレーニングコストを請求していましたが、よく見ると、はるかに大きな投資が明らかになりました。

DeepSeek Test画像:Ensigame.com

Deepseek V3の革新的なアーキテクチャは、そのパフォーマンスの鍵です。それは利用します:

  • マルチトークン予測(MTP):速度と精度を改善するために複数の単語を同時に予測します。
  • 専門家(MOE)の混合物: 256のニューラルネットワークを採用し、トークンごとに8つをアクティブにし、トレーニング速度とパフォーマンスを高めます。
  • マルチヘッドの潜在的注意(MLA):重要な詳細を見落とすリスクを最小限に抑えるために、テキストフラグメントから重要な情報を繰り返し抽出します。

DeepSeek V3画像:Ensigame.com

しかし、Semianalysisは、Deepseekが約50,000のNvidia Hopper GPU(10,000 H800、10,000 H100、および追加のH20 GPUを含む)を使用して、複数のデータセンターに広がっていました。この大規模なインフラストラクチャは、サーバーの総投資を約16億ドルで、運用コストは9億4,400万ドルと推定されています。中国のヘッジファンドであるHigh-Flyerの子会社であるDeepseekは、これらのデータセンターを所有しており、比類のない制御と革新の速度を提供しています。同社の自己資金によるステータスは、その敏ility性をさらに高めます。

DeepSeek画像:Ensigame.com

Deepseekの高い給与(一部の研究者は年間130万ドル以上を稼いでいます)、中国のトップの才能を引き付け、その成功にさらに貢献しています。最初の600万ドルの数値は、トレーニング前のGPUコストのみを反映しており、調査、洗練、データ処理、インフラストラクチャを省略しています。 DeepseekのAI開発への実際の投資は5億ドルを超えています。それにもかかわらず、その無駄のない構造により、より大きく、より官僚的な競合他社と比較して効率的なイノベーションが可能になります。

DeepSeek画像:Ensigame.com

Deepseekのストーリーは、確立された巨人と競争するために、資金提供された独立したAI企業の可能性を強調しています。 「予算に優しい」物語はやや膨らんでいますが、競合他社と比較したコストの優位性(たとえば、DeepseekのR1の500万ドルとChatGPT4oの1億ドル)は依然として重要です。同社の成功は、最終的には、実質的な投資、技術の進歩、高度なスキルのあるチームに由来しています。