Ang mahal na paglikha ng DeepSeek: Ang gastos sa pag -unlad ng AI hanggang $ 1.6B

May-akda: Gabriella Feb 25,2025

Ang nakakagulat na murang modelo ng Deepseek, ang DeepSeek V3, ay nanginginig sa industriya ng AI at nagdudulot ng mga makabuluhang ripples, lalo na isang pangunahing pagbagsak ng presyo ng stock para sa NVIDIA. Habang ang Deepseek sa una ay nag -angkin ng isang gastos sa pagsasanay na $ 6 milyon lamang gamit ang 2048 GPUs, ang isang mas malapit na hitsura ay nagpapakita ng isang mas malaking pamumuhunan.

DeepSeek TestImahe: ensigame.com

Ang makabagong arkitektura ng Deepseek V3 ay susi sa pagganap nito. Gumagamit ito:

  • Multi-Token Prediction (MTP): Paghuhulaan ng maraming mga salita nang sabay-sabay para sa pinabuting bilis at kawastuhan.
  • Paghahalo ng mga eksperto (MOE): Paggamit ng 256 Neural Networks, pag -activate ng walong para sa bawat token, pagpapalakas ng bilis ng pagsasanay at pagganap.
  • Multi-head Latent pansin (MLA): Paulit-ulit na kumukuha ng mga pangunahing impormasyon mula sa mga fragment ng teksto upang mabawasan ang panganib ng pagtatanaw ng mga mahahalagang detalye.

DeepSeek V3Imahe: ensigame.com

Gayunpaman, ang semianalysis ay walang takip na paggamit ng Deepseek na humigit -kumulang na 50,000 NVIDIA HOPPER GPUs (kasama ang 10,000 H800, 10,000 H100, at karagdagang mga H20 GPU) na kumalat sa maraming mga sentro ng data. Ang napakalaking imprastraktura na ito ay kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon. Ang Deepseek, isang subsidiary ng high-flyer, isang pondo ng hedge ng Tsino, ay nagmamay-ari ng mga sentro ng data na ito, na nagbibigay ng walang kaparis na kontrol at bilis ng pagbabago. Ang katayuan sa sarili na pinondohan ng kumpanya ay higit na nagpapaganda ng liksi nito.

DeepSeekImahe: ensigame.com

Ang mataas na suweldo ng Deepseek (ang ilang mga mananaliksik ay kumita ng higit sa $ 1.3 milyon taun -taon), na umaakit sa nangungunang talento ng Tsino, higit na nag -aambag sa tagumpay nito. Ang paunang $ 6 milyong figure ay sumasalamin lamang sa mga gastos sa pre-training GPU, pagtanggal ng pananaliksik, pagpipino, pagproseso ng data, at imprastraktura. Ang aktwal na pamumuhunan ng Deepseek sa pag -unlad ng AI ay lumampas sa $ 500 milyon. Sa kabila nito, ang istraktura ng sandalan nito ay nagbibigay -daan sa mahusay na pagbabago kumpara sa mas malaki, mas maraming mga kakumpitensya sa burukrata.

DeepSeekImahe: ensigame.com

Ang kwento ng Deepseek ay nagtatampok ng potensyal ng mahusay na pinondohan, independiyenteng mga kumpanya ng AI upang makipagkumpetensya sa mga itinatag na higante. Habang ang salaysay na "friendly-budget" ay medyo napalaki, ang kalamangan sa gastos kumpara sa mga kakumpitensya (hal., Ang $ 5 milyon ng Deepseek para sa $ 100 milyon ng Chatgpt para sa Chatgpt4O) ay nananatiling makabuluhan. Ang tagumpay ng kumpanya sa huli ay nagmumula sa malaking pamumuhunan, pagsulong sa teknolohiya, at isang mataas na bihasang koponan.