La costosa creazione di DeepSeek: il costo di sviluppo dell'IA aumenta a $ 1,6 miliardi

Autore: Gabriella Feb 25,2025

Il modello di intelligenza artificiale sorprendentemente economico di Deepseek, Deepseek V3, sta scuotendo l'industria dell'intelligenza artificiale e causando note significative, in particolare un importante calo dei prezzi delle azioni per Nvidia. Mentre DeepSeek inizialmente ha rivendicato un costo di formazione di soli $ 6 milioni utilizzando 2048 GPU, uno sguardo più attento rivela un investimento molto più sostanziale.

DeepSeek TestImmagine: Ensigame.com

L'architettura innovativa di Deepseek V3 è la chiave per le sue prestazioni. Utilizza:

  • Previsione multi-token (MTP): Prevedere contemporaneamente più parole per una migliore velocità e precisione.
  • Miscela di esperti (MOE): impiegando 256 reti neurali, attivando otto per ogni token, aumentando la velocità e le prestazioni di allenamento.
  • Attenzione latente multi-testa (MLA): Estrarre ripetutamente informazioni chiave dai frammenti di testo per ridurre al minimo il rischio di trascurare i dettagli cruciali.

DeepSeek V3Immagine: Ensigame.com

Tuttavia, la semianalisi ha scoperto l'uso di DeepSeek di circa 50.000 GPU di Nvidia Hopper (tra cui 10.000 H800, 10.000 H100 e GPU H20 aggiuntive) diffuse su più data center. Questa enorme infrastruttura rappresenta un investimento totale di server di circa $ 1,6 miliardi, con costi operativi stimati in $ 944 milioni. DeepSeek, una consociata di High-Flyer, un hedge fund cinese, possiede questi data center, fornendo un controllo senza pari e velocità di innovazione. Lo stato autofinanziato dell'azienda migliora ulteriormente la sua agilità.

DeepSeekImmagine: Ensigame.com

Gli alti salari di Deepseek (alcuni ricercatori guadagnano oltre $ 1,3 milioni all'anno), attirando i migliori talenti cinesi, contribuiscono ulteriormente al suo successo. La cifra iniziale di 6 milioni di dollari riflette solo i costi della GPU pre-allenamento, omettere la ricerca, la raffinatezza, l'elaborazione dei dati e l'infrastruttura. L'effettivo investimento di Deepseek nello sviluppo dell'IA supera i $ 500 milioni. Nonostante ciò, la sua struttura magra consente un'efficace innovazione rispetto ai concorrenti più grandi e burocratici.

DeepSeekImmagine: Ensigame.com

La storia di Deepseek evidenzia il potenziale di società di intelligenza artificiale ben finanziate e indipendenti di competere con i giganti affermati. Mentre la narrazione "economica" è in qualche modo gonfiata, il vantaggio in termini di costi rispetto ai concorrenti (ad esempio, i $ 5 milioni di Deepseek per R1 contro i $ 100 milioni di CHATGPT per Chatgpt4o) rimane significativo. Il successo dell'azienda alla fine deriva da investimenti sostanziali, progressi tecnologici e un team altamente qualificato.