Criação cara de Deepseek: o custo de desenvolvimento da IA ​​aumenta para US $ 1,6 bilhão

Autor: Gabriella Feb 25,2025

O modelo de IA surpreendentemente barato de Deepseek, Deepseek V3, está agitando a indústria da IA ​​e causando ondulações significativas, principalmente uma grande queda de preço das ações para a NVIDIA. Embora a Deepseek tenha reivindicado inicialmente um custo de treinamento de apenas US $ 6 milhões usando 2048 GPUs, um visual mais próximo revela um investimento muito mais substancial.

DeepSeek TestImagem: Ensigame.com

A arquitetura inovadora da DeepSeek V3 é a chave para seu desempenho. Utiliza:

  • Previsão com vários toques (MTP): Prevendo várias palavras simultaneamente para melhorar a velocidade e a precisão.
  • Mistura de especialistas (MOE): Empregando 256 redes neurais, ativando oito para cada token, aumentando a velocidade e o desempenho do treinamento.
  • Atenção latente de várias cabeças (MLA): Extraindo repetidamente as informações importantes dos fragmentos de texto para minimizar o risco de ignorar detalhes cruciais.

DeepSeek V3Imagem: Ensigame.com

No entanto, a semiânica descobriu o uso da Deepseek de aproximadamente 50.000 GPUs NVIDIA Hopper (incluindo 10.000 H800, 10.000 H100 e GPUs H20 adicionais) espalhadas por vários data centers. Essa infraestrutura maciça representa um investimento total do servidor de aproximadamente US $ 1,6 bilhão, com custos operacionais estimados em US $ 944 milhões. A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, possui esses data centers, fornecendo controle incomparável de controle e inovação. O status autofinanciado da empresa aumenta ainda mais sua agilidade.

DeepSeekImagem: Ensigame.com

Os altos salários da Deepseek (alguns pesquisadores ganham mais de US $ 1,3 milhão anualmente), atraindo os principais talentos chineses, contribuem para o seu sucesso. O número inicial de US $ 6 milhões reflete apenas custos de GPU pré-treinamento, omitindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento real da Deepseek no desenvolvimento da IA ​​excede US $ 500 milhões. Apesar disso, sua estrutura magra permite inovação eficiente em comparação com concorrentes maiores e mais burocráticos.

DeepSeekImagem: Ensigame.com

A história de Deepseek destaca o potencial de empresas de IA independentes bem financiadas para competir com gigantes estabelecidos. Embora a narrativa "amiga do orçamento" seja um pouco inflada, a vantagem de custo em comparação com os concorrentes (por exemplo, US $ 5 milhões da Deepseek em R1 versus US $ 100 milhões do ChatGPT para ChatGPT4O) permanece significativa. O sucesso da empresa resulta de investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada.