Deepseek's Calandy Creation: AI Development Costo se dispara a $ 1.6B

Autor: Gabriella Feb 25,2025

El modelo de IA sorprendentemente económico de Deepseek, Deepseek V3, está sacudiendo la industria de la IA y causando ondas significativas, especialmente una gran caída del precio de las acciones para Nvidia. Mientras que Deepseek inicialmente reclamó un costo de capacitación de solo $ 6 millones utilizando 2048 GPU, un aspecto más cercano revela una inversión mucho más sustancial.

DeepSeek TestImagen: Ensigame.com

La arquitectura innovadora de Deepseek V3 es clave para su rendimiento. Utiliza:

  • Predicción de múltiples token (MTP): Predecir múltiples palabras simultáneamente para mejorar la velocidad y la precisión.
  • Mezcla de expertos (MOE): Empleando 256 redes neuronales, activando ocho para cada token, aumentando la velocidad de entrenamiento y el rendimiento.
  • Atención latente de múltiples cabezas (MLA): Extraiga repetidamente información clave de fragmentos de texto para minimizar el riesgo de pasar por alto los detalles cruciales.

DeepSeek V3Imagen: Ensigame.com

Sin embargo, la semianálisis descubrió el uso de Deepseek de aproximadamente 50,000 GPU de tolva NVIDIA (incluidas 10,000 H800, 10,000 H100 y GPU H20 adicionales) se extendieron en múltiples centros de datos. Esta infraestructura masiva representa una inversión total del servidor de aproximadamente $ 1.6 mil millones, con costos operativos estimados en $ 944 millones. Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee estos centros de datos, proporcionando una velocidad de control e innovación incomparable. El estado autofinanciado de la compañía aumenta aún más su agilidad.

DeepSeekImagen: Ensigame.com

Los altos salarios de Deepseek (algunos investigadores ganan más de $ 1.3 millones anuales), atrayendo al máximo talento chino, contribuyen aún más a su éxito. La cifra inicial de $ 6 millones solo refleja los costos de GPU previa al entrenamiento, omitiendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión real de Deepseek en el desarrollo de IA supera los $ 500 millones. A pesar de esto, su estructura magra permite una innovación eficiente en comparación con competidores más grandes y burocráticos.

DeepSeekImagen: Ensigame.com

La historia de Deepseek destaca el potencial de las compañías de IA independientes bien financiadas para competir con los gigantes establecidos. Si bien la narrativa "económica" está algo inflada, la ventaja de costo en comparación con los competidores (por ejemplo, los $ 5 millones de Deepseek para R1 versus $ 100 millones de ChatGPT para ChatGPT4O) sigue siendo significativo. El éxito de la compañía finalmente proviene de una inversión sustancial, avances tecnológicos y un equipo altamente calificado.