Дорогое создание DeepSeek: стоимость развития искусственного интеллекта взлетает до 1,6 млрд долларов

Автор: Gabriella Feb 25,2025

Удивительно недорогая модель искусственного интеллекта Deepseek, Deepseek v3, встряхивает индустрию ИИ и вызывает значительную волну, в частности, значительное снижение цен на акции для Nvidia. В то время как DeepSeek первоначально потребовал стоимость обучения всего в 6 миллионов долларов, используя 2048 графических процессоров, более пристальный взгляд показывает гораздо более существенные инвестиции.

DeepSeek TestИзображение: Ensigame.com

Инновационная архитектура DeepSeek V3 является ключом к ее производительности. Он использует:

  • Multi-Token Production (MTP): Прогнозирование нескольких слов одновременно для улучшения скорости и точности.
  • Смесь экспертов (MOE): Использование 256 нейронных сетей, активируя восемь для каждого токена, повышая скорость обучения и производительность.
  • Многоугольное скрытое внимание (MLA): Повторно извлечение ключевой информации из фрагментов текста, чтобы минимизировать риск упуска к себе важных деталей.

DeepSeek V3Изображение: Ensigame.com

Тем не менее, полуанализ обнаружил использование Deepseek примерно в 50 000 графических процессоров Nvidia Hopper (включая 10 000 H800, 10 000 H100 и дополнительных графических процессоров H20) в нескольких центрах обработки данных. Эта массовая инфраструктура представляет собой общие инвестиции в сервер в размере примерно 1,6 млрд. Долл. США, при этом эксплуатационные расходы оцениваются в 944 млн. Долл. США. DeepSeek, дочерняя компания High-Flyer, китайского хедж-фонда, владеет этими центрами обработки данных, обеспечивая беспрецедентную контроль и скорость инноваций. Самофинансируемый статус компании еще больше повышает его ловкость.

DeepSeekИзображение: Ensigame.com

Высокая заработная плата DeepSeek (некоторые исследователи зарабатывают более 1,3 миллиона долларов в год), привлекая лучших китайских талантов, что еще больше способствует его успеху. Первоначальная цифра в 6 миллионов долларов отражает только предварительные затраты на GPU, пропуская исследования, уточнение, обработку данных и инфраструктуру. Фактические инвестиции DeepSeek в развитие ИИ превышают 500 миллионов долларов. Несмотря на это, его скудная структура обеспечивает эффективные инновации по сравнению с более крупными, более бюрократическими конкурентами.

DeepSeekИзображение: Ensigame.com

История Deepseek подчеркивает потенциал хорошо финансируемых, независимых компаний искусственного интеллекта, чтобы конкурировать с известными гигантами. В то время как «Бюджетный» повествование несколько завышено, преимущество затрат по сравнению с конкурентами (например, 5 миллионов долларов США за R1 по сравнению с Catgpt 100 миллионов долларов за CHATGPT4O) остается значительным. Успех компании в конечном итоге связан с существенными инвестициями, технологическими достижениями и высококвалифицированной командой.