Sáng tạo đắt tiền của Deepseek: Phát triển AI có giá tăng lên tới 1,6 tỷ đô la

Tác giả: Gabriella Feb 25,2025

Mô hình AI rẻ tiền đáng ngạc nhiên của Deepseek, Deepseek V3, đang làm rung chuyển ngành công nghiệp AI và gây ra những gợn sóng đáng kể, đáng chú ý là giảm giá cổ phiếu lớn cho NVIDIA. Trong khi Deepseek ban đầu tuyên bố chi phí đào tạo chỉ 6 triệu đô la sử dụng 2048 GPU, nhưng một cái nhìn gần hơn cho thấy một khoản đầu tư đáng kể hơn nhiều.

DeepSeek TestHình ảnh: Obligame.com

Kiến trúc sáng tạo của DeepSeek V3 là chìa khóa cho hiệu suất của nó. Nó sử dụng:

  • Dự đoán đa điểm (MTP): Dự đoán nhiều từ đồng thời để cải thiện tốc độ và độ chính xác.
  • Hỗn hợp các chuyên gia (MOE): Sử dụng 256 mạng thần kinh, kích hoạt tám cho mỗi mã thông báo, tăng tốc độ đào tạo và hiệu suất.
  • Sự chú ý tiềm ẩn đa đầu (MLA): Liên tục trích xuất thông tin chính từ các đoạn văn bản để giảm thiểu rủi ro nhìn ra các chi tiết quan trọng.

DeepSeek V3Hình ảnh: Obligame.com

Tuy nhiên, việc bán phân tích đã phát hiện ra việc sử dụng khoảng 50.000 GPU phễu NVIDIA của Deepseek (bao gồm 10.000 H800, 10.000 H100 và GPU H20 bổ sung) lan rộng trên nhiều trung tâm dữ liệu. Cơ sở hạ tầng khổng lồ này đại diện cho tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính khoảng 944 triệu đô la. Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu này, cung cấp tốc độ kiểm soát và đổi mới vô song. Tình trạng tự tài trợ của công ty giúp tăng cường hơn nữa sự nhanh nhẹn của mình.

DeepSeekHình ảnh: Obligame.com

Mức lương cao của Deepseek (một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm), thu hút tài năng hàng đầu của Trung Quốc, đóng góp thêm vào thành công của nó. Con số 6 triệu đô la ban đầu chỉ phản ánh chi phí GPU trước khi đào tạo, bỏ qua nghiên cứu, sàng lọc, xử lý dữ liệu và cơ sở hạ tầng. Đầu tư thực tế của Deepseek vào phát triển AI vượt quá 500 triệu đô la. Mặc dù vậy, cấu trúc nạc của nó cho phép đổi mới hiệu quả so với các đối thủ cạnh tranh lớn hơn, quan liêu hơn.

DeepSeekHình ảnh: Obligame.com

Câu chuyện của Deepseek nhấn mạnh tiềm năng của các công ty AI độc lập, được tài trợ tốt để cạnh tranh với những người khổng lồ đã thành lập. Trong khi câu chuyện "thân thiện với ngân sách" có phần bị thổi phồng, lợi thế về chi phí so với các đối thủ cạnh tranh (ví dụ: 5 triệu đô la của Deepseek cho R1 so với 100 triệu đô la của TATGPT cho TATGPT4O) vẫn còn đáng kể. Thành công của công ty cuối cùng bắt nguồn từ đầu tư đáng kể, tiến bộ công nghệ và một nhóm có tay nghề cao.