दीपसेक का आश्चर्यजनक रूप से सस्ती एआई मॉडल, डीपसेक वी 3, एआई उद्योग को हिला रहा है और महत्वपूर्ण तरंगों का कारण बन रहा है, विशेष रूप से एनवीडिया के लिए एक प्रमुख स्टॉक मूल्य ड्रॉप। जबकि दीपसेक ने शुरू में 2048 जीपीयू का उपयोग करके केवल $ 6 मिलियन की प्रशिक्षण लागत का दावा किया था, एक नज़दीकी नज़र से कहीं अधिक पर्याप्त निवेश का पता चलता है।
छवि: ensigame.com
दीपसेक वी 3 की अभिनव वास्तुकला इसके प्रदर्शन के लिए महत्वपूर्ण है। यह उपयोग करता है:
- मल्टी-टोकन भविष्यवाणी (एमटीपी): बेहतर गति और सटीकता के लिए एक साथ कई शब्दों की भविष्यवाणी करना।
- विशेषज्ञों का मिश्रण (एमओई): 256 तंत्रिका नेटवर्क को नियोजित करना, प्रत्येक टोकन के लिए आठ को सक्रिय करना, प्रशिक्षण की गति और प्रदर्शन को बढ़ावा देना।
- मल्टी-हेड लेटेंट ध्यान (एमएलए): महत्वपूर्ण विवरणों की अनदेखी के जोखिम को कम करने के लिए पाठ के टुकड़ों से बार-बार महत्वपूर्ण जानकारी निकालना।
छवि: ensigame.com
हालांकि, सेमियालिसिस ने कई डेटा केंद्रों में फैले लगभग 50,000 एनवीडिया हॉपर जीपीयू (10,000 एच 800, 10,000 एच 100 और अतिरिक्त एच 20 जीपीयू सहित) के डीपसेक के उपयोग को उजागर किया। यह बड़े पैमाने पर बुनियादी ढांचा लगभग $ 1.6 बिलियन के कुल सर्वर निवेश का प्रतिनिधित्व करता है, जिसमें परिचालन लागत $ 944 मिलियन है। एक चीनी हेज फंड, हाई-फ्लायर की सहायक कंपनी दीपसेक, इन डेटा केंद्रों का मालिक है, जो अद्वितीय नियंत्रण और नवाचार गति प्रदान करता है। कंपनी की स्व-वित्त पोषित स्थिति अपनी चपलता को और बढ़ाती है।
छवि: ensigame.com
दीपसेक की उच्च वेतन (कुछ शोधकर्ता सालाना $ 1.3 मिलियन से अधिक कमाते हैं), शीर्ष चीनी प्रतिभा को आकर्षित करते हुए, इसकी सफलता में योगदान करते हैं। प्रारंभिक $ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण जीपीयू लागतों को दर्शाता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़ देता है। एआई विकास में दीपसेक का वास्तविक निवेश $ 500 मिलियन से अधिक है। इसके बावजूद, इसकी दुबला संरचना बड़े, अधिक नौकरशाही प्रतियोगियों की तुलना में कुशल नवाचार को सक्षम करती है।
छवि: ensigame.com
दीपसेक की कहानी स्थापित दिग्गजों के साथ प्रतिस्पर्धा करने के लिए अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनियों की क्षमता पर प्रकाश डालती है। जबकि "बजट-अनुकूल" कथा कुछ हद तक फुलाया जाता है, प्रतियोगियों की तुलना में लागत लाभ (जैसे, R1 बनाम CHATGPT के $ 100 मिलियन के लिए Chatgpt4o के लिए R1 बनाम $ 5 मिलियन) महत्वपूर्ण है। कंपनी की सफलता अंततः पर्याप्त निवेश, तकनीकी प्रगति और एक उच्च कुशल टीम से उपजी है।