ডিপসিকের আশ্চর্যজনকভাবে সস্তা এআই মডেল, ডিপসেক ভি 3, এআই শিল্পকে কাঁপছে এবং উল্লেখযোগ্যভাবে রিপলস সৃষ্টি করছে, বিশেষত এনভিআইডিআইএর জন্য একটি বড় স্টক মূল্য হ্রাস। যদিও ডিপসেক প্রাথমিকভাবে 2048 জিপিইউ ব্যবহার করে কেবল million মিলিয়ন ডলার প্রশিক্ষণ ব্যয় দাবি করেছিলেন, তবে একটি ঘনিষ্ঠ চেহারাটি আরও বেশি পরিমাণে বিনিয়োগের প্রকাশ করে।
%আইএমজিপি%চিত্র: ensigame.com
ডিপসেক ভি 3 এর উদ্ভাবনী আর্কিটেকচারটি এর পারফরম্যান্সের মূল চাবিকাঠি। এটি ব্যবহার করে:
- মাল্টি-টোকেন পূর্বাভাস (এমটিপি): উন্নত গতি এবং নির্ভুলতার জন্য একসাথে একাধিক শব্দের পূর্বাভাস দেওয়া।
- বিশেষজ্ঞদের মিশ্রণ (এমওই): প্রতিটি টোকেনের জন্য আটটি সক্রিয় করা, প্রশিক্ষণের গতি এবং কর্মক্ষমতা বাড়িয়ে তোলা 256 নিউরাল নেটওয়ার্ক নিয়োগ করা।
- মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): গুরুত্বপূর্ণ বিবরণগুলি উপেক্ষা করার ঝুঁকি হ্রাস করতে বারবার পাঠ্য খণ্ডগুলি থেকে মূল তথ্য আহরণ করা।
%আইএমজিপি%চিত্র: ensigame.com
যাইহোক, সেমিয়ানালাইসিস ডিপসিকের প্রায় 50,000 এনভিডিয়া হপার জিপিইউ (10,000 এইচ 800, 10,000 এইচ 100, এবং অতিরিক্ত এইচ 20 জিপিইউ সহ) একাধিক ডেটা সেন্টারে ছড়িয়ে পড়েছে uverved এই বিশাল অবকাঠামো মোটামুটি $ 1.6 বিলিয়ন মোট সার্ভার বিনিয়োগের প্রতিনিধিত্ব করে, অপারেশনাল ব্যয়ের আনুমানিক $ 944 মিলিয়ন ডলার। চীনা হেজ তহবিল হাই-ফ্লায়ারের সহায়ক সংস্থা ডিপসেক এই ডেটা সেন্টারগুলির মালিক, অতুলনীয় নিয়ন্ত্রণ এবং উদ্ভাবনের গতি সরবরাহ করে। কোম্পানির স্ব-অর্থায়িত স্থিতি তার তত্পরতা আরও বাড়িয়ে তোলে।
%আইএমজিপি%চিত্র: ensigame.com
ডিপসেকের উচ্চ বেতন (কিছু গবেষক বার্ষিক $ 1.3 মিলিয়ন ডলারের বেশি উপার্জন করেন), শীর্ষ চীনা প্রতিভা আকৃষ্ট করে, আরও সাফল্যে অবদান রাখে। প্রাথমিক $ 6 মিলিয়ন চিত্রটি কেবল প্রাক-প্রশিক্ষণ জিপিইউ ব্যয়কে প্রতিফলিত করে, গবেষণা, পরিমার্জন, ডেটা প্রসেসিং এবং অবকাঠামো বাদ দেয়। এআই বিকাশে ডিপসিকের প্রকৃত বিনিয়োগ $ 500 মিলিয়ন ছাড়িয়েছে। এটি সত্ত্বেও, এর পাতলা কাঠামো বৃহত্তর, আরও আমলাতান্ত্রিক প্রতিযোগীদের তুলনায় দক্ষ উদ্ভাবন সক্ষম করে।
%আইএমজিপি%চিত্র: ensigame.com
ডিপসেকের গল্পটি প্রতিষ্ঠিত জায়ান্টদের সাথে প্রতিযোগিতা করার জন্য সু-অর্থায়িত, স্বতন্ত্র এআই সংস্থাগুলির সম্ভাব্যতা তুলে ধরে। যদিও "বাজেট-বান্ধব" আখ্যানটি কিছুটা স্ফীত হয়েছে, প্রতিযোগীদের তুলনায় ব্যয় সুবিধা (উদাঃ, ডিপসিকের R1 বনাম CHATGPT এর জন্য CHATGPT4O এর জন্য $ 100 মিলিয়ন ডলার) উল্লেখযোগ্য রয়ে গেছে। সংস্থার সাফল্য শেষ পর্যন্ত যথেষ্ট বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি অত্যন্ত দক্ষ দল থেকে উদ্ভূত।