ডিপসেকের আশ্চর্যজনকভাবে সস্তা এআই মডেল শিল্প জায়ান্টদের চ্যালেঞ্জ জানায়। ডিপসেক ভি 3 এর জন্য মাত্র million মিলিয়ন ডলার প্রশিক্ষণ ব্যয়ের দাবি সত্ত্বেও, আরও ঘনিষ্ঠ চেহারাটি আরও বেশি পরিমাণে বিনিয়োগ প্রকাশ করে।
ডিপসিকের স্ব-অনুপ্রবেশ: "হাই, আমি তৈরি হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে," এর উচ্চাকাঙ্ক্ষাকে হাইলাইট করে। এই এআই বাজারকে উল্লেখযোগ্যভাবে প্রভাবিত করেছে, উল্লেখযোগ্যভাবে একটি বড় এনভিআইডিআইএ স্টক ড্রপ ঘটায়।
%আইএমজিপি%চিত্র: ensigame.com
ডিপসেক ভি 3 এর উদ্ভাবনী আর্কিটেকচারটি এর পারফরম্যান্সের মূল চাবিকাঠি:
- মাল্টি-টোকেন পূর্বাভাস (এমটিপি): একসাথে একাধিক শব্দের পূর্বাভাস দেয়, নির্ভুলতা এবং গতি বাড়িয়ে তোলে।
- বিশেষজ্ঞদের মিশ্রণ (এমওই): প্রতিটি টোকেনের জন্য আটটি সক্রিয় করে, প্রশিক্ষণকে ত্বরান্বিত করে এবং কর্মক্ষমতা উন্নত করে 256 নিউরাল নেটওয়ার্ক নিয়োগ করে।
- মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): বারবার মূল বিবরণগুলি আহরণ করে, তথ্য ক্ষতি হ্রাস করে এবং উপদ্রব বোঝার বর্ধন করে।
%আইএমজিপি%চিত্র: ensigame.com
যাইহোক, সেমিয়ানালাইসিস ডিপসিকের বিস্তৃত অবকাঠামো প্রকাশ করেছে: প্রায় 50,000 এনভিডিয়া হপার জিপিইউ (এইচ 800, এইচ 100, এবং এইচ 20 ইউনিট সহ) একাধিক ডেটা সেন্টারে ছড়িয়ে পড়ে। মোট সার্ভার বিনিয়োগ অনুমান করা হয় $ 1.6 বিলিয়ন, অপারেশনাল ব্যয় $ 944 মিলিয়ন ডলারে পৌঁছেছে।
হাই-ফ্লায়ারের সহায়ক সংস্থা ডিপসেক তার ডেটা সেন্টারগুলির মালিক, নিয়ন্ত্রণ এবং দ্রুত উদ্ভাবনের বাস্তবায়ন সরবরাহ করে। এর স্ব-অর্থায়িত স্থিতি তত্পরতা বাড়ায়। উচ্চ বেতন (কিছু গবেষকের জন্য বার্ষিক $ 1.3 মিলিয়ন) শীর্ষস্থানীয় চীনা প্রতিভা আকর্ষণ করে।
%আইএমজিপি%চিত্র: ensigame.com
Million মিলিয়ন ডলার প্রশিক্ষণ ব্যয়ের দাবিটি বিভ্রান্তিকর, যা কেবল প্রাক-প্রশিক্ষণ জিপিইউ ব্যবহারের প্রতিনিধিত্ব করে, গবেষণা, পরিমার্জন, ডেটা প্রসেসিং এবং অবকাঠামো বাদ দিয়ে। ডিপসেকের মোট এআই বিনিয়োগ $ 500 মিলিয়ন ছাড়িয়েছে। এর পাতলা কাঠামো দক্ষ উদ্ভাবনকে সহায়তা করে।
%আইএমজিপি%চিত্র: ensigame.com
ডিপসেকের সাফল্য একটি ভাল অর্থায়িত স্বতন্ত্র এআই সংস্থার সম্ভাব্যতা প্রদর্শন করে। তবে এর "বাজেট-বান্ধব" আখ্যানটি অতিরঞ্জিত; বিলিয়ন বিলিয়ন বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দল গুরুত্বপূর্ণ কারণ। এটি সত্ত্বেও, ডিপসিকের ব্যয়গুলি এখনও প্রতিযোগীদের উল্লেখযোগ্যভাবে আন্ডারকাট করে (উদাঃ, R1 এর জন্য 5 মিলিয়ন ডলার বনাম CHATGPT4O এর জন্য 100 মিলিয়ন ডলার)।