दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। दीपसेक वी 3 के लिए केवल $ 6 मिलियन प्रशिक्षण लागत के दावों के बावजूद, एक नज़दीकी नज़र से कहीं अधिक पर्याप्त निवेश का पता चलता है।
दीपसेक का आत्म-परिचय: "हाय, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है," इसकी महत्वाकांक्षा पर प्रकाश डाला गया। इस एआई ने बाजार को काफी प्रभावित किया है, विशेष रूप से एक प्रमुख एनवीडिया स्टॉक ड्रॉप का कारण है।
छवि: ensigame.com
दीपसेक वी 3 की अभिनव वास्तुकला इसके प्रदर्शन के लिए महत्वपूर्ण है:
- मल्टी-टोकन भविष्यवाणी (एमटीपी): सटीकता और गति को बढ़ावा देने, एक साथ कई शब्दों की भविष्यवाणी करता है।
- विशेषज्ञों का मिश्रण (एमओई): 256 तंत्रिका नेटवर्क को नियुक्त करता है, प्रत्येक टोकन के लिए आठ को सक्रिय करता है, प्रशिक्षण में तेजी और प्रदर्शन में सुधार करता है।
- मल्टी-हेड लेटेंट ध्यान (एमएलए): बार-बार प्रमुख विवरण निकालता है, सूचना हानि को कम करता है और बारीक समझ को बढ़ाता है।
छवि: ensigame.com
हालांकि, सेमियनलिसिस ने डीपसेक के व्यापक बुनियादी ढांचे का खुलासा किया: लगभग 50,000 एनवीडिया हॉपर जीपीयू (एच 800, एच 100, और एच 20 यूनिट सहित) कई डेटा केंद्रों में फैले। कुल सर्वर निवेश का अनुमान $ 1.6 बिलियन है, जिसमें परिचालन लागत $ 944 मिलियन तक पहुंचती है।
हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा सेंटरों का मालिक है, जो नियंत्रण और तेजी से नवाचार कार्यान्वयन की पेशकश करती है। इसकी स्व-वित्त पोषित स्थिति चपलता को बढ़ाती है। उच्च वेतन (कुछ शोधकर्ताओं के लिए सालाना $ 1.3 मिलियन से अधिक) शीर्ष चीनी प्रतिभा को आकर्षित करते हैं।
छवि: ensigame.com
$ 6 मिलियन प्रशिक्षण लागत का दावा भ्रामक है, केवल पूर्व-प्रशिक्षण GPU उपयोग का प्रतिनिधित्व करता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़कर। दीपसेक का कुल एआई निवेश $ 500 मिलियन से अधिक है। इसकी दुबला संरचना कुशल नवाचार की सुविधा प्रदान करती है।
छवि: ensigame.com
दीपसेक की सफलता एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी की क्षमता को प्रदर्शित करती है। हालांकि, इसकी "बजट-अनुकूल" कथा अतिरंजित है; निवेश, तकनीकी प्रगति और एक मजबूत टीम में अरबों महत्वपूर्ण कारक हैं। इसके बावजूद, डीपसेक की लागत अभी भी काफी हद तक प्रतियोगियों को कम कर देती है (जैसे, R1 के लिए $ 5 मिलियन बनाम $ 100 मिलियन चैट के लिए $ 100 मिलियन)।