दीपसेक एआई: सस्ती नहीं, विकसित करने के लिए $ 1.6 बिलियन की लागत

हालांकि, यह अभी भी अपने प्रतिद्वंद्वियों की तुलना में सस्ता है।
दीपसेक के नए चैटबॉट ने इस पेचीदा विवरण के साथ खुद को मेरे सामने पेश किया:
नमस्ते, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है।
आज, दीपसेक द्वारा विकसित कृत्रिम बुद्धिमत्ता बाजार में एक दुर्जेय प्रतियोगी के रूप में उभरी है, विशेष रूप से एनवीडिया के सबसे बड़े स्टॉक मूल्य ड्रॉप में से एक में योगदान दिया है।
चित्र: ensigame.com
इस मॉडल को अलग करने के लिए इसकी अभिनव वास्तुकला और प्रशिक्षण के तरीके हैं। यह कई अत्याधुनिक प्रौद्योगिकियों को नियोजित करता है:
मल्टी-टोकन भविष्यवाणी (एमटीपी): एक समय में एक शब्द की भविष्यवाणी करने के बजाय, मॉडल एक वाक्य के विभिन्न भागों का विश्लेषण करके एक साथ कई शब्दों का पूर्वानुमान लगाता है। यह दृष्टिकोण मॉडल की सटीकता और दक्षता दोनों को बढ़ाता है।
विशेषज्ञों का मिश्रण (एमओई): यह आर्किटेक्चर इनपुट डेटा को संसाधित करने के लिए विभिन्न तंत्रिका नेटवर्क का उपयोग करता है। प्रौद्योगिकी एआई प्रशिक्षण को तेज करती है और प्रदर्शन में सुधार करती है। दीपसेक V3 में, 256 तंत्रिका नेटवर्क का उपयोग किया जाता है, जिसमें प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होते हैं।
मल्टी-हेड लेटेंट ध्यान (एमएलए): यह तंत्र एक वाक्य के सबसे महत्वपूर्ण भागों पर ध्यान केंद्रित करने में मदद करता है। MLA केवल एक बार के बजाय बार -बार पाठ टुकड़ों से महत्वपूर्ण विवरण निकालता है, जिससे लापता महत्वपूर्ण जानकारी लापता होने की संभावना कम होती है। इसके लिए धन्यवाद, एआई इनपुट डेटा में महत्वपूर्ण बारीकियों को पकड़ने की अधिक संभावना है।
प्रमुख चीनी स्टार्टअप दीपसेक ने दावा किया कि न्यूनतम लागत के साथ एक प्रतिस्पर्धी एआई मॉडल बनाया गया है, जिसमें कहा गया है कि उन्होंने शक्तिशाली तंत्रिका नेटवर्क डीपसेक वी 3 को प्रशिक्षित करने पर केवल $ 6 मिलियन खर्च किए और सिर्फ 2048 ग्राफिक्स प्रोसेसर का उपयोग किया।
चित्र: ensigame.com
हालांकि, सेमियनलिसिस के विश्लेषकों ने पाया कि डीपसेक एक बड़े कम्प्यूटेशनल बुनियादी ढांचे का संचालन करता है जिसमें लगभग 50,000 एनवीडिया हॉपर जीपीयू शामिल हैं। इसमें 10,000 H800 इकाइयाँ, 10,000 अधिक उन्नत H100, और H20 GPU के अतिरिक्त बैच शामिल हैं। इन संसाधनों को कई डेटा केंद्रों में वितरित किया जाता है और एआई प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग के लिए उपयोग किया जाता है।
सर्वर में कंपनी का कुल निवेश लगभग 1.6 बिलियन डॉलर है, जिसमें परिचालन खर्च $ 944 मिलियन है।
दीपसेक चीनी हेज फंड हाई-फ्लायर की एक सहायक कंपनी है, जो 2023 में एआई प्रौद्योगिकियों पर केंद्रित एक अलग डिवीजन के रूप में स्टार्टअप को बंद कर देती है। क्लाउड प्रदाताओं से कम्प्यूटिंग पावर को किराए पर लेने वाले अधिकांश स्टार्टअप्स के विपरीत, डीपसेक अपने स्वयं के डेटा केंद्रों का मालिक है, यह एआई मॉडल अनुकूलन पर पूर्ण नियंत्रण देता है और नवाचारों के तेजी से कार्यान्वयन को सक्षम करता है। कंपनी स्व-वित्त पोषित बनी हुई है, जो इसके लचीलेपन और निर्णय लेने की गति को सकारात्मक रूप से प्रभावित करती है।
चित्र: ensigame.com
इसके अलावा, दीपसेक के कुछ शोधकर्ता सालाना $ 1.3 मिलियन से अधिक कमाते हैं, प्रमुख चीनी विश्वविद्यालयों से शीर्ष प्रतिभा को आकर्षित करते हैं (कंपनी विदेशी विशेषज्ञों को काम पर नहीं रखती है)।
यहां तक कि इस पर विचार करते हुए, दीपसेक के हालिया $ 6 मिलियन के लिए अपने नवीनतम मॉडल को प्रशिक्षित करने का दावा अवास्तविक लगता है। यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान GPU उपयोग की लागत को संदर्भित करता है और अनुसंधान व्यय, मॉडल शोधन, डेटा प्रसंस्करण, या समग्र बुनियादी ढांचे की लागत के लिए जिम्मेदार नहीं है।
अपनी स्थापना के बाद से, दीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। हालांकि, बड़ी कंपनियों के विपरीत नौकरशाही से बोझिल, डीपसेक की कॉम्पैक्ट संरचना इसे सक्रिय रूप से और प्रभावी रूप से एआई नवाचारों को लागू करने की अनुमति देती है।
चित्र: ensigame.com
दीपसेक का उदाहरण दर्शाता है कि एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी उद्योग के नेताओं के साथ प्रतिस्पर्धा कर सकती है। फिर भी, विशेषज्ञ इस बात पर जोर देते हैं कि कंपनी की सफलता काफी हद तक निवेश, तकनीकी सफलताओं और एक मजबूत टीम में अरबों के कारण है, जबकि एआई मॉडल विकसित करने के लिए "क्रांतिकारी बजट" के बारे में दावे कुछ हद तक अतिरंजित हैं।
फिर भी, प्रतियोगियों की लागत काफी अधिक है। उदाहरण के लिए, मॉडल प्रशिक्षण की लागत की तुलना करें: दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, जबकि CHATGPT4O की लागत $ 100 मिलियन है।
-
PolishHearts Tindo versionविदेश में पोलिश लोगों से जुड़ने के लिए खोज रहे हैं? साथी डंडों से मिलने के लिए दुनिया के सबसे लोकप्रिय ऐप से आगे नहीं देखें - पोलिशहर्स टिंडो संस्करण! चाहे आप एक रिश्ते, दोस्ती, या एक आकस्मिक तारीख की तलाश कर रहे हों, इस ऐप ने आपको कवर किया है। मैचों के ढेरों के साथ हर उपलब्ध
-
Мой Beeline (Казахстан)सहजता से мой beeline (казахстан) ऐप के साथ अपनी बीलाइन सेवाओं को प्रबंधित और नियंत्रित करें। यह शक्तिशाली उपकरण आपको टैरिफ स्विच करने, अपने खर्चों की निगरानी करने, फंडों को स्थानांतरित करने और आसानी से अपने शेष राशि से सीधे भुगतान करने की अनुमति देता है। सुरक्षित और स्विफ्ट लॉगिन विकल्पों के साथ, जुड़े रहना सिर्फ एक है
-
My Movies 3 - Movie & TV Listअपनी फिल्म और टीवी श्रृंखला संग्रह का आयोजन कभी भी मेरी फिल्मों 3 - मूवी और टीवी सूची ऐप के साथ अधिक सुव्यवस्थित नहीं किया गया है। थकाऊ मैनुअल डेटा प्रविष्टि के लिए विदाई और बैच स्कैनिंग की दक्षता को गले लगाओ, जो आपको अपने पूरे संग्रह को तेजी से अनुक्रमित करने की अनुमति देता है। एक विशाल डेटाबेस प्रतियोगिता के साथ
-
free Girls chatअपने सोशल सर्कल का विस्तार करने और ऑनलाइन नई दोस्ती बनाने के इच्छुक हैं? फ्री गर्ल्स चैट ऐप आपका गो-टू सॉल्यूशन है! यह ऐप चैट रूम का एक विविध चयन प्रदान करता है जहां आप भारत, पाकिस्तान और बांग्लादेश सहित विभिन्न देशों की लड़कियों के साथ जुड़ सकते हैं। चाहे आप एम में हों
-
luvdy - Anonymous Dating Among Friendsदोस्ती और रोमांस के नाजुक संतुलन को नेविगेट करना चुनौतीपूर्ण हो सकता है, खासकर जब आप एक दोस्त के साथ प्यार करते हैं लेकिन उनकी भावनाओं के बारे में अनिश्चित होते हैं। प्रवेश करें ** luvdy - दोस्तों के बीच अनाम डेटिंग **, इन भावनाओं को विवेकपूर्ण और सुरक्षित रूप से पता लगाने में मदद करने के लिए डिज़ाइन किया गया अभिनव समाधान। साथ
-
ALGERIA DATING CHATक्या आप अल्जीरिया के एकल पुरुषों और महिलाओं से मिलने के लिए उत्सुक हैं? अल्जीरिया डेटिंग चैट ऐप के साथ सही समाधान की खोज करें! यह प्लेटफ़ॉर्म एक सुरक्षित और आसानी से उपयोग करने वाला वातावरण प्रदान करता है, जिसे अल्जीरियाई एकल के एक विशाल समुदाय के साथ जुड़ने में मदद करने के लिए डिज़ाइन किया गया है। अपनी प्रोफ़ाइल सेट करना पूरी तरह से स्वतंत्र है और एस