कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

LinkBlogs · Post by **LinkBlogs** » Tue Jan 28, 2025 1:38 pm

एक कम ज्ञात एआई अनुसंधान प्रयोगशाला, जिसे चीन के एक हेज फंड द्वारा समर्थित किया गया है, ने वैश्विक ध्यान आकर्षित किया है और सिलिकॉन वैली में हलचल मचा दी है।

कुछ इसे "स्पुतनिक पल" कह रहे हैं, DeepSeek ने प्रतीत होता है कि OpenAI, Google और Meta जैसे दिग्गजों को हाई-स्टेक एआई हथियारों की दौड़ में पीछे छोड़ दिया है। प्रयोगशाला के हाल ही में अनावरण किए गए ओपन-सोर्स, reasoning मॉडल, DeepSeek R1, को कहा जा रहा है कि यह प्रमुख गणना और reasoning बेंचमार्क्स पर OpenAI के o1 जैसे टेक उद्योग के प्रमुख एआई मॉडल्स से बेहतर प्रदर्शन कर रहा है।

सोमवार, 27 जनवरी को, इस चीनी प्रयोगशाला का एआई मोबाइल ऐप (जिसे इसके DeepSeek-V3 मॉडल द्वारा संचालित किया गया है) ने प्रतिस्पर्धी ChatGPT को पछाड़ते हुए अमेरिका के Apple App Store पर नंबर 1 फ्री ऐप बन गया।

DeepSeek के एआई मॉडल्स ने न केवल पश्चिमी एआई दिग्गजों को कड़ी टक्कर दी है, बल्कि यह भी आशंकाएं उत्पन्न की हैं कि अमेरिका चीन के साथ उभरते तकनीकी शीत युद्ध के कारण एआई में अपनी प्रमुखता बनाए रखने में संघर्ष कर सकता है।

इसके सफलता ने इस सामान्य विश्वास को भी हिलाकर रख दिया है कि चिप निवेश में अरबों डॉलर खर्च करने से प्रभुत्व सुनिश्चित होता है, जिससे सोमवार को अमेरिकी और यूरोपीय बाजारों के खुलने के बाद प्रौद्योगिकी शेयरों में गिरावट आई।

तो, DeepSeek के पीछे की कहानी क्या है? क्या यह समझाता है कि DeepSeek एआई परिदृश्य में एक विघटनकारी ताकत के रूप में क्यों उभरा है?

DeepSeek क्या है, और इसकी शुरुआत कैसे हुई?

2015 में, लियांग वेनफेंग ने एक चीनी मात्रात्मक हेज फंड, High-Flyer की स्थापना की थी। मात्रात्मक या 'क्वांट' हेज फंड्स ट्रेडिंग एल्गोरिदम और सांख्यिकीय मॉडलों पर निर्भर करते हैं ताकि वे बाजार में पैटर्न ढूंढ़ सकें और स्वचालित रूप से स्टॉक्स खरीदी या बेची जा सकें, Wall Street Journal की रिपोर्ट के अनुसार।

वित्तीय डेटा का विश्लेषण करने और जटिल संचालन का समर्थन करने के लिए, लियांग ने High-Flyer के तहत एक गहरे-सीखने वाली अनुसंधान शाखा Fire-Flyer स्थापित की और सुपरकंप्यूटर बनाने के लिए ग्राफिक्स प्रोसेसिंग यूनिट्स (GPUs) जमा की।

फिर, 2023 में, लियांग ने फंड के संसाधनों को DeepSeek नामक एक नई कंपनी में मोड़ने का निर्णय लिया, जिसका उद्देश्य मौलिक एआई मॉडलों का विकास करना और अंततः कृत्रिम सामान्य बुद्धिमत्ता (AGI) को हासिल करना था।

DeepSeek की शोध टीम में शामिल होने के लिए लियांग ने चीन के शीर्ष विश्वविद्यालयों से पीएचडी छात्रों को चुना, भले ही उनके पास उद्योग का अनुभव नहीं था, चीनी तकनीकी समाचार साइट QBitAI की रिपोर्ट के अनुसार।

"हमारी मुख्य तकनीकी स्थितियां ज्यादातर उन लोगों से भरी हैं जो इस साल या पिछले एक या दो साल में स्नातक हुए हैं," लियांग ने 36Kr से कहा।

लियांग का यह तरीका, जो उच्च निवेश और कम लाभ वाले अनुसंधान पर केंद्रित था, DeepSeek की सफलता का कारण माना जाता है।

"पूरी टीम में एक सहयोगी संस्कृति और कठोर अनुसंधान के प्रति समर्पण है," Zihan Wang, एक पूर्व DeepSeek कर्मचारी, को MIT Technology Review द्वारा उद्धृत किया गया।

DeepSeek अन्य एआई खिलाड़ियों से कैसे अलग है?

कई महत्वपूर्ण मील के पत्थर हासिल करने के बावजूद, DeepSeek रिपोर्ट के अनुसार एआई अनुसंधान पर केंद्रित है और इसके पास अपने एआई मॉडलों को वाणिज्यिक बनाने की तत्काल कोई योजना नहीं है।

"अगर आप मुझसे पूछें तो मुझे DeepSeek स्थापित करने के लिए कोई वाणिज्यिक कारण नहीं मिलेगा," लियांग को 36Kr द्वारा उद्धृत किया गया। "बेसिक साइंस रिसर्च का बहुत कम रिटर्न-ऑन-इन्वेस्टमेंट अनुपात होता है। जब OpenAI के शुरुआती निवेशकों ने इसमें पैसे दिए, तो वे निश्चित रूप से यह नहीं सोच रहे थे कि उन्हें कितना रिटर्न मिलेगा। बल्कि, वे यह चाहते थे कि वे सच में यह काम करना चाहते थे," उन्होंने कहा।

DeepSeek Baidu, Alibaba, और ByteDance जैसी तकनीकी दिग्गजों से फंडिंग पर निर्भर नहीं करता। इसे केवल High-Flyer द्वारा समर्थित किया गया है। इसके पास चिप निर्माता AMD के साथ एक साझेदारी है, जो इसके मॉडल जैसे DeepSeek-V3 को AMD Instinct GPUs और ROCM सॉफ़्टवेयर का उपयोग करके संचालित करने की अनुमति देती है, Forbes की रिपोर्ट के अनुसार।

DeepSeek चीन की प्रमुख एआई कंपनियों में से एक है जिसने ओपन-सोर्स सिद्धांतों को अपनाया है।

ओपन-सोर्स एआई मॉडल्स को डाउनलोड, संशोधित और फिर से उपयोग करने के लिए किसी के लिए उपलब्ध कराया जाता है। इसके अलावा, ओपन-सोर्स लाइसेंसों के तहत एआई मॉडल और प्रशिक्षण डेटासेट जारी करने से शोध समुदाय की सद्भावना मिलती है और अधिक उपयोगकर्ताओं और डेवलपर्स को आकर्षित किया जा सकता है, जिससे मॉडल्स और अधिक उन्नत हो सकते हैं।

हालांकि, ओपन-सोर्स एआई मॉडल्स कुछ सुरक्षा जोखिमों के साथ आते हैं क्योंकि इन्हें गलत तरीके से इस्तेमाल किया जा सकता है, जैसे एआई द्वारा उत्पन्न गैर-संवेदनशील यौन चित्रण और बाल यौन शोषण सामग्री (CSAM) बनाना।

अब तक DeepSeek ने कौन से एआई मॉडल जारी किए हैं?

DeepSeek के एआई मॉडल्स को Mixture-of-Experts (MoE) आर्किटेक्चर और Multi-Head Latent Attention को शामिल करके ऑप्टिमाइज़ किया गया है, साथ ही उन्नत मशीन-लर्निंग तकनीकों जैसे reinforcement learning और distillation का उपयोग किया गया है।

यहां कुछ ओपन-सोर्स एआई मॉडल्स हैं जो DeepSeek ने विकसित किए हैं:
• DeepSeek Coder: एक ओपन-सोर्स एआई मॉडल जो कोडिंग संबंधित कार्यों के लिए डिज़ाइन किया गया है।
• DeepSeek LLM: एक एआई मॉडल जिसमें 67 बिलियन पैरामीटर हैं, जो अन्य बड़े भाषा मॉडल्स (LLMs) को चुनौती देता है।
• DeepSeek-V2: एक कम लागत वाला एआई मॉडल जो मजबूत प्रदर्शन का दावा करता है।
• DeepSeek-Coder-V2: एक एआई मॉडल जिसमें 236 बिलियन पैरामीटर हैं, जो जटिल कोडिंग चुनौतियों के लिए डिज़ाइन किया गया है।
• DeepSeek-V3: एक 671 बिलियन पैरामीटर वाला एआई मॉडल जो कोडिंग, अनुवाद, और निबंध और ईमेल लिखने जैसे कार्यों को संभाल सकता है।
• DeepSeek-R1: एक एआई मॉडल जो reasoning कार्यों के लिए डिज़ाइन किया गया है, जो OpenAI के प्रमुख o1 मॉडल को चुनौती देता है।
• DeepSeek-R1-Distill: एक एआई मॉडल जिसे DeepSeek R1 द्वारा उत्पन्न कृत्रिम डेटा पर आधारित फाइन-ट्यून किया गया है।

DeepSeek के लिए आगे क्या है?

DeepSeek के एआई मॉडल्स के पीछे का नवाचार दुर्लभता से प्रेरित है। 2022 से, अमेरिकी सरकार ने निर्यात नियंत्रण की घोषणा की है, जिसने चीनी एआई कंपनियों को Nvidia के H100 जैसे GPUs तक पहुँचने से रोक दिया है। जबकि DeepSeek ने प्रतिबंधों से पहले 10,000 H100 GPUs से अधिक जमा किए थे, इसके सीमित संसाधनों का मतलब था कि उसे इनका अधिक प्रभावी ढंग से उपयोग करना पड़ा।

हालांकि DeepSeek ने नवीनतम हार्डवेयर तक पहुंच के बिना शक्तिशाली एआई मॉडल विकसित और तैनात करने में सक्षम हो गया है, लेकिन इसे अंततः कंप्यूटिंग संसाधनों की खाई को पाटने की आवश्यकता हो सकती है ताकि वह अमेरिका की कंपनियों से अधिक प्रभावी तरीके से प्रतिस्पर्धा कर सके, जिनके पास प्रचुर मात्रा में कंप्यूटिंग संसाधन हैं।

सोशल मीडिया पर कई उपयोगकर्ताओं ने यह भी指出 किया है कि DeepSeek के एआई चैटबोट को चीन और उसकी सरकार के बारे में संवेदनशील सवालों के जवाबों को सेंसर करने के लिए संशोधित किया गया है। इस चैटबोट के कथित सेंसरशिप प्रतिबंधों से इसके वैश्विक स्तर पर व्यापक रूप से अपनाए जाने में चुनौती हो सकती है।

Stayalive · Post by **Stayalive** » Tue Jan 28, 2025 4:02 pm

ChatGPT ne public ki soch ko apne mein ghira liya tha, aur Altman AI salesmen ke media-savvy chehre ke roop mein sabse zyada pehchana gaya tha, to — agar woh celebrity voices ko lekar weird feuds bandh kar sake aur apni behen ke saath allegedly abuse karne ke liye liable na paya jaye — to shayad woh hi?

Ab yahaan aate hain Liang Wenfeng, jo DeepSeek ke founder aur CEO hain, jinka chehra itna unknown hai ki unke Wikipedia entry par bhi unki photo nahi hai, aur Getty archive mein bhi unka koi photo nahi milta. (Woh pichle hafte Beijing Symposium mein nazar aaye the, agar aapko dekhna ho ki woh kaise dikhte hain.) DeepSeek media-facing, market-facing waters mein nahi utarta jo posturing U.S. AI giants ka hissa hain. Jo kuch unke paas hai, woh hai ek behtar product — ek tez, bahut sasta product jo ek aisi promise ko pura karta hai jo Altman bhool gaya tha: Yeh open source hai.

Aur internet ki is flattened duniya mein, lagta hai ki bas itna hi chahiye. Open AI needs to update.....

Warrior · Post by **Warrior** » Wed Jan 29, 2025 9:59 am

DeepSeek का सबसे बड़ा लाभ यह है कि इसका चैटबोट बिना किसी लिमिटेशन के मुफ्त में उपयोग किया जा सकता है और इसके APIs बहुत सस्ते हैं। दूसरी ओर, ChatGPT के पास अधिक एडवांस्ड फीचर्स के लिए पेड ऑप्शंस हैं।

यह DeepSeek को उन यूज़र्स के लिए एक बेहतरीन विकल्प बनाता है जो बिना किसी खर्च के एक सीधा AI अनुभव चाहते हैं।

Realrider · Post by **Realrider** » Wed Jan 29, 2025 8:18 pm

यहां चार प्रमुख अंतर दिए गए हैं जो DeepSeek और ChatGPT के बीच हैं, जिन्हें आगामी कोडर्स को अपने आवश्यकताओं के अनुसार सही AI टूल चुनते समय ध्यान में रखना चाहिए:

1. टेक्स्ट-आधारित बनाम मल्टीमोडल AI: DeepSeek केवल टेक्स्ट-आधारित उत्तरों पर केंद्रित है, जबकि ChatGPT AI-जनित इमेजेस, वॉयस इंटरएक्शंस, और इमेज एनालिसिस भी प्रदान करता है। अगर आप एक इंटरएक्टिव AI की तलाश में हैं, तो ChatGPT को प्राथमिकता है।
2. कोडिंग प्रदर्शन और वेब एक्सेस: DeepSeek कोडिंग के लिए शानदार है—यह कोड जनरेट करता है और तकनीकी सवालों के अच्छे उत्तर देता है। दोनों AI मॉडल वेब सर्च का समर्थन करते हैं, ताकि आपको हमेशा अद्यतन, प्रासंगिक प्रोग्रामिंग सहायता मिल सके।
3. ओपन-सोर्स बनाम क्लोज्ड मॉडल: DeepSeek ओपन-सोर्स (MIT लाइसेंस) है, यानी डेवलपर्स इसे स्वतंत्र रूप से संशोधित और एकीकृत कर सकते हैं। ChatGPT प्रोपाइटरी है, इसलिए आप इसके बैकएंड तक पहुंच नहीं सकते या इसे संशोधित नहीं कर सकते।
4. निम्न विकास लागत, उच्च संभावनाएं: DeepSeek को $6 मिलियन से कम में बनाया गया था, जबकि OpenAI ने ChatGPT पर अरबों डॉलर खर्च किए। यह साबित करता है कि AI नवाचार केवल बड़ी टेक कंपनियों के लिए नहीं है—कोई भी कोडर कुछ शक्तिशाली बना सकता है!

आगामी कोडर्स के लिए, DeepSeek AI विकास की दुनिया में बिना भारी वित्तीय बोझ के प्रवेश करने का एक अनूठा अवसर प्रदान करता है। इसकी ओपन-सोर्स प्रकृति, लागत-प्रभावशीलता, और मजबूत कोडिंग क्षमताओं के साथ, यह एक ऐसा प्लेटफॉर्म है जहां प्रयोग, संशोधन और निर्माण करना संभव है। जबकि ChatGPT मल्टीमोडल क्षमताओं में उत्कृष्ट है, DeepSeek का फोकस कोडिंग और तकनीकी सवालों पर इसे उन डेवलपर्स के लिए एक बेहतरीन विकल्प बनाता है जो अपनी AI क्षमताओं को और निखारना चाहते हैं। विकास की संभावनाओं के साथ, DeepSeek आपकी AI यात्रा के लिए एक कदम आगे हो सकता है।

हिंदी डिस्कशन फोरम - हिंदी प्रेमियों को एक सूत्र में पिरोने की सुभावना से किया गया एक सामूहिक प्रयास

कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

Re: कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

Re: कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

Re: कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?