कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

विज्ञान एवं तकनीकी डिस्कशन यहां करें।
Forum rules
हिन्दी डिस्कशन फोरम में पोस्टिंग एवं पेमेंट के लिए नियम with effect from 18.12.2024

1. यह कोई paid to post forum नहीं है। हम हिंदी को प्रोत्साहन देने के लिये कुछ आयोजन करते हैं और पुरस्कार भी उसी के अंतर्गत दिए जाते हैं। अभी निम्न आयोजन चल रहा है
https://hindidiscussionforum.com/viewto ... t=10#p4972

2. अधिकतम पेमेंट प्रति सदस्य -रुपये 1000 (एक हजार मात्र) पाक्षिक (हर 15 दिन में)।

3. अगर कोई सदस्य एक हजार से ज्यादा रुपये की पोस्टिग करता है, तो बचे हुए रुपये का बैलन्स forward हो जाएगा और उनके account में जुड़ता चला जाएआ।

4. सदस्यों द्वारा करी गई प्रत्येक पोस्टिंग का मौलिक एवं अर्थपूर्ण होना अपेक्षित है।

5. पेमेंट के पहले प्रत्येक सदस्य की postings की random checking होती है। इस दौरान यदि उनकी postings में copy /paste अथवा अनर्थपूर्ण content की मात्रा अधिक/अनुचित पाई जाती है, तो उन्हें एक रुपये प्रति पोस्ट के हिसाब से पेमेंट किया जाएगा।

6. अगर किसी सदस्य की postings में नियमित रूप से copy /paste अथवा अनर्थपूर्ण content की मात्रा अधिक/अनुचित पाई जाती है, तो उसका account deactivate होने की प्रबल संभावना है।

7. किसी भी विवादित स्थिति में हिन्दी डिस्कशन फोरम संयुक्त परिवार के management द्वारा लिया गया निर्णय अंतिम एवं सर्वमान्य होगा।

8. यह फोरम एवं इसमे आयोजित सारी प्रतियोगिताएं हिन्दी प्रेमियों द्वारा, हिन्दी प्रेमियों के लिए, सुभावना लिए, प्रेम से किया गया प्रयास मात्र है। यदि इसे इसी भावना से लिया जाए, तो हमारा विश्वास है की कोई विशेष समस्या नहीं आएगी।

यदि फिर भी .. तो कृपया हमसे संपर्क साधें। आपकी समस्या का उचित निवारण करने का यथासंभव प्रयास करने हेतु हम कटिबद्ध है।
Post Reply
LinkBlogs
या खुदा ! एक हज R !!! पोस्टर महा लपक के वाले !!!
Posts: 1746
Joined: Sat Jul 13, 2024 10:35 am
Contact:

कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

Post by LinkBlogs »

एक कम ज्ञात एआई अनुसंधान प्रयोगशाला, जिसे चीन के एक हेज फंड द्वारा समर्थित किया गया है, ने वैश्विक ध्यान आकर्षित किया है और सिलिकॉन वैली में हलचल मचा दी है।

कुछ इसे "स्पुतनिक पल" कह रहे हैं, DeepSeek ने प्रतीत होता है कि OpenAI, Google और Meta जैसे दिग्गजों को हाई-स्टेक एआई हथियारों की दौड़ में पीछे छोड़ दिया है। प्रयोगशाला के हाल ही में अनावरण किए गए ओपन-सोर्स, reasoning मॉडल, DeepSeek R1, को कहा जा रहा है कि यह प्रमुख गणना और reasoning बेंचमार्क्स पर OpenAI के o1 जैसे टेक उद्योग के प्रमुख एआई मॉडल्स से बेहतर प्रदर्शन कर रहा है।

सोमवार, 27 जनवरी को, इस चीनी प्रयोगशाला का एआई मोबाइल ऐप (जिसे इसके DeepSeek-V3 मॉडल द्वारा संचालित किया गया है) ने प्रतिस्पर्धी ChatGPT को पछाड़ते हुए अमेरिका के Apple App Store पर नंबर 1 फ्री ऐप बन गया।

DeepSeek के एआई मॉडल्स ने न केवल पश्चिमी एआई दिग्गजों को कड़ी टक्कर दी है, बल्कि यह भी आशंकाएं उत्पन्न की हैं कि अमेरिका चीन के साथ उभरते तकनीकी शीत युद्ध के कारण एआई में अपनी प्रमुखता बनाए रखने में संघर्ष कर सकता है।

इसके सफलता ने इस सामान्य विश्वास को भी हिलाकर रख दिया है कि चिप निवेश में अरबों डॉलर खर्च करने से प्रभुत्व सुनिश्चित होता है, जिससे सोमवार को अमेरिकी और यूरोपीय बाजारों के खुलने के बाद प्रौद्योगिकी शेयरों में गिरावट आई।

तो, DeepSeek के पीछे की कहानी क्या है? क्या यह समझाता है कि DeepSeek एआई परिदृश्य में एक विघटनकारी ताकत के रूप में क्यों उभरा है?

DeepSeek क्या है, और इसकी शुरुआत कैसे हुई?

2015 में, लियांग वेनफेंग ने एक चीनी मात्रात्मक हेज फंड, High-Flyer की स्थापना की थी। मात्रात्मक या 'क्वांट' हेज फंड्स ट्रेडिंग एल्गोरिदम और सांख्यिकीय मॉडलों पर निर्भर करते हैं ताकि वे बाजार में पैटर्न ढूंढ़ सकें और स्वचालित रूप से स्टॉक्स खरीदी या बेची जा सकें, Wall Street Journal की रिपोर्ट के अनुसार।

वित्तीय डेटा का विश्लेषण करने और जटिल संचालन का समर्थन करने के लिए, लियांग ने High-Flyer के तहत एक गहरे-सीखने वाली अनुसंधान शाखा Fire-Flyer स्थापित की और सुपरकंप्यूटर बनाने के लिए ग्राफिक्स प्रोसेसिंग यूनिट्स (GPUs) जमा की।

फिर, 2023 में, लियांग ने फंड के संसाधनों को DeepSeek नामक एक नई कंपनी में मोड़ने का निर्णय लिया, जिसका उद्देश्य मौलिक एआई मॉडलों का विकास करना और अंततः कृत्रिम सामान्य बुद्धिमत्ता (AGI) को हासिल करना था।

DeepSeek की शोध टीम में शामिल होने के लिए लियांग ने चीन के शीर्ष विश्वविद्यालयों से पीएचडी छात्रों को चुना, भले ही उनके पास उद्योग का अनुभव नहीं था, चीनी तकनीकी समाचार साइट QBitAI की रिपोर्ट के अनुसार।

"हमारी मुख्य तकनीकी स्थितियां ज्यादातर उन लोगों से भरी हैं जो इस साल या पिछले एक या दो साल में स्नातक हुए हैं," लियांग ने 36Kr से कहा।

लियांग का यह तरीका, जो उच्च निवेश और कम लाभ वाले अनुसंधान पर केंद्रित था, DeepSeek की सफलता का कारण माना जाता है।

"पूरी टीम में एक सहयोगी संस्कृति और कठोर अनुसंधान के प्रति समर्पण है," Zihan Wang, एक पूर्व DeepSeek कर्मचारी, को MIT Technology Review द्वारा उद्धृत किया गया।

DeepSeek अन्य एआई खिलाड़ियों से कैसे अलग है?

कई महत्वपूर्ण मील के पत्थर हासिल करने के बावजूद, DeepSeek रिपोर्ट के अनुसार एआई अनुसंधान पर केंद्रित है और इसके पास अपने एआई मॉडलों को वाणिज्यिक बनाने की तत्काल कोई योजना नहीं है।

"अगर आप मुझसे पूछें तो मुझे DeepSeek स्थापित करने के लिए कोई वाणिज्यिक कारण नहीं मिलेगा," लियांग को 36Kr द्वारा उद्धृत किया गया। "बेसिक साइंस रिसर्च का बहुत कम रिटर्न-ऑन-इन्वेस्टमेंट अनुपात होता है। जब OpenAI के शुरुआती निवेशकों ने इसमें पैसे दिए, तो वे निश्चित रूप से यह नहीं सोच रहे थे कि उन्हें कितना रिटर्न मिलेगा। बल्कि, वे यह चाहते थे कि वे सच में यह काम करना चाहते थे," उन्होंने कहा।

DeepSeek Baidu, Alibaba, और ByteDance जैसी तकनीकी दिग्गजों से फंडिंग पर निर्भर नहीं करता। इसे केवल High-Flyer द्वारा समर्थित किया गया है। इसके पास चिप निर्माता AMD के साथ एक साझेदारी है, जो इसके मॉडल जैसे DeepSeek-V3 को AMD Instinct GPUs और ROCM सॉफ़्टवेयर का उपयोग करके संचालित करने की अनुमति देती है, Forbes की रिपोर्ट के अनुसार।

DeepSeek चीन की प्रमुख एआई कंपनियों में से एक है जिसने ओपन-सोर्स सिद्धांतों को अपनाया है।

ओपन-सोर्स एआई मॉडल्स को डाउनलोड, संशोधित और फिर से उपयोग करने के लिए किसी के लिए उपलब्ध कराया जाता है। इसके अलावा, ओपन-सोर्स लाइसेंसों के तहत एआई मॉडल और प्रशिक्षण डेटासेट जारी करने से शोध समुदाय की सद्भावना मिलती है और अधिक उपयोगकर्ताओं और डेवलपर्स को आकर्षित किया जा सकता है, जिससे मॉडल्स और अधिक उन्नत हो सकते हैं।

हालांकि, ओपन-सोर्स एआई मॉडल्स कुछ सुरक्षा जोखिमों के साथ आते हैं क्योंकि इन्हें गलत तरीके से इस्तेमाल किया जा सकता है, जैसे एआई द्वारा उत्पन्न गैर-संवेदनशील यौन चित्रण और बाल यौन शोषण सामग्री (CSAM) बनाना।

अब तक DeepSeek ने कौन से एआई मॉडल जारी किए हैं?

DeepSeek के एआई मॉडल्स को Mixture-of-Experts (MoE) आर्किटेक्चर और Multi-Head Latent Attention को शामिल करके ऑप्टिमाइज़ किया गया है, साथ ही उन्नत मशीन-लर्निंग तकनीकों जैसे reinforcement learning और distillation का उपयोग किया गया है।

यहां कुछ ओपन-सोर्स एआई मॉडल्स हैं जो DeepSeek ने विकसित किए हैं:
• DeepSeek Coder: एक ओपन-सोर्स एआई मॉडल जो कोडिंग संबंधित कार्यों के लिए डिज़ाइन किया गया है।
• DeepSeek LLM: एक एआई मॉडल जिसमें 67 बिलियन पैरामीटर हैं, जो अन्य बड़े भाषा मॉडल्स (LLMs) को चुनौती देता है।
• DeepSeek-V2: एक कम लागत वाला एआई मॉडल जो मजबूत प्रदर्शन का दावा करता है।
• DeepSeek-Coder-V2: एक एआई मॉडल जिसमें 236 बिलियन पैरामीटर हैं, जो जटिल कोडिंग चुनौतियों के लिए डिज़ाइन किया गया है।
• DeepSeek-V3: एक 671 बिलियन पैरामीटर वाला एआई मॉडल जो कोडिंग, अनुवाद, और निबंध और ईमेल लिखने जैसे कार्यों को संभाल सकता है।
• DeepSeek-R1: एक एआई मॉडल जो reasoning कार्यों के लिए डिज़ाइन किया गया है, जो OpenAI के प्रमुख o1 मॉडल को चुनौती देता है।
• DeepSeek-R1-Distill: एक एआई मॉडल जिसे DeepSeek R1 द्वारा उत्पन्न कृत्रिम डेटा पर आधारित फाइन-ट्यून किया गया है।

DeepSeek के लिए आगे क्या है?

DeepSeek के एआई मॉडल्स के पीछे का नवाचार दुर्लभता से प्रेरित है। 2022 से, अमेरिकी सरकार ने निर्यात नियंत्रण की घोषणा की है, जिसने चीनी एआई कंपनियों को Nvidia के H100 जैसे GPUs तक पहुँचने से रोक दिया है। जबकि DeepSeek ने प्रतिबंधों से पहले 10,000 H100 GPUs से अधिक जमा किए थे, इसके सीमित संसाधनों का मतलब था कि उसे इनका अधिक प्रभावी ढंग से उपयोग करना पड़ा।

हालांकि DeepSeek ने नवीनतम हार्डवेयर तक पहुंच के बिना शक्तिशाली एआई मॉडल विकसित और तैनात करने में सक्षम हो गया है, लेकिन इसे अंततः कंप्यूटिंग संसाधनों की खाई को पाटने की आवश्यकता हो सकती है ताकि वह अमेरिका की कंपनियों से अधिक प्रभावी तरीके से प्रतिस्पर्धा कर सके, जिनके पास प्रचुर मात्रा में कंप्यूटिंग संसाधन हैं।

सोशल मीडिया पर कई उपयोगकर्ताओं ने यह भी指出 किया है कि DeepSeek के एआई चैटबोट को चीन और उसकी सरकार के बारे में संवेदनशील सवालों के जवाबों को सेंसर करने के लिए संशोधित किया गया है। इस चैटबोट के कथित सेंसरशिप प्रतिबंधों से इसके वैश्विक स्तर पर व्यापक रूप से अपनाए जाने में चुनौती हो सकती है।

Tags:
Stayalive
500 के बाद 600, भैया जी नॉट स्टॉप !!!!
Posts: 631
Joined: Mon Jul 15, 2024 12:14 pm

Re: कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

Post by Stayalive »

ChatGPT ne public ki soch ko apne mein ghira liya tha, aur Altman AI salesmen ke media-savvy chehre ke roop mein sabse zyada pehchana gaya tha, to — agar woh celebrity voices ko lekar weird feuds bandh kar sake aur apni behen ke saath allegedly abuse karne ke liye liable na paya jaye — to shayad woh hi?

Ab yahaan aate hain Liang Wenfeng, jo DeepSeek ke founder aur CEO hain, jinka chehra itna unknown hai ki unke Wikipedia entry par bhi unki photo nahi hai, aur Getty archive mein bhi unka koi photo nahi milta. (Woh pichle hafte Beijing Symposium mein nazar aaye the, agar aapko dekhna ho ki woh kaise dikhte hain.) DeepSeek media-facing, market-facing waters mein nahi utarta jo posturing U.S. AI giants ka hissa hain. Jo kuch unke paas hai, woh hai ek behtar product — ek tez, bahut sasta product jo ek aisi promise ko pura karta hai jo Altman bhool gaya tha: Yeh open source hai.

Aur internet ki is flattened duniya mein, lagta hai ki bas itna hi chahiye. Open AI needs to update..... :P :P
Warrior
सात सो के बाद , देखो आठ सौ के ठाट!!!
Posts: 801
Joined: Mon Jul 29, 2024 8:39 pm

Re: कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

Post by Warrior »

DeepSeek का सबसे बड़ा लाभ यह है कि इसका चैटबोट बिना किसी लिमिटेशन के मुफ्त में उपयोग किया जा सकता है और इसके APIs बहुत सस्ते हैं। दूसरी ओर, ChatGPT के पास अधिक एडवांस्ड फीचर्स के लिए पेड ऑप्शंस हैं।

यह DeepSeek को उन यूज़र्स के लिए एक बेहतरीन विकल्प बनाता है जो बिना किसी खर्च के एक सीधा AI अनुभव चाहते हैं।
Realrider
या खुदा ! एक हज R !!! पोस्टर महा लपक के वाले !!!
Posts: 1800
Joined: Tue Jul 16, 2024 8:47 pm

Re: कैसे DeepSeek की उत्पत्ति इसके एआई मॉडल को ChatGPT जैसे अमेरिकी प्रतिद्वंद्वियों को पछाड़ने का कारण बनती है?

Post by Realrider »

यहां चार प्रमुख अंतर दिए गए हैं जो DeepSeek और ChatGPT के बीच हैं, जिन्हें आगामी कोडर्स को अपने आवश्यकताओं के अनुसार सही AI टूल चुनते समय ध्यान में रखना चाहिए:

1. टेक्स्ट-आधारित बनाम मल्टीमोडल AI: DeepSeek केवल टेक्स्ट-आधारित उत्तरों पर केंद्रित है, जबकि ChatGPT AI-जनित इमेजेस, वॉयस इंटरएक्शंस, और इमेज एनालिसिस भी प्रदान करता है। अगर आप एक इंटरएक्टिव AI की तलाश में हैं, तो ChatGPT को प्राथमिकता है।
2. कोडिंग प्रदर्शन और वेब एक्सेस: DeepSeek कोडिंग के लिए शानदार है—यह कोड जनरेट करता है और तकनीकी सवालों के अच्छे उत्तर देता है। दोनों AI मॉडल वेब सर्च का समर्थन करते हैं, ताकि आपको हमेशा अद्यतन, प्रासंगिक प्रोग्रामिंग सहायता मिल सके।
3. ओपन-सोर्स बनाम क्लोज्ड मॉडल: DeepSeek ओपन-सोर्स (MIT लाइसेंस) है, यानी डेवलपर्स इसे स्वतंत्र रूप से संशोधित और एकीकृत कर सकते हैं। ChatGPT प्रोपाइटरी है, इसलिए आप इसके बैकएंड तक पहुंच नहीं सकते या इसे संशोधित नहीं कर सकते।
4. निम्न विकास लागत, उच्च संभावनाएं: DeepSeek को $6 मिलियन से कम में बनाया गया था, जबकि OpenAI ने ChatGPT पर अरबों डॉलर खर्च किए। यह साबित करता है कि AI नवाचार केवल बड़ी टेक कंपनियों के लिए नहीं है—कोई भी कोडर कुछ शक्तिशाली बना सकता है!

आगामी कोडर्स के लिए, DeepSeek AI विकास की दुनिया में बिना भारी वित्तीय बोझ के प्रवेश करने का एक अनूठा अवसर प्रदान करता है। इसकी ओपन-सोर्स प्रकृति, लागत-प्रभावशीलता, और मजबूत कोडिंग क्षमताओं के साथ, यह एक ऐसा प्लेटफॉर्म है जहां प्रयोग, संशोधन और निर्माण करना संभव है। जबकि ChatGPT मल्टीमोडल क्षमताओं में उत्कृष्ट है, DeepSeek का फोकस कोडिंग और तकनीकी सवालों पर इसे उन डेवलपर्स के लिए एक बेहतरीन विकल्प बनाता है जो अपनी AI क्षमताओं को और निखारना चाहते हैं। विकास की संभावनाओं के साथ, DeepSeek आपकी AI यात्रा के लिए एक कदम आगे हो सकता है।
Post Reply

Return to “विज्ञान एवं तकनीक”