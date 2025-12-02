ETV Bharat / technology

DeepSeek का नया AI Model लॉन्च, रीजनिंग और एजेंटिक टास्क में ChatGPT और Gemini को भी छोड़ा पीछे!

DeepSeek-V3.2 अपनी नई Sparse Attention और स्केल्ड RL ट्रेनिंग की वजह से लंबी बातचीत और मुश्किल रीजनिंग में टॉप-लेवल परफॉर्मेंस देता है. ( फोटो क्रेडिट: DeepSeek )

DeepSeek Sparse Attention यानी DSA: DeepSeek का नया DSA सिस्टम मॉडल की अटेंशन को स्मार्ट तरीके से हैंडल करता है. बड़े कॉन्टेक्स्ट, लॉन्ग चैट या लंबी डॉक्यूमेंट समझने वाले कामों में यह पुराने मेथड की तुलना में बहुत कम कंप्यूट यूज़ करता है. कम रीसोर्स में भी मॉडल वही क्वालिटी बनाए रख सके, इसे ध्यान में रखकर DSA को डिजाइन किया गया है.

इसके बारे में कंपनी का कहना है कि यग मॉडल सिर्फ स्पीड वाला नहीं बल्कि असली दुनिया में सही रीजनिंग, टूल-यूज़ और एजेंटिक टास्क संभालने में और भी बेहतर है. DeepSeek लंबे समय से “कम कॉस्ट में हाई परफॉर्मेंस AI” देने की बात करता रहा है, और V3.2 इसी फिलॉसफी को और आगे लेकर जाता है.

हैदराबाद: AI इंडस्ट्री में एक बार फिर हलचल मच गई है, क्योंकि DeepSeek ने अपनी नई जनरेशन मॉडल सीरीज़ DeepSeek-V3.2 पेश कर दी है. इस नए मॉडल ने रीजनिंग और एजेंटिक टास्क के मामले में OpenAI के GPT-5 High, Google के Gemini 3 Pro और Claude 4.5-Sonnet और खुद अपने DeepSeek-V3.2-Thinking मॉडल को भी पीछे छोड़ दिया है.

DeepSeek-V3.2-Speciale का परफॉर्मेंस टेबल (फोटो क्रेडिट: huggingface)

स्केलेबल RL फ्रेमवर्क: DeepSeek-V3.2 को कंपनी ने इतने बड़े स्केल पर RL से ट्रेंड किया कि परफॉर्मेंस GPT-5 के बराबर बताई जा रही है. DeepSeek-V3.2-Speciale नाम का वेरिएंट तो इतनी हाई-कंप्यूट ट्रेनिंग पर बना है कि कंपनी दावा कर रही है कि यह GPT-5 से आगे निकल जाता है और रीजनिंग के मामले में Gemini 3.0 Pro जैसी क्वालिटी देता है. इस मॉडल की सबसे बड़ी अचीवमेंट यह है कि इसने 2025 के IMO यानी इंटरनेशनल मैथ ओलंपियाड और IOI यानी इंटरनेशनल ओलंपियाड इन इन्फॉर्मेटिक्स में गोल्ड-लेवल परफॉर्मेंस दिखाई है.

एजेंटिक टास्क सिंथेसिस पाइपलाइन: कंपनी ने एक नई पाइपलाइन बनाई है जो अपने आप कठिन टास्क, कोडिंग केस, मल्टी-स्टेप रीज़निंग और टूल-यूज़ वाले सिचुएशन जेनरेट कर सकती है. इससे मॉडल को असली दुनिया के प्रॉब्लम्स के लिए ट्रेन करना आसान होता है. DeepSeek ने IMO, IOI, ICPC और CMO 2025 की अपनी फाइनल सबमिशन भी पब्लिश की हैं ताकि रिसर्च कम्युनिटी खुद वेरिफाई कर सके.

चैट टेम्पलेट में भी बदलाव: V3.2 का चैट सिस्टम पूरी तरह अपडेट किया गया है. इसमें नया टूल-कालिंग फॉर्मेट और “थिंकिंग विद टूल्स” जैसी क्षमता जोड़ी गई है. GitHub पर कंपनी ने इसके लिए Python स्क्रिप्ट भी शेयर की हैं जो डेवलपर्स को एन्कोडिंग और आउटपुट पार्सिंग समझाती हैं.

लोकल रनिंग: DeepSeek-V3.2 और इसका Speciale वेरिएंट, दोनों को लोकल मशीन पर चलाया जा सकता है. कंपनी ने सलाह दी है कि लोकल रनिंग के लिए तापमान 1 और top p 0.95 पर सेट करें. Speciale वर्ज़न डीप रीजनिंग के लिए बना है और इसमें टूल-कालिंग सपोर्ट नहीं दिया गया.