DeepSeek का नया AI Model लॉन्च, रीजनिंग और एजेंटिक टास्क में ChatGPT और Gemini को भी छोड़ा पीछे!

DeepSeek-V3.2 अब ज्यादा स्मार्ट, कम कंप्यूट में लंबी बातचीत, बेहतर रीजनिंग और हाई-लेवल ओलंपियाड परफॉर्मेंस देने में सक्षम बनाया गया है.

DeepSeek-V3.2 delivers top-level performance on long conversations and complex reasoning due to its new Sparse Attention and scaled RL training.
DeepSeek-V3.2 अपनी नई Sparse Attention और स्केल्ड RL ट्रेनिंग की वजह से लंबी बातचीत और मुश्किल रीजनिंग में टॉप-लेवल परफॉर्मेंस देता है. (फोटो क्रेडिट: DeepSeek)
By ETV Bharat Tech Team

Published : December 2, 2025 at 5:30 PM IST

हैदराबाद: AI इंडस्ट्री में एक बार फिर हलचल मच गई है, क्योंकि DeepSeek ने अपनी नई जनरेशन मॉडल सीरीज़ DeepSeek-V3.2 पेश कर दी है. इस नए मॉडल ने रीजनिंग और एजेंटिक टास्क के मामले में OpenAI के GPT-5 High, Google के Gemini 3 Pro और Claude 4.5-Sonnet और खुद अपने DeepSeek-V3.2-Thinking मॉडल को भी पीछे छोड़ दिया है.

इसके बारे में कंपनी का कहना है कि यग मॉडल सिर्फ स्पीड वाला नहीं बल्कि असली दुनिया में सही रीजनिंग, टूल-यूज़ और एजेंटिक टास्क संभालने में और भी बेहतर है. DeepSeek लंबे समय से “कम कॉस्ट में हाई परफॉर्मेंस AI” देने की बात करता रहा है, और V3.2 इसी फिलॉसफी को और आगे लेकर जाता है.

DeepSeek-V3.2 की खास बातें

DeepSeek Sparse Attention यानी DSA: DeepSeek का नया DSA सिस्टम मॉडल की अटेंशन को स्मार्ट तरीके से हैंडल करता है. बड़े कॉन्टेक्स्ट, लॉन्ग चैट या लंबी डॉक्यूमेंट समझने वाले कामों में यह पुराने मेथड की तुलना में बहुत कम कंप्यूट यूज़ करता है. कम रीसोर्स में भी मॉडल वही क्वालिटी बनाए रख सके, इसे ध्यान में रखकर DSA को डिजाइन किया गया है.

DeepSeek-V3.2-Speciale
DeepSeek-V3.2-Speciale का परफॉर्मेंस टेबल (फोटो क्रेडिट: huggingface)

स्केलेबल RL फ्रेमवर्क: DeepSeek-V3.2 को कंपनी ने इतने बड़े स्केल पर RL से ट्रेंड किया कि परफॉर्मेंस GPT-5 के बराबर बताई जा रही है. DeepSeek-V3.2-Speciale नाम का वेरिएंट तो इतनी हाई-कंप्यूट ट्रेनिंग पर बना है कि कंपनी दावा कर रही है कि यह GPT-5 से आगे निकल जाता है और रीजनिंग के मामले में Gemini 3.0 Pro जैसी क्वालिटी देता है. इस मॉडल की सबसे बड़ी अचीवमेंट यह है कि इसने 2025 के IMO यानी इंटरनेशनल मैथ ओलंपियाड और IOI यानी इंटरनेशनल ओलंपियाड इन इन्फॉर्मेटिक्स में गोल्ड-लेवल परफॉर्मेंस दिखाई है.

एजेंटिक टास्क सिंथेसिस पाइपलाइन: कंपनी ने एक नई पाइपलाइन बनाई है जो अपने आप कठिन टास्क, कोडिंग केस, मल्टी-स्टेप रीज़निंग और टूल-यूज़ वाले सिचुएशन जेनरेट कर सकती है. इससे मॉडल को असली दुनिया के प्रॉब्लम्स के लिए ट्रेन करना आसान होता है. DeepSeek ने IMO, IOI, ICPC और CMO 2025 की अपनी फाइनल सबमिशन भी पब्लिश की हैं ताकि रिसर्च कम्युनिटी खुद वेरिफाई कर सके.

चैट टेम्पलेट में भी बदलाव: V3.2 का चैट सिस्टम पूरी तरह अपडेट किया गया है. इसमें नया टूल-कालिंग फॉर्मेट और “थिंकिंग विद टूल्स” जैसी क्षमता जोड़ी गई है. GitHub पर कंपनी ने इसके लिए Python स्क्रिप्ट भी शेयर की हैं जो डेवलपर्स को एन्कोडिंग और आउटपुट पार्सिंग समझाती हैं.

लोकल रनिंग: DeepSeek-V3.2 और इसका Speciale वेरिएंट, दोनों को लोकल मशीन पर चलाया जा सकता है. कंपनी ने सलाह दी है कि लोकल रनिंग के लिए तापमान 1 और top p 0.95 पर सेट करें. Speciale वर्ज़न डीप रीजनिंग के लिए बना है और इसमें टूल-कालिंग सपोर्ट नहीं दिया गया.

