DeepSeek का दुनिया में तूफान, हमारे पास है Sarvam, जानें AI रेस में कहां खड़ा है भारत

भारत का अपना AI Sarvam AI जैसे मॉडल सफल साबित हो रहे हैं खासकर भारतीय भाषाओं को ध्यान में रखकर बनाए गए AI सिस्टम्स के लिए, लेकिन फिलहाल AI की दौड़ में भारत पीछे नजर आता है, भारत को जरूरत है कि वह R&D और इंफ्रास्ट्रक्चर में निवेश को बढ़ाए.

कितना पावरफुल है भारत का Sarvam AI Image Credit: Freepik/Canva

DeepSeek: चीन अब तक दुनिया की फैक्ट्री कहा जाता था लेकिन अब इसे AI के मामले में भी बड़ी उपलब्धि मिल गई है. चीन के Deepseek ने पूरी दुनिया में तहलका मचा दिया है, इसका मॉडल तो शानदार है ही लेकिन साथ ही ये अमेरिकन AI से बेहद सस्ता है. डीपसीक के जरिए चीन ने बता दिया है कि केवल अमेरिका ही नहीं इनोवेशन के मामले में दूसरे देश भी आगे हैं. लेकिन सवाल ये उठता है कि भारत इस रेस में कहां खड़ा है?  

AI के मामले में पिछले एक साल में भारत में दो तरह के विचार देखने को मिले हैं. एक, जो पूरी तरह से देसी LLMs (AI मॉडल) बनाना चाहते हैं, यानी शुरुआत से ही भारत के लिए बनाए गए AI मॉडल्स. दूसरा, जो SLMs मॉडल विकसित करना चाहते हैं.

दोनों में फर्क ये है कि LLM यानी लार्ज लैंग्वेज मॉडल और SLM यानी स्मॉल लैंग्वेज मॉडल. LLMs को बनाने के लिए ज्यादा रिसोर्स और कंप्यूटेशनल पावर खर्च करनी पड़ती है जबकि SLMs में कम संसाधन लगते हैं और ये बेहद ही सस्ता होता है.

भारत का AI स्टार्टअप और डीपसीक

भारत का AI स्टार्टअप Sarvam AI ने अपने AI को 2 अरब पैरामीटर के साथ ट्रेन किया, इस AI का फोकस मुख्य रूप से भारतीय भाषाओं पर ही है. वहीं, डीपसीक के R1 को 671 अरब पैरामीटर, यानी ज्यादा बड़े डेटा के साथ विकसित किया गया है, जो किसी खास इस्तेमाल नहीं बल्कि सामान्य या हर चीज के लिए डिजाइन किया गया है.  

TOI की एक रिपोर्ट के अनुसार, भारत फिलहाल AI और चिप निर्माण के क्षेत्र में पीछे है और इस क्षेत्र में आगे बढ़ने के लिए ज्यादा निवेश रिसर्च एंड डेवलपमेंट और मजबूत इंफ्रास्ट्रक्चर पर करने की जरूरत है.  

Sarvam AI: भारत का उभरता हुआ जनरेटिव AI स्टार्टअप  

Sarvam AI ने हाल ही में एक नया भाषा मॉडल लॉन्च किया है, जिसे खासतौर पर भारतीय भाषाओं के लिए ट्रेन किया गया है. इस मॉडल का नाम Sarvam-1 है और यह 10 भारतीय भाषाओं को सपोर्ट करता है, जैसे हिंदी, बंगाली, गुजराती, कन्नड़, मलयालम, मराठी, उड़िया, पंजाबी, तमिल, तेलुगु और अंग्रेजी.  

बेंगलुरु की कंपनी Sarvam AI ने साल 2024 के अगस्त में अपना पहला फाउंडेशनल AI मॉडल Sarvam 2B लॉन्च किया था. लेकिन कंपनी का कहना है कि Sarvam-1 खास इसलिए है क्योंकि यह दिखाता है कि अगर ट्रेनिंग डेटा को सावधानी से क्यूरेट किया जाए, तो कम पैरामीटर वाले मॉडल भी बेहतरीन प्रदर्शन कर सकते हैं.

किसने बनाया Sarvam-1?

Sarvam के पीछे दो शख्सियत हैं, इसके को-फाउंडर डॉ विवेक राघवन जो एक एंटरप्रेन्योर, टेक्नोलॉजिस्ट और डिजिटल पब्लिक इंफ्रास्ट्रक्चर के निर्माता हैं. इन्होंने Sarvam AI इसलिए बनाया क्योंकि इनका मानना है कि जनरेटिव AI भारत के हर नागरिक के जीवन को प्रभावित कर सकता है. विवेक ने आधार (Aadhaar) की टेक्नोलॉजी प्लेटफॉर्म के डिजाइन, इंप्लीमेंटेशन और उसके बड़े स्तर पर विस्तार में अहम भूमिका निभाई है. हाल ही में, वे AI4Bharat के चीफ मेंटॉर और Bhashini के एडवाइजर रहे, जहां उन्होंने भारतीय भाषाओं के लिए ओपन-सोर्स डेटा, मॉडल्स और बेंचमार्क्स विकसित करने में योगदान दिया है.

दूसरे शख्स, को-फाउंडर डॉ प्रत्युष कुमार AI और सिस्टम्स इंजीनियरिंग के शोधकर्ता हैं और उन्होंने Microsoft Research, IBM Research और IIT Madras में अपनी सर्विस दी हैं. वे AI4Bharat के को-फाउंडर हैं, जिसने भारतीय भाषाओं में AI एप्लिकेशन विकसित करने में महत्वपूर्ण काम किया है. इसके अलावा, उन्होंने PadhAI को भी शुरू किया जिसके जरिए हजारों छात्रों को डीप लर्निंग सिखाई गई.

कितना पावरफुल है Sarvam-1?  

Sarvam-1 को 2 अरब पैरामीटर के साथ विकसित किया गया है. पैरामीटर की संख्या आमतौर पर यह बताती है कि AI मॉडल कितना जटिल है और वह इनपुट को आउटपुट में बदलने की कितनी ज्यादा क्षमता रखता है.

जैसे Microsoft का Phi-3 Mini मॉडल 3.8 अरब पैरामीटर का है. Sarvam-1 और Phi-3 Mini जैसे मॉडल SLMs की कैटेगरी में आते हैं, जिनके पैरामीटर 10 अरब से कम होते हैं. जबकि GPT-4 जैसे बड़े मॉडल LLMs के पैरामीटर 1 लाख करोड़ से भी ज्यादा होते हैं.  

Sarvam AI ने अपने नए मॉडल को 1,024 GPUs पर NVIDIA के NeMo फ्रेमवर्क के साथ ट्रेन किया है, जिसके लिए Yotta नाम का डेटा इंफ्रास्ट्रक्चर कंपनी ने सपोर्ट दिया.  

Sarvam-1 का दावा है कि Sarvam-1 ने Meta के Llama-3 और Google के Gemma-2 जैसे बड़े मॉडल्स को भी मात दी है.  

क्या Sarvam-1 भारत का Deepseek बन सकता है?  

Sarvam-1 की सबसे बड़ी खासियत यह है कि यह बेहतर परफॉर्मेंस के साथ कम संसाधनों में काम कर सकता है, जिससे इसे छोटे डिवाइसेस पर भी आसानी से इस्तेमाल किया जा सकता है.  

भारत में AI और चिप निर्माण की दौड़ में चीन और अमेरिका से काफी पीछे है, लेकिन Sarvam AI जैसे स्टार्टअप्स लोकल जरूरतों के हिसाब से किफायती और प्रभावी AI सॉल्यूशंस डेवलप करने पर ध्यान दे रहे हैं.