26.02.2024
हनुमान
प्रारंभिक परीक्षा के लिए: हनुमान, अनुप्रयोगों के बारे में, भारतजीपीटी पारिस्थितिकी तंत्र क्या है?, बड़े भाषा मॉडल के बारे में मुख्य तथ्य
|
खबरों में क्यों?
आईआईटी बॉम्बे के नेतृत्व वाले भारतजीपीटी इकोसिस्टम के सहयोग से, सीता महालक्ष्मी हेल्थकेयर (एसएमएल) ने 22 भारतीय भाषाओं में प्रशिक्षित इंडिक बड़े भाषा मॉडलों का एक सूट 'हनुमान' पेश किया है।
हनुमान के बारे में:
- यह बड़े भाषा मॉडल (एलएलएम) की एक श्रृंखला है जो हिंदी, तमिल और मराठी जैसी 11 भारतीय भाषाओं में प्रतिक्रिया दे सकती है, जिसे 20 से अधिक भाषाओं में विस्तारित करने की योजना है।
- क्षमताएं: यह एक मल्टीमॉडल एआई टूल है, जो कई भारतीय भाषाओं में टेक्स्ट, भाषण, वीडियो और बहुत कुछ उत्पन्न कर सकता है।
- इन AI मॉडल का आकार 1.5 बिलियन से लेकर 40 बिलियन पैरामीटर तक है।
- अनुप्रयोग: इसे स्वास्थ्य देखभाल, शासन, वित्तीय सेवाओं और शिक्षा सहित चार क्षेत्रों में काम करने के लिए डिज़ाइन किया गया है।
भारत जीपीटी पारिस्थितिकी तंत्र क्या है?
- यह सात अन्य आईआईटी के साथ आईआईटी बॉम्बे के नेतृत्व वाला एक शोध संघ है। यह विज्ञान और प्रौद्योगिकी विभाग, एसएमएल और रिलायंस जियो द्वारा समर्थित है।
बड़े भाषा मॉडल के बारे में मुख्य तथ्य
- बड़े भाषा मॉडल बड़ी मात्रा में पाठ को संसाधित करने के लिए गहन शिक्षण तकनीकों का उपयोग करते हैं।
- वे बड़ी मात्रा में पाठ को संसाधित करके, संरचना और अर्थ को समझकर और उससे सीखकर काम करते हैं।
- एलएलएम को शब्दों के बीच अर्थ और संबंधों की पहचान करने के लिए 'प्रशिक्षित' किया जाता है।
- किसी मॉडल को जितनी अधिक मात्रा में प्रशिक्षण डेटा खिलाया जाता है, वह पाठ को समझने और तैयार करने में उतना ही अधिक कुशल हो जाता है।
- प्रशिक्षण डेटा आमतौर पर विकिपीडिया, ओपनवेबटेक्स्ट और कॉमन क्रॉल कॉर्पस जैसे बड़े डेटासेट होते हैं।
- इनमें बड़ी मात्रा में टेक्स्ट डेटा होता है, जिसका उपयोग मॉडल प्राकृतिक भाषा को समझने और उत्पन्न करने के लिए करते हैं।
स्रोतः इंडियन एक्सप्रेस