28.02.2024
लार्ज लैंग्वेज मॉडल (एलएलएम)
प्रीलिम्स के लिए: लार्ज लैंग्वेज मॉडल (एलएलएम) के बारे में, एलएलएम के प्रकार, एलएलएम का उपयोग किस लिए किया जाता है?
|
खबरों में क्यों?
जनरेटिव एआई मॉडल की मनुष्यों के साथ "बातचीत" करने की क्षमता लार्ज लैंग्वेज मॉडल या एलएलएम के नाम से जाना जाने वाला एक प्रोग्राम है।
लार्ज लैंग्वेज मॉडल (एलएलएम) के बारे में:
- लार्ज लैंग्वेज मॉडल (एलएलएम) एक प्रकार का कृत्रिम बुद्धिमत्ता (एआई) प्रोग्राम है जो अन्य कार्यों के अलावा संदेश को पहचान और उत्पन्न कर सकता है।
- एलएलएम को डेटा के विशाल सेट पर प्रशिक्षित किया जाता है - इसलिए इसका नाम "लार्ज" है।
- एलएलएम मशीन लर्निंग पर बनाए गए हैं: विशेष रूप से, एक प्रकार का तंत्रिका नेटवर्क जिसे ट्रांसफार्मर मॉडल कहा जाता है।
- सरल शब्दों में, एलएलएम एक कंप्यूटर प्रोग्राम है जिसमें मानव भाषा या अन्य प्रकार के जटिल डेटा को पहचानने और व्याख्या करने में सक्षम होने के लिए पर्याप्त उदाहरण दिए गए हैं।
- कई एलएलएम को उस डेटा पर प्रशिक्षित किया जाता है जो इंटरनेट से हजारों या लाखों गीगाबाइट मूल्य के संदेश को इकट्ठा किया गया है।
- हालाँकि, नमूनों की गुणवत्ता इस बात पर प्रभाव डालती है कि एलएलएम प्राकृतिक भाषा कितनी अच्छी तरह सीखेंगे, इसलिए एलएलएम के प्रोग्रामर अधिक क्यूरेटेड डेटा सेट का उपयोग कर सकते हैं।
- अक्षर, शब्द और वाक्य एक साथ कैसे कार्य करते हैं, यह समझने के लिए एलएलएम एक प्रकार की मशीन लर्निंग का उपयोग करते हैं जिसे डीप लर्निंग कहा जाता है।
- गहन शिक्षण में असंरचित डेटा का संभाव्य विश्लेषण शामिल होता है, जो अंततः गहन शिक्षण मॉडल को मानवीय हस्तक्षेप के बिना सामग्री के टुकड़ों के बीच अंतर को पहचानने में सक्षम बनाता है।
- एलएलएम को फिर ट्यूनिंग के माध्यम से प्रशिक्षित किया जाता है: उन्हें उस विशेष कार्य के लिए ठीक से तैयार किया जाता है या तुरंत तैयार किया जाता है जो प्रोग्रामर उनसे कराना चाहता है, जैसे कि प्रश्नों की व्याख्या करना और प्रतिक्रियाएं उत्पन्न करना, या एक भाषा से दूसरी भाषा में पाठ का अनुवाद करना।
एलएलएम के प्रकार
एलएलएमए को वर्गीकृत करने के विभिन्न तरीके हैं-
- आर्किटेक्चर के आधार पर, तीन प्रकार हैं - ऑटोरेग्रेसिव, ट्रांसफार्मर-आधारित और एनकोडर-डिकोडर।
○ GPT-3 एक ऑटोरेग्रेसिव मॉडल का एक उदाहरण है क्योंकि वे पिछले शब्दों के आधार पर अनुक्रम में अगले शब्द की भविष्यवाणी करते हैं।
○इसी तरह, LaMDA या जेमिनी (पूर्व में बार्ड) ट्रांसफार्मर-आधारित हैं क्योंकि वे भाषा प्रसंस्करण के लिए एक विशिष्ट प्रकार के तंत्रिका नेटवर्क आर्किटेक्चर का उपयोग करते हैं।
- प्रशिक्षण डेटा के आधार पर, एलएलएम तीन प्रकार के होते हैं - पूर्व प्रशिक्षित और परिष्कृत, बहुभाषी या मॉडल जो कई भाषाओं में पाठ को समझ और उत्पन्न कर सकते हैं, और डोमेन-विशिष्ट या मॉडल जो कानूनी जैसे विशिष्ट डोमेन से संबंधित डेटा पर प्रशिक्षित होते हैं , वित्त या स्वास्थ्य सेवा।
- उपलब्धता के आधार पर उन्हें ओपन-सोर्स और क्लोज्ड-सोर्स के रूप में भी वर्गीकृत किया जा सकता है क्योंकि कुछ स्वतंत्र रूप से उपलब्ध हैं जबकि कुछ मालिकाना हैं।
○ LLaMA 2, BlOOM, Google BERT, Falcon 180B, OPT-175 B कुछ ओपन-सोर्स LLM हैं, जबकि क्लाउड 2, बार्ड, GPT-4, कुछ मालिकाना LLM हैं।
एलएलएम का उपयोग किस लिए किया जाता है?
- एलएलएम को कई कार्य करने के लिए प्रशिक्षित किया जा सकता है। सबसे प्रसिद्ध उपयोगों में से एक जेनरेटिव एआई के रूप में उनका अनुप्रयोग है: जब कोई संकेत दिया जाता है या कोई प्रश्न पूछा जाता है, तो वे उत्तर में संदेश उत्पन्न कर सकते हैं।
- उदाहरण के लिए, सार्वजनिक रूप से उपलब्ध एलएलएम चैटजीपीटी, उपयोगकर्ता इनपुट के जवाब में निबंध, कविताएं और अन्य पाठ्य रूप उत्पन्न कर सकता है।
स्रोतः इंडियन एक्सप्रेस