LATEST NEWS :
FREE Orientation @ Kapoorthala Branch on 30th April 2024 , FREE Workshop @ Kanpur Branch on 29th April , New Batch of Modern History W.e.f. 01.05.2024 , Indian Economy @ Kanpur Branch w.e.f. 25.04.2024. Interested Candidates may join these workshops and batches .
Print Friendly and PDF

लार्ज लैंग्वेज मॉडल (एलएलएम)

28.02.2024

लार्ज लैंग्वेज मॉडल  (एलएलएम)

                                                                                                                                                                            

                                                                                                                                                              प्रीलिम्स के लिए: लार्ज लैंग्वेज मॉडल (एलएलएम) के बारे में, एलएलएम के प्रकार, एलएलएम का उपयोग किस लिए किया जाता है?

 

           

खबरों में क्यों?

जनरेटिव एआई मॉडल की मनुष्यों के साथ "बातचीत" करने की क्षमता लार्ज लैंग्वेज मॉडल या एलएलएम के नाम से जाना जाने वाला एक प्रोग्राम है।

 

लार्ज लैंग्वेज मॉडल  (एलएलएम) के बारे में:

  • लार्ज लैंग्वेज मॉडल (एलएलएम) एक प्रकार का कृत्रिम बुद्धिमत्ता (एआई) प्रोग्राम है जो अन्य कार्यों के अलावा संदेश को पहचान और उत्पन्न कर सकता है।
  • एलएलएम को डेटा के विशाल सेट पर प्रशिक्षित किया जाता है - इसलिए इसका नाम "लार्ज" है।
  • एलएलएम मशीन लर्निंग पर बनाए गए हैं: विशेष रूप से, एक प्रकार का तंत्रिका नेटवर्क जिसे ट्रांसफार्मर मॉडल कहा जाता है।
  • सरल शब्दों में, एलएलएम एक कंप्यूटर प्रोग्राम है जिसमें मानव भाषा या अन्य प्रकार के जटिल डेटा को पहचानने और व्याख्या करने में सक्षम होने के लिए पर्याप्त उदाहरण दिए गए हैं।
  • कई एलएलएम को उस डेटा पर प्रशिक्षित किया जाता है जो इंटरनेट से हजारों या लाखों गीगाबाइट मूल्य के संदेश को इकट्ठा किया गया है।
  • हालाँकि, नमूनों की गुणवत्ता इस बात पर प्रभाव डालती है कि एलएलएम प्राकृतिक भाषा कितनी अच्छी तरह सीखेंगे, इसलिए एलएलएम के प्रोग्रामर अधिक क्यूरेटेड डेटा सेट का उपयोग कर सकते हैं।
  • अक्षर, शब्द और वाक्य एक साथ कैसे कार्य करते हैं, यह समझने के लिए एलएलएम एक प्रकार की मशीन लर्निंग का उपयोग करते हैं जिसे डीप लर्निंग कहा जाता है।
  • गहन शिक्षण में असंरचित डेटा का संभाव्य विश्लेषण शामिल होता है, जो अंततः गहन शिक्षण मॉडल को मानवीय हस्तक्षेप के बिना सामग्री के टुकड़ों के बीच अंतर को पहचानने में सक्षम बनाता है।
  • एलएलएम को फिर ट्यूनिंग के माध्यम से प्रशिक्षित किया जाता है: उन्हें उस विशेष कार्य के लिए ठीक से तैयार किया जाता है या तुरंत तैयार किया जाता है जो प्रोग्रामर उनसे कराना चाहता है, जैसे कि प्रश्नों की व्याख्या करना और प्रतिक्रियाएं उत्पन्न करना, या एक भाषा से दूसरी भाषा में पाठ का अनुवाद करना।

 

एलएलएम  के प्रकार

एलएलएमए  को वर्गीकृत करने के विभिन्न तरीके हैं-

  •  आर्किटेक्चर के आधार पर, तीन प्रकार हैं - ऑटोरेग्रेसिव, ट्रांसफार्मर-आधारित और एनकोडर-डिकोडर।

○ GPT-3 एक ऑटोरेग्रेसिव मॉडल का एक उदाहरण है क्योंकि वे पिछले शब्दों के आधार पर अनुक्रम में अगले शब्द की भविष्यवाणी करते हैं।

○इसी तरह, LaMDA या जेमिनी (पूर्व में बार्ड) ट्रांसफार्मर-आधारित हैं क्योंकि वे भाषा प्रसंस्करण के लिए एक विशिष्ट प्रकार के तंत्रिका नेटवर्क आर्किटेक्चर का उपयोग करते हैं।

  • प्रशिक्षण डेटा के आधार पर, एलएलएम  तीन प्रकार के होते हैं - पूर्व प्रशिक्षित और परिष्कृत, बहुभाषी या मॉडल जो कई भाषाओं में पाठ को समझ और उत्पन्न कर सकते हैं, और डोमेन-विशिष्ट या मॉडल जो कानूनी जैसे विशिष्ट डोमेन से संबंधित डेटा पर प्रशिक्षित होते हैं , वित्त या स्वास्थ्य सेवा।

 

  • उपलब्धता के आधार पर उन्हें ओपन-सोर्स और क्लोज्ड-सोर्स के रूप में भी वर्गीकृत किया जा सकता है क्योंकि कुछ स्वतंत्र रूप से उपलब्ध हैं जबकि कुछ मालिकाना हैं।

○ LLaMA 2, BlOOM, Google BERT, Falcon 180B, OPT-175 B कुछ ओपन-सोर्स LLM हैं, जबकि क्लाउड 2, बार्ड, GPT-4, कुछ मालिकाना LLM हैं।

 

एलएलएम  का उपयोग किस लिए किया जाता है?

  • एलएलएम को कई कार्य करने के लिए प्रशिक्षित किया जा सकता है। सबसे प्रसिद्ध उपयोगों में से एक जेनरेटिव एआई के रूप में उनका अनुप्रयोग है: जब कोई संकेत दिया जाता है या कोई प्रश्न पूछा जाता है, तो वे उत्तर में संदेश उत्पन्न कर सकते हैं।
  • उदाहरण के लिए, सार्वजनिक रूप से उपलब्ध एलएलएम चैटजीपीटी, उपयोगकर्ता इनपुट के जवाब में निबंध, कविताएं और अन्य पाठ्य रूप उत्पन्न कर सकता है।

 

                                                                      स्रोतः इंडियन एक्सप्रेस