सामर्थ्य आहे सूचक-प्रश्नांचे!

Story by  Awaz Marathi | Published by  Chhaya Kavire • 1 Years ago
‘चॅटजीपीटी’च्या संभाषण क्षमतेने लोकं झाले आहेत अवाक
‘चॅटजीपीटी’च्या संभाषण क्षमतेने लोकं झाले आहेत अवाक

 

चॅटजीपीटीचा सध्या बोलबाला आहे. त्याच्या प्रभावी उपयुक्ततेपासून ते त्यामुळे नोकऱ्या जातील काय? इथपर्यंत अनेक प्रश्‍न विचारले जात आहेत. त्यावरील उत्तरेही वेगवेगळी आहेत. पण सर्जनशिलता ही श्रेष्ठ असते हेच खरे.
-डॉ. योगेश कुलकर्णी

‘चॅटजीपीटी’ने सध्या इंटरनेटवर नुसता धुमाकूळ घातला आहे. बहुतांश लोकं त्याच्या संभाषण क्षमतेने अवाक झाले आहेत; आणि का नाही होणार? जसा एखादा सुविद्य-ज्ञानी उत्तर देईल तशी, व्याकरण-योग्य उत्तरे दिलेली पहिली की त्याच्यामागे असललेली ‘कृत्रिम बुद्धिमत्ता’ (एआय-आर्टिफिशिअल इंटेलिजन्स) हे क्षेत्र किती पुढे आले आहे, याची कल्पना येते. आतापर्यंत तुम्ही ‘चॅटजीपीटी’विषयी इंटरनेटवर, लेखांमधून सर्वसाधारण माहिती वाचली असेलच. आपल्यापैकी काहींनी ते वापरूनही पहिले असेल. त्याविषयी जरा सखोल विवेचन पुढे पाहू. ‘चॅटजीपीटी’ ही एक संभाषण-प्रणाली (चॅटबॉट) आहे. आपण प्रश्न विचारायचे, त्याने त्याची समर्पक उत्तरे द्यायची, अगदी दोन व्यक्तींमध्ये संभाषण होते त्याप्रमाणे. आतापर्यंत हे बघितले नसेल तर चॅटजीपीटी https://chat.openai.com/chat या संकेतस्थळावर अगदी फुकट उपलब्ध आहे. नक्की वापरून बघा!

चॅटजीपीटी कसा चालतो?
चॅटजीपीटीच्या मागे जे तंत्रज्ञान आहे त्याचे नाव भाषा-प्रारूप (एलएम - लँगवेज मॉडेल) असे आहे. हे तंत्रज्ञान समजण्यासाठी त्याला साधर्म्य असणारे आणि रोजच्या व्यवहारातील एक उदाहरण पाहू. आपण मोबाईलवर जेव्हा संदेश (एसएमएस) टाईप करतो, तेव्हा आपल्याही पुढचा शब्द सुचवला जातो. आणि बऱ्याच वेळेला ते इतके चपखल असतात की, आपल्याला वाटू शकते की मोबाईल आपल्या मनातले कसे ताडू शकतो? या मागचे तंत्रज्ञान समजायला सोपे आहे. तुम्ही सध्या जे टाईप करत आहात तसे तुम्ही कधी टाईप केले आहे का, ते तो पाहतो आणि तसे पूर्वीचे संदेश पाहून त्याला समजू शकते की, पुढे कुठला शब्द येणार आहे. समजा, तुम्ही टाईप करताय “लेट्स गो फॉर अ....”. अशा प्रकारचे संदेश तुम्ही अनेक वेळेला पाठवले आहेत. त्या सर्वांमध्ये पुढचा शब्द, सर्वात जास्त वेळेला, ‘कॉफी’ असा असेल तर तो ‘कॉफी’ हा शब्द सुचवेल. अशा प्रकारे, ‘आतापर्यंत टाईप केलेले शब्द पाहून पुढील शब्द सुचवणे’ याला भाषा-प्रारूप म्हणतात. एसएमएसचे हे उदाहरण तुमच्या पूर्वीच्या १००-२०० संदेशांवर (डेटा) आधारित पुढील शब्द सुचवतो.
जर डेटा जास्त असेल तर उत्तर अधिक अचूक येण्याची शक्यता जास्त.
 
सध्या प्रचलित असलेली बृहत भाषा प्रारूपे (लार्ज लँगवेज मॉडेल) फारच मोठ्या डेटा स्रोतांवर आधारित असल्याने जास्त प्रभावशाली आणि अचूक असतात. लार्ज लँगवेज मॉडेलचा वापर करून, एका मागून एक असे शब्द घेऊन त्याचे बनते वाक्य, वाक्यांचे परिच्छेद आणि परिच्छेदांचे लेख. अशा प्रकारच्या भाषा-निर्मितीचा (जनरेटिव्ह एआय) भाग आहे. चॅटजीपीटीमधील ‘चॅट’ म्हणजे संभाषण-गप्पा. ‘जीपीटी’मधील ‘जी’ म्हणजे जनरेटिव्ह, जे शब्द जनरेट/निर्मिती करते, ‘पी’ म्हणजे ‘प्रिट्रेंड’, जे मोठ्या डेटावर आधीच प्रशिक्षित आहे आणि ‘टी’ म्हणजे ट्रान्सफॉर्मर, हे न्यूरल नेटवर्कच्या एका आराखड्याचे (आर्किटेक्चर) नाव आहे. चॅटजीपीटी हा ‘जीपीटी ३.५’ या लार्ज लँगवेज मॉडेलवर बेतलेला आहे. त्याला अनेक मानवी प्रश्नोत्तरे भारावून संभाषणासाठी खास प्रशिक्षित (फाईन ट्यून) केलेला आहे. ‘जीपीटी ३.५’ हे एक क्लिष्ट आणि अजस्त्र न्यूरल नेटवर्क आहे. त्यात १७५ अब्ज घटक (पॅरामीटर) आहेत. ते जगभरातील बऱ्याचशा भाषा स्रोतांवर (विकिपीडिया, पुस्तके इ.) प्रशिक्षीत केला आहे. त्यामुळे तो जणू एक महान भाषा सर्वज्ञच(!) झाला आहे. या विस्तृत प्रशिक्षणामुळेच त्याला सर्वज्ञानातील (जनरल नॉलेज) कोणताही प्रश्न विचारला तरी त्याच्याकडे त्याची काही ना काही माहिती असते.
 
पण चॅटजीपीटी खरंच सर्वज्ञ आहे का? तर उत्तर आहे - नाही! त्याचे प्रशिक्षण जरा जुन्या, म्हणजे २०२१पर्यंतच्या डेटावर झाले आहे. त्याला अगदी नजीकच्या घटनांविषयी काही विचारले तर तो सरळ ‘सॉरी’ म्हणतो. अजून एक मर्यादा म्हणजे त्याचे प्रशिक्षण सार्वजनिक डेटा वरच झाले असल्याने त्याला तुमच्या किंवा कोणाच्याही वैयक्तिक माहितीची कल्पना नाही. तो फक्त त्याला प्रशिक्षित केलेली माहिती योग्य प्रकारे तुमच्या पुढे ठेवतो. आता कधी कधी काही डेटा मध्ये चुकीची माहिती असू शकते, तर तो तीही माहिती छातीठोकपणे सांगतो. म्हणूनच चॅटजीपीटीवर पूर्णपणे अवलंबून राहता येत नाही. त्याने दिलेल्या उत्तराचे परीक्षण हे करणे कधीही श्रेयस्कर ठरते. असे काही नकारात्मक पैलू आणि मर्यादा असल्यातरी चॅटजीपीटी ही एक भन्नाट गोष्ट आहे, हे मान्यच करावे लागेल.

सूचक-प्रश्न म्हणजे काय?
चॅटजीपीटीची खरी क्षमता जोखायची असेल, त्याच्याकडून पाहिजे ते आणि पाहिजे तसे उत्तर काढायचे असेल तर त्याला प्रश्नही (प्रॉम्प्ट) फार अचूक आणि सूचक विचारावे लागतात. प्रॉम्प्ट अघळपघळ तर उत्तरही तसेच. पण जरा सटीक प्रश्न, ज्यात हे हवे, हे नको असे सांगितले असेल, तर बरोबर उत्तर मिळण्याची शक्यता वाढते. सूचक-प्रश्न विचारणे हेच आता नवीन शास्त्र म्हणून उदयास येत आहे. त्या विद्या-शाखेचे नाव प्रॉम्प्ट अभियांत्रिकी. चॅटजीपीटी काय किंवा तत्सम इतर लार्ज लँगवेज मॉडेल वापरण्यासाठी प्रॉम्प्ट अभियांत्रिकीचे कौशल्य गरजेचे ठरणार आहे. अशा प्रकारच्या नोकऱ्या आता उपलब्ध सुद्धा व्हायला लागल्या आहेत.
 
भविष्यात त्याला अधिकच वाव मिळणार. चांगला प्रॉम्प्ट अभियंता होण्यासाठी त्याला स्वतःच्या नैपुण्याचे एक क्षेत्र तर असावेच लागणार पण त्याच बरोबर लार्ज लँगवेज मॉडेल आणि ‘एआय’चे ज्ञानही आवश्यक ठरणार असेल. एखाद्या यंत्र अभियंत्याला दुचाकीच्या इंजिनाविषयी काही माहिती पाहिजे असेल तर सूचक- प्रश्न विचारण्यासाठी त्याला त्यातील परवलीचे शब्द, खाचा-खोचा पण आधीच माहिती असल्या पाहिजेत. अशा प्रकारचे संयुक्त ज्ञान सर्व शाखांना गरजेचे ठरणार आहे.

चॅटजीपीटीचे परिणाम काय?
चॅटजीपीटी एवढे प्रभावशाली असेल तर त्यामुळे आपल्या नोकऱ्यांवर गदा येऊ शकते का? तर त्याचे उत्तर ‘होय’ असेच आहे. अगदी सगळ्या नाही तरी काही नक्कीच. जे तेच-तेच लेख लिहितात, त्याच विषयांवर निबंध लिहावे लागतात, तशाच ई-मेल, तसेच प्रस्ताव, अशा पाट्या टाकणाऱ्या नोकऱ्यांवर परिणाम होऊ शकतो. पण ज्यांचे काम सृजनशील, नवनिर्मिती पूर्ण आहे त्यांना चिंता करण्याची गरज नाही. लार्ज लँगवेज मॉडेलना हरवणे आत्ता तरी दुरापास्त वाटत आहे.
 
चॅटजीपीटीचा बोलबाला चालू असतानाच त्याच्या जनकांनी पुढील लार्ज लँगवेज मॉडेलची म्हणजे ‘जीपीटी-४’ची घोषणा केली आहे. गुगलसारख्या इतर बलाढ्य कंपन्याही या भाषा-युद्धात हिरीरीने उतरल्या आहेत. कोणाची सरशी होईल हे सांगणे कठीणच. पण आपल्या हातात एवढेच आहे की, चॅटजीपीटीसारख्या शोधांचा आपल्या कामात पुरेपूर पण सजग वापर करणे आणि लक्ष असे ठेवणे की आपले काम असे असेल की ते चॅटजीपीटीला करणे अशक्य असेल.

(लेखक कृत्रिम बुद्धिमत्ता क्षेत्राचे अभ्यासक आहेत.)