मुंबई
Photo : Alexandra via pixabay.com

कम्प्यूटर की मदद से  व्यंगात्मक शब्दों के पता लगाने की तकनीक पर भारतीय परौद्योगिक संस्थान बम्बई के शोधार्थियों द्वारा विभिन्न दृष्टिकोणों से किया गया सर्वेक्षण

इंटरनेट दुनिया का सबसे बड़ा सुझाव बॉक्स है। क्या हम सभी ने किसी उत्पाद को खरीदने से पहले या किसी फिल्म को देखने जाने से पहले लाखों लोगों द्वारा लिखी गई समीक्षाओं को नहीं देखा होगा? ये समीक्षाएँ ऑनलाइन मार्केट के लिए बेहद महत्वपूर्ण होती हैं। इसलिए कम्पनियाँ अपने ग्राहकों की भावनाओं को समझने के लिए टूल्स का इस्तेमाल करती हैं जो रोज़ाना इस तरह की समीक्षाओं को पढ़कर यह बता सकता है कि कब ग्राहक खुश या नाराज़ है। लेकिन एक भावना जिसे समझना मुश्किल होता है वह है व्यंगात्मकता। आईआईटी बॉम्बे के प्राध्यापक पुष्पक भट्टाचार्य के नेतृत्व में एक टीम ने व्यंग भाव का पता लगाने के विभिन्न तरीकों का विश्लेषण किया।

एससीएम कंप्यूटिंग सर्वे में प्रकाशित शोध के लेखक डॉ. अदित्य जोशी कहते हैं, “बड़े राजनैतिक एवं वाणिज्यिक संगठन सोशल-मीडिया का प्रयोग यह जानने के लिए करते हैं कि लोग उनके बारे में क्या सोचते हैं। इस तरह के सर्वे कर्मचारियों के मूल्यांकन, होटल्स में फीडबैक फार्म आदि पर भी लागू किए जा सकते हैं।”ऑनलाइन समीक्षाएँ विभिन्न प्रकार की होती हैं। कुछ साफ तौर पर ग्राहक की मनोदशा दर्शाते हैं  किंतु कुछ समीक्षाएँ भ्रामक भी होती हैं। जैसे कि किसी बाल काले करने वाले हेयर-डाई की समीक्षा की गई हो कि “इस डाई ने मेरे बालों को वही लाल रंग दिया है जैसा मैं चाहती थी” पहली नज़र में यह एक सकारात्मक समीक्षा लग सकती है लेकिन इसमें एक व्यंग छुपा हुआ है क्योंकि विज्ञापन तो काले बाल करने वाली डाई के बारे में है। यदि एक संभावित ग्राहक यह जानने में सक्षम है कि यह अतिरिक्त जानकारी है तो वह इस तरह के व्यंग को समझ जाएगी या जाएगा। ऐसी परिस्थिति में अगर कंप्यूटर भावनाओं का विश्लेषण करने की कोशिश कर रहा है तो क्या होगा? क्या वह इस व्यंग का पता लगा सकता है? हाल में किए गए अध्ययन का कहना है कि कंप्यूटर ऐसा कर सकता है।

डॉ. जोशी कहते हैं कि, “परंपरागत रूप से व्यंग या कटाक्ष कई लोगों की भावना को ठेस पहुँचा सकते  हैं  इसलिए व्यंग या कटाक्ष पर केन्द्रित शोध उपयोगी हो सकता है।” डॉ. जोशी, प्राध्यापक पुष्पक भट्टाचार्य और डॉ. मार्क कारमेन इनवेस्टिगेशन्स इन कंप्यूटेशनल सार्कास्म पुस्तक के सह-लेखक हैं। उन्होंने ‘कंप्यूटेशन्ल सार्कास्म’ के पिछले काम पर समग्र दृष्टिकोण दिया है और आगे इन चुनौतियों पर काम करेंगे।

कटाक्ष का पता लगाने का दृष्टिकोण

मनुष्यों की तरह कंप्यूटर भी विभिन्न उदाहरणों के माध्यम से कटाक्ष का पता लगाना सीखते हैं। कंप्यूटर को सीखने में मदद करने वाला एक तरीका है ट्विटर जैसे  बड़े पैमाने का  डैटा लेना जहाँ #कटाक्ष और #नहीं जैसे हैश टैग्स से कटाक्ष या व्यंगात्मक ट्विट्स को इंगित किया जा सकता है। लेकिन ट्विटर संचार का केवल एक माध्यम है, कई तरह की वेबसाइट्स भी सहायक हो सकती हैं जहाँ हैशटैग की मदद के बिना भी व्यंगात्मक विषय वस्तु मिल सकती है।

इस क्षेत्र में पहले दृष्टिकोण में, व्यंगात्मक पैटर्न के लिए सकारात्मक क्रियाओं के साथ नकारात्मक वाक्यांशों की पहचान करना था, जैसे कि “मुझे सुबह के 4 बजे उठना पसंद है, सिरदर्द के साथ” और फिर इसे व्यंगात्मक या सांख्यिकी पैटर्न की वस्तु के रूप में इस्तेमाल करना। एक ऐसी क्रियाविधि जिसमें कंप्यूटर को इस तरह के डैटा का उदाहरण देकर व्यंगात्मक विष्य वस्तु पहचानने के लिए तैयार किया जाता है। प्रकाशित अध्ययनों में से एक में लॉजिस्टिक रेग्रेशन क्लासिफायर  की मदद से लगभग 81 प्रतिशत बार किसी कथन में निश्चित परिस्थिति सही है या गलत का पता चला। 

नमूनों का पता लगाने का एक अन्य तरीका है मानव एनोटेटर्स (पहचानकर्ता) का उपयोग मैन्युअल रूप से विषय वस्तु को वर्गीकृत करना। विशेष रूप से वहाँ जहाँ विषय वस्तु ज़्यादा लंबी है और पहचानकर्ता मौजूद नहीं हैं। हालाँकि इसमें एक दिक्कत है क्योंकि पहचानकर्ता विभिन्न जगहों से आते हैं।  जोशी कहते हैं कि, हमारे एक प्रकाशित अध्ययन में बताया गया है कि संस्कृतियों की भूमिका भी कटाक्ष का पता लगाती है। हमने अमेरिकी और भारतीयों की तुलना की कि कैसे कटाक्ष पर दोनों की धारणा अलग-अलग हो सकती है, एक बयान कि “बाहर धूप है और मैं धूप में काम कर रहा हूँ”, यह अमेरिकी लोगों के लिए कटाक्ष था जबकि भारतीय जलवायु के अनुसार भारतीय लोगों  के लिए कटाक्ष नहीं है।”

यह भी हम अच्छी तरह जानते हैं कि कभी-कभार मनुष्यों को भी ईमेल और विषय वस्तु को समझने में कठिनाई होती है या कोई ईमानदारी के साथ खुशी ज़ाहिर कर रहा है जैसे “मुझे तुम्हारे बालों से प्यार है”। तो कंप्यूटर इसे कैसे समझेगा? कुछ बयान चुभने वाले होते हैं जैसे “अनदेखा किया जाना सबसे अच्छा अनुभव है”, बिना चेहरे के हाव-भाव के यह समझना मुश्किल है। दूसरी तरफ यह वाक्य कि “मुझे हर सप्ताह छुट्टी पर गणित की समस्याएँ हल करना पसंद है”। गणित से नफरत करने वालों के लिए यह बयान कटाक्ष हो सकता है, लेकिन विषय से लगाव रखने वालों के लिए यह सकारात्मक बयान हो सकता है। कई मामलों में संदर्भ एक कुंजी की तरह होता है। जैसे मनुष्यों को किसी बात के लिए पूरी कहानी की ज़रूरत होती है उसी तरह कंप्यूटर को भी। कंप्यूटेशनल रिसर्च में हालिया ट्रैंड इसी प्रवृत्ति का इस्तेमाल करना है। ट्विट्स के मामले में भी जिन्हें कटाक्ष के रूप में लेखक द्वारा नहीं पहचाना जाता है के लिए उसके पीछे की पूरी कहानी की ज़रूरत होती है, यानी उस विषय के पहले और बाद में आने वाली टिप्पणियाँ। इससे लेखक के लिखने की भावना समझ आती है और कंप्यूटर को व्यक्ति की मानसिकता को समझने में मदद मिलती है जैसे कि यह बयान “राजनेता कभी गलत नहीं होता #राजनीति” कटाक्ष है या नहीं। 

व्यंग या कटाक्ष के स्वाद

व्यंग या कटाक्ष के विभिन्न प्रकारों का पता लगाने की शुरुआत हो चुकी है, मूल्यांकन प्रक्रिया में कटाक्ष  और व्यंग के बीच के अंतर, और उसमें निहित भाषा और संस्कृति-विशिष्ट लक्षणों को शामिल करना। हालाँकि अंग्रेज़ी भाषा के लिए कई शोध मौजूद है और इसी प्रक्रिया को अन्य भाषाओं के लिए भी इस्तेमाल किया जा सकता है। डॉ. जोशी कहते हैं, “चूँकि मशीन लर्निंग विधियों में कटाक्ष या व्यंग को निकालने के लिए उचित सूचक होते हैं, इसलिए विधियाँ पकड़ पाती हैं, इसके अनुरूप ही डैटाबैस अन्य भाषाओं या संस्कृति में भी दिए जा सकते हैं। हालाँकि एक विश्वव्यापी कटाक्ष वर्गीकर्ता एक कल्पना है।”वर्गीकर्ता के लक्षणों या डैटासैट को अलग-अलग भाषाओं और क्षेत्र की संस्कृतियों के लिए संशोधित करना होगा। सभी संस्कृतियों और भाषाओं में कटाक्ष का पता लगाने के लिए एक संभावित खाता तैयार करना होगा।

हालाँकि, कटाक्ष को समझने के लिए ट्रेनिंग सिस्टम में, क्या ऐसी संभावना है कि ये सिस्टम हमारे ऊपर भी कटाक्ष कर सके? डॉ. जोशी कहते हैं कि, ”यह स्वचालित रूप से तो ऐसा नहीं कर सकता लेकिन इसके लिए इसे सही स्थिति में प्रोग्राम किया जा सकता है। सिरि, कोर्टाना या शॉपिंग पोर्टल पर डिजिटल सहायक जैसे चैटबोट्स होते हैं। ये कंप्यूटर प्रोग्राम्स हैं जो मनुष्यों की तरह बात करते हैं। बोट्स को व्यंगात्मक या कटाक्ष होने के लिए प्रशिक्षित किया जा सकता है लेकिन वे हर समय व्यंगात्मक नहीं हो सकते हैं। इसलिए, यदि चैटबोट्स केवल सहायक हैं तो सॉफ्टवेयर आर्किटेक्ट्स और अन्य को उन परिस्थितियों का मूल्यांकन करना होगा कि कब चैटबोट्स को व्यंगात्मक या कटाक्ष होना पड़ेगा। आप औपचारिक रूप से चैटबोट्स को व्यंगात्मक नहीं करना चाहेंगे लेकिन यदि कोई गुस्सैल ग्राहक लंबे समय तक चैटबोट पर गुस्सा उतारता है तो बोट को यह निर्णय लेना होगा कि अब उसे व्यंग या कटाक्ष वाली प्रतिक्रिया देनी है। आप स्पष्ट रूप से देख सकते हैं कि कब एक बोट कटाक्ष हो सकता है, जब एक मनुष्य कटाक्ष हो।”

बयान सकारात्मक है या नकारात्मक यह बताने के लिए भावनात्मक पहचान सिस्टम के लिए ये सब सही और अच्छा है। हालाँकि जब यहीं सिस्टम कटाक्ष या व्यंग को बूझने में सक्षम होता है तो विषय वस्तु के पीछे की भावना को पहचानने में इसमें 4 प्रतिशत सुधार दिखता है। लेकिन कटाक्ष या व्यंग का पता लगाना पहेली बूझने जैसा है। डॉ. जोशी बताते हैं कि भावनात्मक पहचान सिस्टम कटाक्ष या व्यंग का पता लगाने में सक्षम हो जाता है तो यह एक बड़ी उपलब्धि होगी।

Hindi

Recent Stories

लिखा गया
Research Matters
Industrial Pollution

हाइड्रोजन आधारित प्रक्रियाओं में उन्नत उत्प्रेरकों और नवीकरणीय ऊर्जा के समावेश से स्टील उद्योग में कार्बन विमुक्ति के आर्थिक और औद्योगिक रूप से व्यवहार्य समाधानों का विकास ।

लिखा गया
Research Matters
Representative image of rust: By peter731 from Pixabay

दो वैद्युत-रासायनिक तकनीकों के संयोजन से, शोधकर्ता औद्योगिक धातुओं पर लेपित आवरण पर संक्षारण की दर को कुशलतापूर्वक मापने में सफल रहे।

लिखा गया
Research Matters
प्रतिनिधि चित्र श्रेय: पिक्साहाइव

उत्तम आपदा प्रबंधन एवं आर्थिक सुरक्षा की दृष्टि से, राज्य की वित्त व्यवस्था पर आपदा के प्रभाव का आकलन करने हेतु ‘डिजास्टर इंटेंसिटी इंडेक्स’ का उपयोग करते शोधकर्ता

लिखा गया
Research Matters
Lockeia gigantus trace fossils found from Fort Member. Credit: Authors

ಜೈ ನಾರಾಯಣ್ ವ್ಯಾಸ್ ವಿಶ್ವವಿದ್ಯಾಲಯದ ಸಂಶೋಧಕರು ಜೈಸಲ್ಮೇರ್ ನಗರದ ಬಳಿಯ ಜೈಸಲ್ಮೇರ್ ರಚನೆಯಲ್ಲಿ ಲಾಕಿಯಾ ಜೈಗ್ಯಾಂಟಸ್ ಪಳೆಯುಳಿಕೆಗಳನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದಾರೆ. ಇದು ಭಾರತದಿಂದ ಇಂತಹ ಪಳೆಯುಳಿಕೆಗಳ ಮೊದಲ ದಾಖಲೆ ಮಾತ್ರವಲ್ಲ, ಇದುವರೆಗೆ ಪತ್ತೆಯಾದ ಅತಿದೊಡ್ಡ ಲಾಕಿಯಾ ಕುರುಹುಗಳು.

लिखा गया
Research Matters
ಇಂಡೋ-ಬರ್ಮೀಸ್ ಪ್ಯಾಂಗೊಲಿನ್ (ಮನಿಸ್ ಇಂಡೋಬರ್ಮಾನಿಕಾ). ಕೃಪೆ: ವಾಂಗ್ಮೋ, ಎಲ್.ಕೆ., ಘೋಷ್, ಎ., ಡೋಲ್ಕರ್, ಎಸ್. ಮತ್ತು ಇತರರು.

ಕಳ್ಳತನದಿಂದ ಸಾಗಾಟವಾಗುತ್ತಿದ್ದ ಹಲವು ಪ್ರಾಣಿಗಳ ನಡುವೆ ಪ್ಯಾಂಗೋಲಿನ್ ನ ಹೊಸ ಪ್ರಭೇದವನ್ನು ಪತ್ತೆ ಮಾಡಲಾಗಿದೆ.

लिखा गया
Research Matters
ಸ್ಪರ್ಶರಹಿತ ಬೆರಳಚ್ಚು ಸಂವೇದಕದ ಪ್ರಾತಿನಿಧಿಕ ಚಿತ್ರ

ಸಾಧಾರಣವಾಗಿ, ಫೋನ್ ಅನ್ನು ಅನ್ಲಾಕ್ ಮಾಡುವಾಗ ಅಥವಾ ಕಛೇರಿಯಲ್ಲಿ ಬಯೋಮೆಟ್ರಿಕ್ ಸ್ಕ್ಯಾನರುಗಳನ್ನು ಬಳಸುವಾಗ, ನಿಮ್ಮ ಬೆರಳನ್ನು ಸ್ಕ್ಯಾನರಿನ ಮೇಲ್ಮೈಗೆ ಒತ್ತ ಬೇಕಾಗುತ್ತದೆ. ಬೆರಳಚ್ಚುಗಳನ್ನು ಸೆರೆಹಿಡಿಯುವುದು ಹೀಗೆ. ಆದರೆ, ಹೊಸ ಸಂಶೋಧನೆಯೊಂದು ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಇನ್ನಷ್ಟು ಸ್ವಚ್ಛ, ಸುಲಭ ಮತ್ತು ಹೆಚ್ಚು ನಿಖರವಾಗಿಸುವ ವಿಧಾನವನ್ನು ರೂಪಿಸಿದೆ. ಸಾಧನವನ್ನು ಮುಟ್ಟದೆಯೇ ಬೆರಳಚ್ಚನ್ನು ಸಂಗ್ರಹಿಸುವ ಮಾರ್ಗವನ್ನು ಹುಡುಕಿದೆ.

लिखा गया
Research Matters
ಮೈಕ್ರೋಸಾಫ್ಟ್ ಡಿಸೈನರ್ ನ ಇಮೇಜ್ ಕ್ರಿಯೇಟರ್ ಬಳಸಿ ಚಿತ್ರ ರಚಿಸಲಾಗಿದೆ

ಐಐಟಿ ಬಾಂಬೆಯ ಸಂಶೋಧಕರು ಶಾಕ್‌ವೇವ್-ಆಧಾರಿತ ಸೂಜಿ-ಮುಕ್ತ ಸಿರಿಂಜ್ ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದಾರೆ. ಈ ಮೂಲಕ ಸೂಜಿಗಳಿಲ್ಲದೆ ಔಷಧಿಗಳನ್ನು ಪೂರೈಸುವ ಮಾರ್ಗವನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದಾರೆ.

लिखा गया
Research Matters
ಅತ್ಯಂತ ಪ್ರಾಚೀನ ವಸ್ತುವಿನ ಅಧ್ಯಯನ

ಹಯಾಬುಸಾ ಎಂದರೆ ವೇಗವಾಗಿ ಚಲಿಸುವ ಜಪಾನೀ ಬೈಕ್ ನೆನಪಿಗೆ ತಕ್ಷಣ ಬರುವುದು ಅಲ್ಲವೇ? ಆದರೆ ಜಪಾನಿನ ಬಾಹ್ಯಾಕಾಶ ಸಂಸ್ಥೆ - (ಜಾಕ್ಸ, JAXA) ತನ್ನ ಒಂದು ನೌಕೆಯ ಹೆಸರು ಹಯಾಬುಸಾ 2 ಎಂದು ಇಟ್ಟಿದ್ದಾರೆ. ಈ ನೌಕೆಯನ್ನು ಜಪಾನಿನ ಬಾಹ್ಯಾಕಾಶ ಸಂಸ್ಥೆ ಸೌರವ್ಯೂಹದಾದ್ಯಂತ ಸಂಚರಿಸಿ ರುಯ್ಗು (Ryugu) ಕ್ಷುದ್ರಗ್ರಹವನ್ನು ಸಂಪರ್ಕ ಸಾಧಿಸುವ ಉದ್ದೇಶದಿಂದ  ಡಿಸೆಂಬರ್ 2014 ರಲ್ಲಿ ಉಡಾವಣೆ ಮಾಡಿತ್ತು. ಇದು ಸುಮಾರು ಮೂವತ್ತು ಕೋಟಿ (300 ಮಿಲಿಯನ್) ಕಿಲೋಮೀಟರ್ ದೂರ ಪ್ರಯಾಣಿಸಿ 2018 ರಲ್ಲಿ ರುಯ್ಗು ಕ್ಷುದ್ರಗ್ರಹವನ್ನು ಸ್ಪರ್ಶಿಸಿತ್ತು. ಅಲ್ಲಿಯೇ ಕೆಲ ತಿಂಗಳು ಇದ್ದು ಮಾಹಿತಿ ಮತ್ತು ವಸ್ತು ಸಂಗ್ರಹಣೆ ಮಾಡಿ, 2020 ಯಲ್ಲಿ ಯಶಸ್ವಿಯಾಗಿ ಹಿಂತಿರುಗಿತ್ತು.

लिखा गया
Research Matters
ಕಾಂಕ್ರೀಟ್‌ ಪರೀಕ್ಷೆಗೆ ಪ್ರೋಬ್‌

ಕಾಂಕ್ರೀಟ್‌ನಲ್ಲಿ ಹುದುಗಿರುವ ರೆಬಾರ್‌ಗಳಲ್ಲಿನ ತುಕ್ಕು ಪ್ರಮಾಣವನ್ನು ಮಾಪಿಸಲು ವಿಜ್ಞಾನಿಗಳು ಒಂದು ಹೊಸ ತಪಾಸಕವನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದಾರೆ.

लिखा गया
Research Matters
‘ದ್ವಿಪಾತ್ರ’ದಲ್ಲಿ ಮೈಕ್ರೋ ಆರ್‌ಎನ್‌ಎ

ವೈರಲ್ ಸೋಂಕುಗಳು ಮತ್ತು ಸ್ವಯಂ ನಿರೋಧಕ ಕಾಯಿಲೆಗಳಲ್ಲಿ ಮೈಕ್ರೋ ಆರ್‌ಎನ್‌ಎ ‘ದ್ವಿಪಾತ್ರ’ದಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ. 

लिखा गया
Research Matters
ರೀಚಾರ್ಜ್ ಮಾಡಬಹುದಾದ ಬ್ಯಾಟರಿಗಳು

ಐಐಟಿ ಬಾಂಬೆ ಯ ಬ್ಯಾಟರಿ ಪ್ರೋಟೋಟೈಪಿಂಗ್ ಲ್ಯಾಬ್ ನ ಸಂಶೋಧಕರು ಇಂಧನ (ಶಕ್ತಿ) ಶೇಖರಣಾ ಸಾಧನವಾಗಿರುವ ರೀಚಾರ್ಜ್ ಮಾಡಬಹುದಾದ ಬ್ಯಾಟರಿಗಳ ಬಗ್ಗೆ ಅಧ್ಯಯನ ನಡೆಸುತ್ತಿದ್ದಾರೆ. 

Loading content ...
Loading content ...
Loading content ...
Loading content ...
Loading content ...