Wednesday, April 2, 2014

शोध आलेख- "मशीनी अनुवाद और संदिग्धार्थकता"

                     
                                                        -सुधीर जिंदे

दो भाषाओं के बीच संप्रेषण स्थापित करने के लिए अनुवाद का सहारा लिया जाता है। अनुवाद एक भाषा की पाठ सामग्री को दूसरी भाषा की पाठ सामग्री में बिना किसी अर्थ परिवर्तन के रूपांतरित करता है। नाइडा के अनुसार, “Translating consists in reproducing in the receptor language the closest natural equivalent of the source-language message, first in terms of meaning and secondly in terms of style.” अनुवाद की इस प्रक्रिया में मशीन अर्थात कंप्यूटर का उपयोग करना मशीनी अनुवाद है। युजीन ए. नाइडा ने मानव अनुवाद प्रक्रिया के परिप्रेक्ष्य में तीन सोपान बताए हैं- विश्लेषण, अंतरण और पुनर्गठन। मानव अनुवाद की इस प्रक्रिया के आधार पर मशीनी अनुवाद की प्रक्रिया के भी तीन सोपान हैं- पाठ का विश्लेषण (पार्सिंग), अंतरवर्ती प्रक्रिया और प्रजनन (generation)। मशीनी अनुवाद के लिए स्रोत भाषा और लक्ष्य भाषा दोनों के ही वाक्यात्मक नियमों और शब्दकोश की आवश्यकता होती है। वाक्यात्मक नियमों को एल्गोरिदमों एवं तार्किक अभिव्यक्तियों तथा शब्दकोश को डेटाबेस के रूप में मशीन में संग्रहित करते हुए मशीनी अनुवाद प्रणालियों के विकास का कार्य किया जाता है।
व्यावहारिक स्तर पर मशीनी अनुवाद प्रणाली का विकास करना एक अत्यंत जटिल कार्य है।  मशीनी अनुवाद में प्राकृतिक भाषा संसाधन के माध्यम से स्रोत तथा लक्ष्य भाषा की संरचना को संसाधित किया जाता है। लेकिन प्राकृतिक भाषा के संसाधन के लिए केवल वाकयात्मक नियमों और शब्दकोश का ज्ञान होना ही पर्याप्त नहीं होता बल्कि स्रोत भाषा में पाए जाने वाले रूढ़ प्रयोगों, वाक्य में शब्दों के प्रयोग के सामाजिक सांस्कृतिक संदर्भ, शब्दों में पाई जाने वाली अनेकार्थकता आदि का भी संसाधन आवश्यक होता है जिससे कि भाषिक अंतरण के पश्चात हमें सटीक अनुवाद प्राप्त हो सके।  
अंग्रेज़ी की संरचनात्मक संदिग्धार्थकता को समझने के लिए एक महत्वपूर्ण आलेख है। इस आलेख में नॉर्मन स्टेजबर्ग ने संदिग्धार्थकता की संकल्पना एवं उनके प्रकारों का विश्लेषण किया है।
एगिर और एडमंड के अनुसार, “Polysemy means to have multiple meanings”. It is an intrinsic property of words (in isolation from text), whereas “ambiguity” is a property of text.

अँग्रेज़ी में संज्ञाएं क्रिया के रूप में होकर संरचनात्मक संदिग्धार्थकता उत्पन्न करती है, जैसे-

         Patent medicines are sold by frightening people.

इस वाक्य में संज्ञा ‘fright’ क्रिया तथा विशेषण के रूप में प्रयुक्त होकर वाक्य में संदिग्धार्थकता उत्पन्न करती है।   
अनुवाद करते समय अनुवादक को जब किसी संदिग्धार्थक शब्द का सामना करना पड़ता है तब वह पाठ के संदर्भ तथा अपने वैश्विक ज्ञान के आधार पर उस शब्द का अनुवाद कर लेता है। लेकिन मशीनी अनुवाद के संदर्भ में मशीन संदर्भ तथा वैश्विक ज्ञान के अभाव में शब्द के विशिष्ट आशय को समझ नहीं पाती जिसके कारण मशीन सही अनुवाद करने में सक्षम नहीं हो पाती।
प्राकृतिक भाषा स्वभावतः संदिग्धार्थक होती है। किसी शब्द के अनेक अर्थ होसकते हैं। अनेकार्थकता में किसी शब्द के एक ज्यादा अर्थ होते हैं। यह शब्द की अंतर्निहित विशिष्टता होती है जिसका पाठ से कोई संबंध नहीं होता। संदिग्धार्थकता पाठ की विशिष्टता होती है। किसी प्राकृतिक भाषा के पाठ में यदि कोई शब्द दिया गया है तो शब्दगत आशय की स्पष्टता या शब्द-आशय विसंदिग्धीकरण’ (word sense disambiguation)  का काम प्रसंग-विशेष में उस  शब्द के सही आशय को निश्चित करना होता है। शब्द-आशय विसंदिग्धीकरण (word sense disambiguation: WSD) प्राकृतिक भाषा संसाधन की आधारभूत और विचारणीय समस्या है। अत्याधिक संदिग्धार्थी शब्द प्राकृतिक भाषा संबंधी अनुप्रयोग के लिए लगातार एक समस्या खड़ी करते रहे हैं। इनकी वजह से मशीनी अनुवाद तंत्र द्वारा प्राप्त अनूदित पाठ अपने मूलपाठ से भटक जाता है। कोशीय संदिग्धार्थता वाक्यपरक या अर्थपरक होती है। शब्द की वाक्यगत स्तर की संदिग्धार्थकता को पार्ट ऑव स्पीच टैगर के माध्यम से सुलझाया जा सकता है जो कि पाठ-विशेष के शब्दों की वाक्यपरक कोटियों का अत्यधिक सटीकता के साथ निर्धारण करते हैं।
  
अर्थपरक संदिग्धार्थकता की समस्या, जिसे सामान्यतः शब्द-आशय विसंदिग्धीकरण (WSD) के नाम से जाना जाता है, का हल वाक्यपरक संदिग्धार्थकता से कहीं ज्यादा मुश्किल साबित हुआ है।
शब्द विशेष के प्रयोग का सही अर्थ निर्धारित करने के एकमात्र तरीका यही होता है कि उसे संदर्भ-विशेष में रखकर देखा जाए। ईड और वेरोनिस के अनुसार, शब्द के अर्थ को प्राप्त करने के लिए मुख्यतः दो चरणों से गुजरना पड़ता है। पहले चरण में किसी शब्द के पाठ में प्रयोग के पर सभी संभव अर्थों का पता लगाया जाता है। इसके लिए कोश में शब्द के समानार्थी तथा पर्यायवाची शब्दों तथा अनुवाद के माध्यम से इस लक्ष्य (task) को पूर्ण किया जाता है। दूसरे चरण में किसी विशिष्ट संदर्भ में पाये गए आशय को अर्थ के रूप में स्थापित किया जाता है। विसंदिग्धीकरण की प्रक्रिया में संदर्भ की समानता के आधार पर शब्द के विशिष्ट अर्थ को स्थापित करने के नियमों को सामान्यीकृत करने का प्रयास किया जाता है। शब्द आशय विसंदिग्धीकरण को जानने की तीन कार्य-पद्धतियाँ हैं : ज्ञान-आधारित कार्य-पद्धति, जो किसी ख़ास या सुस्पष्ट कोश का इस्तेमाल करती है; कॉर्पस-आधारित विसंदिग्धीकरण, जिसमें शब्द के आशय के बारे में संदर्भित जानकारी वृहद स्तर पर एकत्रित भाषाई सामग्री (कॉर्पस) से एकत्रित की जाती है। या फिर तीसरा विकल्प है: एक संकर कार्य-पद्धति, जो कि इस सभी प्रविधियों का मिला-जुला उपयोग करती है। संदिग्धार्थकता अर्थ की क्लिष्टता के दृष्टि से पूर्ण रूप से संदिग्धार्थक या आंशिक रूप से संदिग्धार्थक हो सकती है। पूर्ण संदिग्धार्थकता : इस प्रकार की संदिग्धार्थकता में वाक्य में प्रयुक्त व्याकरणिक इकाई के प्रयोग से एक ही वाक्य में दो भिन्न  अर्थ प्राप्त होते है, जैसे-
               Police begin campaign to run down jaywalkers.

इस वाक्य में ‘run down’ इस क्रिया के दो अर्थ प्राप्त होते है; ‘खोजना’ (find) और ‘hit with a car’) यह शब्द स्तरीय संदिग्धार्थकता का उदाहरण है।  आंशिक संदिग्धार्थकता में वाक्य में एक से अधिक इकाइयाँ शब्द स्तर संदिग्धार्थक होती है। इस संदिग्धार्थकता के कारण एक ही वाक्य भिन्न भिन्न अर्थ प्राप्त होते है, जैसे-
                        Farmer bill dies in house.
इस वाक्य में ‘bill’ किसी व्यक्ति विशेष का नाम भी हो सकता है और एक ‘legislative proposal’ भी। वाक्य के व्याकरणिक कर्ता के निर्वचन के आधार पर क्रिया ‘die’ का अर्थ अभिधापरक तथा लक्षणापरक इन दोनों अर्थों में लिया जा सकता है। कर्ता और क्रिया के विसंदिग्धीकरण के बाद वाक्य के सही निर्वचन के लिए कर्म के अर्थ को समझना भी आवश्यक होता है, जैसे इस वाक्य में ‘house’ इस शब्द के दो निर्वचन है ‘home’ और ‘house of commons’अंग्रेजी भाषा में संज्ञा के अनेकार्थक होने से वाक्य में संदिग्धार्थकता पाई जाती है। उदाहरण के लिए,
                    He is looking for his glasses.
इस वाक्य में संज्ञा ‘glass’ के अनेकार्थक होने से वाक्य संदिग्धार्थकता होकर उसके एक से अधिक अर्थ प्राप्त हो सकते है। जैसे- इस वाक्य में ‘glass’ के ‘drinking glass’ और ‘reading glass’ दोनों ही अर्थ प्राप्त हो सकते है।
दूसरे प्रकार की संदिग्धार्थकता संज्ञा की एक आर्थी विशेषता (semantic characteristic) जिसे समनामिता (homonymy) कहते है उसके कारण अंग्रेजी भाषा में पाई जाती है। उदाहरण के लिए
He looked at the bank.
इस वाक्य में ‘bank’ संज्ञा के समनामी होने के कारण वाक्य में संदिग्धार्थकता उत्पन्न होती है। संज्ञा के समनामी होने के कारण इसके ‘money bank’ तथा ‘river bank’ दोनों ही अर्थ प्राप्त हो सकते है।
तीसरे प्रकार की संदिग्धार्थकता संज्ञा के एकवचन तथा बहुवचन के प्रयुक्त एक ही संज्ञा रूप के प्रयुक्त होने के कारण प्राप्त होती है। जैसे-

I saw this sheep graze in the field.
इस वाक्य में ‘sheep’ संज्ञा रूप एकवचन तथा बहुवचन इन दोनों के प्रयुक्त होने के कारण वाक्य में संदिग्धार्थकता उत्पन्न होती है।
चौथे प्रकार की संदिग्धार्थकता संक्षिप्तियों के संज्ञा के रूप में वाक्य में प्रयुक्त होने के कारण उत्पन्न होती है। कभी कभी एक ही संक्षिप्ति के एक से अधिक विस्तार हो सकते है जिससे वाक्य में संदिग्धार्थकता उत्पन्न हो सकती है, जैसे-
He is a news reporter from ABC.
इस वाक्य में संज्ञा ABC के Australian Broadcasting Company तथा American Broadcasting Company ऐसे अर्थ संभव हो सकते है जिससे वाक्य में संदिग्धार्थता उत्पन्न हो सकती है।
संदर्भ आधारित विसंदिग्धीकरण की प्रक्रिया में क्रिया का संदर्भ संरचना के आधार पर किया गया आर्थी विश्लेषण अधिक उपयुक्त होता है। निकोलस गीसबोम में The event structure of perception verbs इस आलेख में परसेप्शन क्रियाओं का इवेंट संरचना के आधार पर विश्लेषण किया है। निकोलस गीसबोम के अनुसार,The verbs of perception provide an ideal place to study the syntax-semantics interface, for they evince a number of different complementation patterns as well as a high degree of polysemy.” परसेप्शन क्रियाओं जैसे- look, feel, see, taste, hear, feel, sound, listen आदि में पाई जाने वाली अनेकार्थकता एवं संदिग्धार्थकता अंग्रेज़ी क्रिया की आर्थी संरचना की दृष्टि से एक बड़ी समस्या है। मशीनी अनुवाद के लिए परसेप्शन क्रियाओं की संदिग्धार्थकता का अध्ययन इवैंट संरचना के आधार पर किया जा सकता है। क्रिया संदिग्धार्थकता के अध्ययन के लिए यह अध्ययन महत्वपूर्ण इसलिए है क्योंकि संज्ञा के वाक्य में प्रयोग से क्रिया के अर्थ में संदर्भगत संदिग्धार्थकता उत्पन्न होती है। अतः संदिग्धार्थकता के विसंदिग्धीकरण के लिए भाषा के शब्द, वाक्य एवं उसके संदर्भ इन तीनों स्तरों पर अध्ययन करने की आवश्यकता है।




संदर्भग्रंथ सूची :
         
1.       Prof. Feng Zhiwei, “Computational Linguistics CS579”, Chapter 5. Ambiguity
2.       shelia m. kennison, “Limitations on the use of verb information during sentence   comprehension” University of Massachusetts, Amherst, Massachusetts
3.       Nick riemer, “Introducing semantics”, cambridge university press.
4.       charles w. kreidler, Introducing english semantics, routledge publication.




                                                         सुधीर जिंदे
                                                      पीएच.डी. अनुवाद प्रौद्योगिकी
                                                    अनुवाद प्रौद्योगिकी विभाग
                                                   म.गां.अं.हिं.वि.वि. वर्धा
                                                                मोबाइल: 9890691568 
                                                           ईमेल: stransa@gmail.com

1 comment:

  1. नमस्कार सुधीर जिंदे,
    आपके शोध का विषय और लेख से मशीन ट्रांसलेशन के बारे में संक्षिप्त मगर कारगर जानकरी मिली.
    अगर व्याकरण , शैली और वर्तनी शोधक की कार्य प्रणाली की भी जानकारी अगर विस्तृत उपलब्ध करवाई जाये तो इस विषय में और जानने मिल सकता है|
    धन्यवाद!
    dhote_priyanka@yahoo.in

    ReplyDelete