-सुधीर
जिंदे
दो भाषाओं
के बीच संप्रेषण स्थापित करने के लिए अनुवाद का सहारा लिया जाता है। अनुवाद एक
भाषा की पाठ सामग्री को दूसरी भाषा की पाठ सामग्री में बिना किसी अर्थ परिवर्तन के
रूपांतरित करता है। नाइडा के
अनुसार, “Translating consists in reproducing in the receptor language
the closest natural equivalent of the source-language message, first in terms
of meaning and secondly in terms of style.” अनुवाद की इस प्रक्रिया में मशीन अर्थात कंप्यूटर का उपयोग
करना मशीनी अनुवाद है। युजीन ए. नाइडा ने मानव अनुवाद प्रक्रिया के परिप्रेक्ष्य
में तीन सोपान बताए हैं- विश्लेषण, अंतरण और पुनर्गठन। मानव अनुवाद की इस प्रक्रिया के आधार पर मशीनी अनुवाद
की प्रक्रिया के भी तीन सोपान हैं- पाठ का विश्लेषण
(पार्सिंग), अंतरवर्ती प्रक्रिया और प्रजनन (generation)। मशीनी अनुवाद के लिए स्रोत भाषा और लक्ष्य भाषा दोनों के ही वाक्यात्मक
नियमों और शब्दकोश की आवश्यकता होती है। वाक्यात्मक नियमों को एल्गोरिदमों एवं
तार्किक अभिव्यक्तियों तथा शब्दकोश को डेटाबेस के रूप में मशीन में संग्रहित करते
हुए मशीनी अनुवाद प्रणालियों के विकास का कार्य किया जाता है।
व्यावहारिक
स्तर पर मशीनी अनुवाद प्रणाली का विकास करना एक अत्यंत जटिल कार्य है। मशीनी अनुवाद में प्राकृतिक भाषा संसाधन के
माध्यम से स्रोत तथा लक्ष्य भाषा की संरचना को संसाधित किया जाता है। लेकिन
प्राकृतिक भाषा के संसाधन के लिए केवल वाकयात्मक नियमों और शब्दकोश का ज्ञान होना
ही पर्याप्त नहीं होता बल्कि स्रोत भाषा में पाए जाने वाले रूढ़ प्रयोगों, वाक्य में शब्दों के प्रयोग के सामाजिक
सांस्कृतिक संदर्भ, शब्दों में पाई जाने वाली अनेकार्थकता
आदि का भी संसाधन आवश्यक होता है जिससे कि भाषिक अंतरण के पश्चात हमें सटीक अनुवाद
प्राप्त हो सके।
अंग्रेज़ी की संरचनात्मक
संदिग्धार्थकता को समझने के लिए एक महत्वपूर्ण आलेख है। इस आलेख में नॉर्मन
स्टेजबर्ग ने संदिग्धार्थकता की संकल्पना एवं उनके प्रकारों का विश्लेषण किया है।
एगिर और
एडमंड के अनुसार, “Polysemy
means to have multiple meanings”. It is an intrinsic property of words (in
isolation from text), whereas “ambiguity” is a property of text.
अँग्रेज़ी
में संज्ञाएं क्रिया के रूप में होकर संरचनात्मक संदिग्धार्थकता उत्पन्न करती है, जैसे-
Patent
medicines are sold by frightening people.
इस वाक्य में संज्ञा ‘fright’ क्रिया तथा विशेषण के रूप में प्रयुक्त होकर वाक्य में
संदिग्धार्थकता उत्पन्न करती है।
अनुवाद करते समय अनुवादक को जब किसी संदिग्धार्थक शब्द का
सामना करना पड़ता है तब वह पाठ के संदर्भ तथा अपने वैश्विक ज्ञान के आधार पर उस
शब्द का अनुवाद कर लेता है। लेकिन मशीनी अनुवाद के संदर्भ में मशीन संदर्भ तथा
वैश्विक ज्ञान के अभाव में शब्द के विशिष्ट आशय को समझ नहीं पाती जिसके कारण मशीन
सही अनुवाद करने में सक्षम नहीं हो पाती।
प्राकृतिक भाषा
स्वभावतः संदिग्धार्थक होती है। किसी शब्द के अनेक अर्थ होसकते हैं। अनेकार्थकता
में किसी शब्द के एक ज्यादा अर्थ होते हैं। यह शब्द की अंतर्निहित विशिष्टता होती
है जिसका पाठ से कोई संबंध नहीं होता। संदिग्धार्थकता पाठ की विशिष्टता होती है।
किसी प्राकृतिक भाषा के पाठ में यदि कोई शब्द दिया गया है तो शब्दगत आशय की
स्पष्टता या ‘शब्द-आशय
विसंदिग्धीकरण’ (word
sense disambiguation) का काम प्रसंग-विशेष में उस शब्द के सही आशय को निश्चित करना होता है।
शब्द-आशय विसंदिग्धीकरण (word
sense disambiguation: WSD) प्राकृतिक भाषा संसाधन की आधारभूत और विचारणीय
समस्या है। अत्याधिक संदिग्धार्थी शब्द प्राकृतिक भाषा संबंधी अनुप्रयोग के लिए
लगातार एक समस्या खड़ी करते रहे हैं। इनकी वजह से मशीनी अनुवाद तंत्र द्वारा
प्राप्त अनूदित पाठ अपने मूलपाठ से भटक जाता है। कोशीय संदिग्धार्थता वाक्यपरक या
अर्थपरक होती है। शब्द की वाक्यगत स्तर की संदिग्धार्थकता को पार्ट ऑव स्पीच टैगर
के माध्यम से सुलझाया जा सकता है जो कि पाठ-विशेष के शब्दों की वाक्यपरक कोटियों
का अत्यधिक सटीकता के साथ निर्धारण करते हैं।
अर्थपरक
संदिग्धार्थकता की समस्या,
जिसे सामान्यतः
शब्द-आशय विसंदिग्धीकरण (WSD)
के नाम से जाना
जाता है, का हल वाक्यपरक
संदिग्धार्थकता से कहीं ज्यादा मुश्किल साबित हुआ है।
शब्द विशेष के प्रयोग का सही अर्थ निर्धारित करने के एकमात्र
तरीका यही होता है कि उसे संदर्भ-विशेष में रखकर देखा जाए। ईड और वेरोनिस के
अनुसार, शब्द के अर्थ को
प्राप्त करने के लिए मुख्यतः दो चरणों से गुजरना पड़ता है। पहले चरण में किसी शब्द
के पाठ में प्रयोग के पर सभी संभव अर्थों का पता लगाया जाता है। इसके लिए कोश में
शब्द के समानार्थी तथा पर्यायवाची शब्दों तथा अनुवाद के माध्यम से इस लक्ष्य (task) को पूर्ण किया
जाता है। दूसरे चरण में किसी विशिष्ट संदर्भ में पाये गए आशय को अर्थ के रूप में
स्थापित किया जाता है। विसंदिग्धीकरण की प्रक्रिया में संदर्भ की समानता के आधार
पर शब्द के विशिष्ट अर्थ को स्थापित करने के नियमों को सामान्यीकृत करने का प्रयास
किया जाता है। शब्द आशय विसंदिग्धीकरण को जानने की तीन कार्य-पद्धतियाँ हैं :
ज्ञान-आधारित कार्य-पद्धति,
जो किसी ख़ास या
सुस्पष्ट कोश का इस्तेमाल करती है; कॉर्पस-आधारित विसंदिग्धीकरण, जिसमें शब्द के आशय के बारे में संदर्भित
जानकारी वृहद स्तर पर एकत्रित भाषाई सामग्री (कॉर्पस) से एकत्रित की जाती है। या
फिर तीसरा विकल्प है: एक संकर कार्य-पद्धति, जो कि इस सभी प्रविधियों का मिला-जुला उपयोग करती है। संदिग्धार्थकता अर्थ की
क्लिष्टता के दृष्टि से पूर्ण रूप से संदिग्धार्थक या आंशिक रूप से संदिग्धार्थक
हो सकती है। पूर्ण संदिग्धार्थकता : इस प्रकार
की संदिग्धार्थकता में वाक्य में प्रयुक्त व्याकरणिक इकाई के प्रयोग से एक ही
वाक्य में दो भिन्न अर्थ प्राप्त होते है, जैसे-
Police begin campaign to run down jaywalkers.
इस वाक्य में ‘run down’ इस क्रिया के दो
अर्थ प्राप्त होते है; ‘खोजना’ (find) और ‘hit with a car’) यह शब्द स्तरीय
संदिग्धार्थकता का उदाहरण है। आंशिक संदिग्धार्थकता में वाक्य में एक से अधिक
इकाइयाँ शब्द स्तर संदिग्धार्थक होती है। इस संदिग्धार्थकता के कारण एक ही वाक्य
भिन्न भिन्न अर्थ प्राप्त होते है, जैसे-
Farmer bill dies in
house.
इस वाक्य में ‘bill’ किसी व्यक्ति विशेष का नाम भी हो सकता है और
एक ‘legislative proposal’ भी। वाक्य के व्याकरणिक
कर्ता के निर्वचन के आधार पर क्रिया ‘die’ का अर्थ अभिधापरक तथा लक्षणापरक इन दोनों अर्थों में लिया
जा सकता है। कर्ता और क्रिया के विसंदिग्धीकरण के बाद वाक्य के सही निर्वचन के लिए
कर्म के अर्थ को समझना भी आवश्यक होता है,
जैसे इस वाक्य में ‘house’ इस शब्द के दो निर्वचन है ‘home’ और ‘house of commons’। अंग्रेजी भाषा में संज्ञा के
अनेकार्थक होने से वाक्य में संदिग्धार्थकता पाई जाती है। उदाहरण के लिए,
He
is looking for his glasses.
इस वाक्य में संज्ञा ‘glass’ के अनेकार्थक होने से वाक्य संदिग्धार्थकता होकर उसके एक से अधिक अर्थ
प्राप्त हो सकते है। जैसे- इस वाक्य में ‘glass’ के ‘drinking glass’ और ‘reading glass’ दोनों ही अर्थ प्राप्त हो सकते है।
दूसरे प्रकार की संदिग्धार्थकता संज्ञा की एक आर्थी विशेषता
(semantic characteristic) जिसे समनामिता (homonymy) कहते है उसके कारण
अंग्रेजी भाषा में पाई जाती है। उदाहरण के लिए
He looked
at the bank.
इस वाक्य में ‘bank’ संज्ञा के समनामी होने के कारण वाक्य
में संदिग्धार्थकता उत्पन्न होती है। संज्ञा के समनामी होने के कारण इसके ‘money bank’ तथा ‘river bank’ दोनों
ही अर्थ प्राप्त हो सकते है।
तीसरे प्रकार की
संदिग्धार्थकता संज्ञा के एकवचन तथा बहुवचन के प्रयुक्त एक ही संज्ञा रूप के
प्रयुक्त होने के कारण प्राप्त होती है। जैसे-
I saw this
sheep graze in the field.
इस वाक्य में ‘sheep’ संज्ञा रूप एकवचन तथा बहुवचन इन
दोनों के प्रयुक्त होने के कारण वाक्य में संदिग्धार्थकता उत्पन्न होती है।
चौथे प्रकार की
संदिग्धार्थकता संक्षिप्तियों के संज्ञा के रूप में वाक्य में प्रयुक्त होने के
कारण उत्पन्न होती है। कभी कभी एक ही संक्षिप्ति के एक से अधिक विस्तार हो सकते है
जिससे वाक्य में संदिग्धार्थकता उत्पन्न हो सकती है, जैसे-
He is a news reporter from
ABC.
इस वाक्य में संज्ञा ABC के Australian Broadcasting
Company तथा American Broadcasting Company ऐसे
अर्थ संभव हो सकते है जिससे वाक्य में संदिग्धार्थता उत्पन्न हो सकती है।
संदर्भ आधारित विसंदिग्धीकरण की प्रक्रिया में क्रिया का
संदर्भ संरचना के आधार पर किया गया आर्थी विश्लेषण अधिक उपयुक्त होता है। निकोलस
गीसबोम में “The event structure of perception verbs” इस आलेख में परसेप्शन क्रियाओं का
इवेंट संरचना के आधार पर विश्लेषण किया है। निकोलस
गीसबोम के अनुसार, “The verbs of perception
provide an ideal place to study the syntax-semantics interface, for they evince
a number of different complementation patterns as well as a high degree of
polysemy.” परसेप्शन क्रियाओं
जैसे- look, feel, see, taste,
hear, feel, sound, listen आदि में पाई जाने वाली अनेकार्थकता एवं
संदिग्धार्थकता अंग्रेज़ी क्रिया की आर्थी संरचना की दृष्टि से एक बड़ी समस्या है।
मशीनी अनुवाद के लिए परसेप्शन क्रियाओं की संदिग्धार्थकता का अध्ययन इवैंट संरचना
के आधार पर किया जा सकता है। क्रिया संदिग्धार्थकता के अध्ययन के लिए यह अध्ययन
महत्वपूर्ण इसलिए है क्योंकि संज्ञा के वाक्य में प्रयोग से क्रिया के अर्थ में
संदर्भगत संदिग्धार्थकता उत्पन्न होती है। अतः संदिग्धार्थकता के विसंदिग्धीकरण के
लिए भाषा के शब्द, वाक्य एवं उसके संदर्भ इन तीनों स्तरों पर
अध्ययन करने की आवश्यकता है।
संदर्भग्रंथ सूची :
1.
Prof.
Feng Zhiwei, “Computational Linguistics CS579”,
Chapter 5. Ambiguity
2.
shelia
m. kennison, “Limitations on the use of verb information during sentence comprehension” University of Massachusetts, Amherst,
Massachusetts
3.
Nick
riemer, “Introducing semantics”, cambridge university press.
4.
charles
w. kreidler, Introducing english semantics, routledge publication.
सुधीर जिंदे
पीएच.डी. अनुवाद प्रौद्योगिकी
अनुवाद प्रौद्योगिकी विभाग
म.गां.अं.हिं.वि.वि. वर्धा
मोबाइल: 9890691568
ईमेल: stransa@gmail.com
नमस्कार सुधीर जिंदे,
ReplyDeleteआपके शोध का विषय और लेख से मशीन ट्रांसलेशन के बारे में संक्षिप्त मगर कारगर जानकरी मिली.
अगर व्याकरण , शैली और वर्तनी शोधक की कार्य प्रणाली की भी जानकारी अगर विस्तृत उपलब्ध करवाई जाये तो इस विषय में और जानने मिल सकता है|
धन्यवाद!
dhote_priyanka@yahoo.in