अम्बेडकर वाङ्मय का एनोटेटेड समानांतर कार्पस
निर्माण
(अंग्रेजी-हिंदी के खंड-6,9,13 एवं 14 के विशेष संदर्भ में)
महात्मा गाँधी अंतर्राष्ट्रीय हिंदी विश्वविद्यालय,वर्धा के अनुवाद एवं निर्वाचन विद्यापीठ के अनुवाद प्रौद्योगिकी विभाग में पी-एच.डी . अनुवाद प्रौद्योगिकी उपाधि हेतु प्रस्तुत
शोध विषय प्रस्तुतीकरण
प्रस्तावना
(अंग्रेजी-हिंदी के खंड-6,9,13 एवं 14 के विशेष संदर्भ में)
महात्मा गाँधी अंतर्राष्ट्रीय हिंदी विश्वविद्यालय,वर्धा के अनुवाद एवं निर्वाचन विद्यापीठ के अनुवाद प्रौद्योगिकी विभाग में पी-एच.डी . अनुवाद प्रौद्योगिकी उपाधि हेतु प्रस्तुत
शोध विषय प्रस्तुतीकरण
प्रस्तावना
कार्पस भाषाविज्ञान एक बहुआयामी क्षेत्र है| भाषा अध्ययन के
लिए कार्पस का परिचय और अनुप्रयोग भाषाविज्ञान में एक नए आयाम के रूप में शामिल
किया गया है| सैद्धांतिक रूप में, कार्पस भाषाविज्ञान एक ऐसा दृष्टिकोण है जिसका
उद्देश्य पाठों के नमूनों के बड़े संग्रहों का विश्लेषण करके भाषा और उसके सभी
गुणों की जांच करना है| आज यह दृष्टिकोण शोध के विभिन्न क्षेत्रों में प्रयोग किया
जा रहा है, जैसे : भाषा का वर्णनात्मक अध्ययन, मशीनी अनुवाद, भाषा शिक्षण और कोश
निर्माण आदि| यह मोटे तौर पर वाचिक और लिखित पाठ नमूनों के विस्तृत प्रामाणिक विश्लेषण को संदर्भित करता
है|
कार्पस मशीनी अनुवाद
का एक महत्वपूर्ण तत्व है| कार्पस किसी भाषा के
व्याकरणिक वाक्यों से युक्त, भाषा व्यवहार के
अधिकाधिक क्षेत्रों से संकलित पाठों का विशाल संग्रह होता है| आज कार्पस का उपयोग
मशीनी अनुवाद के क्षेत्र में व्यापक स्तर पर आधार स्रोत के रूप में किया जा रहा है| ऐसे कार्पस जो एनोटेशन
प्रक्रिया के माध्यम से द्विभाषिक या समानांतर पद्धति से तैयार किए जाते हैं, उनसे मशीनी अनुवाद
प्रणालियां शुद्धता और अनुवाद क्षमता की दृष्टि से और भी बेहतर अनुवाद करने में
सक्षम हो रही हैं| वर्तमान समय में नियम
आधारित मशीनी अनुवाद प्रणालियों की तुलना में कार्पस आधारित मशीनी अनुवाद
प्रणालियाँ अधिक विकसित की जा रही हैं|
सांख्यिकीय मशीनी अनुवाद और उदाहरण आधारित मशीनी अनुवाद में भी कार्पस का प्रयोग
आधार स्रोत के रूप में किया जा रहा है|
एनोटेशन प्रक्रिया के अंतर्गत कार्पस का ‘भाषावैज्ञानिक
विश्लेषण’ किया जाता है, जिससे कार्पस की उपयोगिता और बढ़ जाती है| इसके अंतर्गत
कार्पस में प्रतिरूपों, वाक्यों, पदबंधों एवं शब्दों के साथ अनेक सूचनाओं को
संकेतित कर दिया जाता है, जैसे :
1.शब्दभेद प्रक्रिया के आधार पर कार्पस में आए हुए प्रत्येक
शब्द के शब्दभेद (संज्ञा, विशेषण, क्रिया, कर्ता आदि) को टैग करना|
2.प्रत्येक शब्द रूप के मूल रूप को संकेतित करना|
इसी तरह एनोफोरिक
एनोटेशन, आर्थी एनोटेशन, प्रोसोडिक एनोटेशन तथा प्रोक्तिस्तरीय एनोटेशन के द्वारा
इनसे संबंधित सूचनाओं को संकेतित किया जाता है|
एनोटेशन
अंग्रेजी भाषा में एनोटेशन
<p>This\JJ_DMact\N_NNmay\V_VAUXbe\V_VAUXcalled\
V_VMthe\DM_ARTfatal\JJ_DMaccidents\N_NNact\N_NN
1855\QT_QTO<p>
हिंदी भाषा में एनोटेशन
<p>यह\JJ_DMअधिनियम\N_NNघातक\JJ_DMदुर्घटना\N_NN
अधिनियम\N-NN1855\QT_QTOकहा\V_VMजा\V_VAUXसकेगा\
V_VAUX<p>
शोध का उद्देश्य
प्रस्तुत शोध का उद्देश्य मशीनी अनुवाद के लिए एक समानांतर
अंग्रेजी-हिंदी कार्पस का निर्माण करना है| किसी भी क्षेत्र में समानांतर कार्पस
का निर्माण एक कठिन कार्य है| चूंकि अम्बेडकर जी ने राजनीति, धर्म, दर्शन,
अर्थशास्त्र, विधि, समाजशास्त्र, इतिहास, संस्कृति आदि सभी विषयों पर विस्तार से
लेखन कार्य किया है अत: यदि उनके द्वारा लिखित वाङ्मय का एनोटेटेड समानांतर कार्पस
तैयार किया जाता है तो यह एक बहुउद्देशीय
कार्पस होगा जिसमें भिन्न-भिन्न क्षेत्रों से पाठों को संकलित करके उनका एनोटेशन
किया जाएगा जोकि उन विभिन्न क्षेत्रों में हो रहे शोध कार्यों में मशीन अनुवाद के
दृष्टिकोण से महत्वपूर्ण भूमिका निभाएगा|
प्राक्कल्पना
प्रस्तुत शोध विषय की प्राक्कल्पना के रूप में यह कहा जा सकता
है कि अम्बेडकर वाङ्मय राजनीति, अर्थशास्त्र, दर्शन, धर्म, इतिहास, समाजशास्त्र
आदि विभिन्न क्षेत्रों की भाषाई विशेषताओं को अपने अंदर समेटे हुए हैं तथा जिनका समानांतर स्तर पर
एनोटेशन करना एक चुनौतीपूर्ण कार्य है| क्योंकि प्रत्येक क्षेत्र की भाषा की अपनी
कुछ भाषिक विशेषताएं, पारिभाषिक शब्द होते हैं जो अन्य क्षेत्रों के शब्दों से
भिन्न अर्थ रखते हैं| परंतु यदि यह कार्य सफलतापूर्वक पूर्ण कर लिया जाए तो इन क्षेत्रों
से संबंधित सामग्री का मशीन के माध्यम से शुद्धतापूर्ण अनुवाद आसानी से प्राप्त
किया जा सकेगा, जो इन क्षेत्रों में हो रहे शोध कार्यों में महत्वपूर्ण भूमिका
निभाएगा|
शोध-प्रविधि
प्रस्तुत
शोध कार्य को पूर्ण करने के लिए मुख्य रूप से भाषावैज्ञानिक शोध प्रविधि का प्रयोग
किया जाएगा, जिसमें भाषा विज्ञान द्वारा बनाए गए व्याकरणिक नियमों का विश्लेषण के
लिए प्रयोग किया जाएगा| इसके साथ-साथ संकलनात्मक तथा विश्लेषणात्मक शोध प्रविधि का
भी प्रयोग किया जाएगा|
अध्यायीकरण
प्रस्तुत शोध विषय को निम्नलिखित अध्यायों के माध्यम से पूर्ण
किया जाएगा :-
प्रथम अध्याय: मशीनी अनुवाद में प्राकृतिक
भाषा संसाधन और कार्पस की भूमिका
1.1.मशीनी अनुवाद तथा
प्राकृतिक भाषा संसाधन
1.2.कार्पस:
आवश्यकता, उपयोग और विशेषताएं
1.3.प्राकृतिक भाषा
संसाधन में कार्पस की भूमिका
द्वितीय अध्याय: अम्बेडकर वाङ्मय का भाषिक
विश्लेषण
2.1.अम्बेडकर वाङ्मय:
एक परिचय
2.2.अम्बेडकर वाङ्मय
का भाषाई पक्ष
2.3.अम्बेडकर वाङ्मय
के एनोटेशन का महत्व
तृतीय अध्याय: डाटाबेस मैनेजमेंट सिस्टम तथा
एनोटेशन प्रक्रिया
3.1.संकलित पाठों का
डाटाबेस निर्माण तथा प्रक्रिया
3.2.एनोटेटेड
समानांतर कार्पस निर्माण प्रक्रिया
3.3.संकलित पाठों का
एनोटेटेड समानांतर कार्पस निर्माण
चतुर्थ अध्याय: कार्पस अनुप्रयोग
4.1.अम्बेडकर वाङ्मय
शब्दकोश
4.2.वाक्य आधारित
अनुवाद तंत्र
पंचम अध्याय : निष्कर्ष
संदर्भ-ग्रंथ सूची
1.अम्बेडकर,बी.आर., हिंदुत्व का दर्शन, नई दिल्ली, डॉ. अम्बेडकर प्रतिष्ठान
2.अम्बेडकर,बी.आर., अस्पृश्यता अथवा भारत में बहिष्कृत
बस्तियों के प्राणी, नई दिल्ली, डॉ.
अम्बेडकर प्रतिष्ठान
3.अम्बेडकर,बी.आर., शुद्र कौन थे, नई दिल्ली, डॉ. अम्बेडकर प्रतिष्ठान
4.अम्बेडकर,बी.आर., अछूत कौन थे और वे अछूत कैसे बने, नई
दिल्ली, डॉ. अम्बेडकर प्रतिष्ठान
5.Ambedkar,B.R., Philosophy of Hinduism, http://drambedkarbooks.com/dr-b-r-ambedkar-books/
6.Ambedkar,B.R., Untouchables or The Children of India's Ghetto, http://drambedkarbooks.com/dr-b-r-ambedkar-books/
7.Ambedkar,B.R., Who were the Shudras, http://drambedkarbooks.com/dr-b-r-ambedkar-books/
8.Ambedkar,B.R., The Untouchables-Who were they and why they became, http://drambedkarbooks.com/dr-b-r-ambedkar-books/
9.प्रसाद,धनजी,भारती,रणजीत, और पाण्डेय,प्रवीण कुमार, (2014),
कार्पस भाषाविज्ञान, दिल्ली, प्रिय साहित्य सदन
10.प्रसाद,धनजी, (2011), भाषाविज्ञान का सैद्धांतिक,
अनुप्रयुक्त एवं तकनीकी पक्ष, दिल्ली, प्रिय साहित्य सदन
11.McCarthy,M & O’Keeffe, A.(2010).The routledge
handbook of corpus linguistics(edited).London & Newyork:Routledge
12.Meyar,C.(2002).English corpus
linguistics.Cambridge:Cambridge University Press
13.McGlashan M.(2013).Corpus:Some key
terms(edited).UK.Lancaster University
वासुदेव
शोधार्थी
पीएच .डीअनुवाद प्रौद्योगिकी
सत्र-2014-15
Email:-vasupawar31@gmail.com
संपर्क:9405525931
No comments:
Post a Comment