Monday, February 9, 2015

अम्बेडकर वाङ्मय का एनोटेटेड समानांतर कार्पस निर्माण
(अंग्रेजी-हिंदी के खंड-6,9,13 एवं 14 के विशेष संदर्भ में)
महात्मा गाँधी अंतर्राष्ट्रीय हिंदी विश्वविद्यालय,वर्धा के अनुवाद एवं निर्वाचन विद्यापीठ के अनुवाद प्रौद्योगिकी विभाग में पी-एच.डी . अनुवाद प्रौद्योगिकी उपाधि हेतु प्रस्तुत
शोध विषय प्रस्तुतीकरण 


प्रस्तावना
कार्पस भाषाविज्ञान एक बहुआयामी क्षेत्र है| भाषा अध्ययन के लिए कार्पस का परिचय और अनुप्रयोग भाषाविज्ञान में एक नए आयाम के रूप में शामिल किया गया है| सैद्धांतिक रूप में, कार्पस भाषाविज्ञान एक ऐसा दृष्टिकोण है जिसका उद्देश्य पाठों के नमूनों के बड़े संग्रहों का विश्लेषण करके भाषा और उसके सभी गुणों की जांच करना है| आज यह दृष्टिकोण शोध के विभिन्न क्षेत्रों में प्रयोग किया जा रहा है, जैसे : भाषा का वर्णनात्मक अध्ययन, मशीनी अनुवाद, भाषा शिक्षण और कोश निर्माण आदि| यह मोटे तौर पर वाचिक और लिखित पाठ नमूनों के  विस्तृत प्रामाणिक विश्लेषण को संदर्भित करता है|

  कार्पस मशीनी अनुवाद का एक महत्वपूर्ण तत्व है| कार्पस किसी भाषा के व्याकरणिक वाक्यों से युक्त, भाषा व्यवहार के अधिकाधिक क्षेत्रों से संकलित पाठों का विशाल संग्रह होता है| आज कार्पस का उपयोग मशीनी अनुवाद के क्षेत्र में व्यापक स्तर पर आधार स्रोत के रूप में किया जा रहा है| ऐसे कार्पस जो एनोटेशन प्रक्रिया के माध्यम से द्विभाषिक या समानांतर पद्धति से तैयार किए जाते हैं, उनसे मशीनी अनुवाद प्रणालियां शुद्धता और अनुवाद क्षमता की दृष्टि से और भी बेहतर अनुवाद करने में सक्षम हो रही हैं| वर्तमान समय में नियम आधारित मशीनी अनुवाद प्रणालियों की तुलना में कार्पस आधारित मशीनी अनुवाद प्रणालियाँ अधिक विकसित की जा रही हैं| सांख्यिकीय मशीनी अनुवाद और उदाहरण आधारित मशीनी अनुवाद में भी कार्पस का प्रयोग आधार स्रोत के रूप में किया जा रहा है|
एनोटेशन प्रक्रिया के अंतर्गत कार्पस का ‘भाषावैज्ञानिक विश्लेषण’ किया जाता है, जिससे कार्पस की उपयोगिता और बढ़ जाती है| इसके अंतर्गत कार्पस में प्रतिरूपों, वाक्यों, पदबंधों एवं शब्दों के साथ अनेक सूचनाओं को संकेतित कर दिया जाता है, जैसे :
1.शब्दभेद प्रक्रिया के आधार पर कार्पस में आए हुए प्रत्येक शब्द के शब्दभेद (संज्ञा, विशेषण, क्रिया, कर्ता आदि) को टैग करना|
2.प्रत्येक शब्द रूप के मूल रूप को संकेतित करना|
  इसी तरह एनोफोरिक एनोटेशन, आर्थी एनोटेशन, प्रोसोडिक एनोटेशन तथा प्रोक्तिस्तरीय एनोटेशन के द्वारा इनसे संबंधित सूचनाओं को संकेतित किया जाता है|
एनोटेशन
अंग्रेजी भाषा में एनोटेशन
<p>This\JJ_DMact\N_NNmay\V_VAUXbe\V_VAUXcalled\
V_VMthe\DM_ARTfatal\JJ_DMaccidents\N_NNact\N_NN
1855\QT_QTO<p>
हिंदी भाषा में एनोटेशन
<p>यह\JJ_DMअधिनियम\N_NNघातक\JJ_DMदुर्घटना\N_NN अधिनियम\N-NN1855\QT_QTOकहा\V_VMजा\V_VAUXसकेगा\
V_VAUX<p> 
शोध का उद्देश्य
प्रस्तुत शोध का उद्देश्य मशीनी अनुवाद के लिए एक समानांतर अंग्रेजी-हिंदी कार्पस का निर्माण करना है| किसी भी क्षेत्र में समानांतर कार्पस का निर्माण एक कठिन कार्य है| चूंकि अम्बेडकर जी ने राजनीति, धर्म, दर्शन, अर्थशास्त्र, विधि, समाजशास्त्र, इतिहास, संस्कृति आदि सभी विषयों पर विस्तार से लेखन कार्य किया है अत: यदि उनके द्वारा लिखित वाङ्मय का एनोटेटेड समानांतर कार्पस तैयार किया जाता है  तो यह एक बहुउद्देशीय कार्पस होगा जिसमें भिन्न-भिन्न क्षेत्रों से पाठों को संकलित करके उनका एनोटेशन किया जाएगा जोकि उन विभिन्न क्षेत्रों में हो रहे शोध कार्यों में मशीन अनुवाद के दृष्टिकोण से महत्वपूर्ण भूमिका निभाएगा| 
प्राक्कल्पना
प्रस्तुत शोध विषय की प्राक्कल्पना के रूप में यह कहा जा सकता है कि अम्बेडकर वाङ्मय राजनीति, अर्थशास्त्र, दर्शन, धर्म, इतिहास, समाजशास्त्र आदि विभिन्न क्षेत्रों की भाषाई विशेषताओं को अपने अंदर समेटे हुए हैं तथा जिनका समानांतर स्तर पर एनोटेशन करना एक चुनौतीपूर्ण कार्य है| क्योंकि प्रत्येक क्षेत्र की भाषा की अपनी कुछ भाषिक विशेषताएं, पारिभाषिक शब्द होते हैं जो अन्य क्षेत्रों के शब्दों से भिन्न अर्थ रखते हैं| परंतु यदि यह कार्य सफलतापूर्वक पूर्ण कर लिया जाए तो इन क्षेत्रों से संबंधित सामग्री का मशीन के माध्यम से शुद्धतापूर्ण अनुवाद आसानी से प्राप्त किया जा सकेगा, जो इन क्षेत्रों में हो रहे शोध कार्यों में महत्वपूर्ण भूमिका निभाएगा| 
शोध-प्रविधि
प्रस्तुत शोध कार्य को पूर्ण करने के लिए मुख्य रूप से भाषावैज्ञानिक शोध प्रविधि का प्रयोग किया जाएगा, जिसमें भाषा विज्ञान द्वारा बनाए गए व्याकरणिक नियमों का विश्लेषण के लिए प्रयोग किया जाएगा| इसके साथ-साथ संकलनात्मक तथा विश्लेषणात्मक शोध प्रविधि का भी प्रयोग किया जाएगा|
अध्यायीकरण
प्रस्तुत शोध विषय को निम्नलिखित अध्यायों के माध्यम से पूर्ण किया जाएगा :-
प्रथम अध्याय: मशीनी अनुवाद में प्राकृतिक भाषा संसाधन और कार्पस की भूमिका 
  1.1.मशीनी अनुवाद तथा प्राकृतिक भाषा संसाधन   
  1.2.कार्पस: आवश्यकता, उपयोग और विशेषताएं
  1.3.प्राकृतिक भाषा संसाधन में कार्पस की भूमिका     
द्वितीय अध्याय: अम्बेडकर वाङ्मय का भाषिक विश्लेषण
  2.1.अम्बेडकर वाङ्मय: एक परिचय  
  2.2.अम्बेडकर वाङ्मय का भाषाई पक्ष  
  2.3.अम्बेडकर वाङ्मय के एनोटेशन का महत्व  
तृतीय अध्याय: डाटाबेस मैनेजमेंट सिस्टम तथा एनोटेशन प्रक्रिया 
  3.1.संकलित पाठों का डाटाबेस निर्माण तथा प्रक्रिया
  3.2.एनोटेटेड समानांतर कार्पस निर्माण प्रक्रिया
  3.3.संकलित पाठों का एनोटेटेड समानांतर कार्पस निर्माण    
चतुर्थ अध्याय: कार्पस अनुप्रयोग
  4.1.अम्बेडकर वाङ्मय शब्दकोश
  4.2.वाक्य आधारित अनुवाद तंत्र
पंचम अध्याय : निष्कर्ष 
संदर्भ-ग्रंथ सूची
1.अम्बेडकर,बी.आर., हिंदुत्व का दर्शन, नई दिल्ली, डॉ. अम्बेडकर प्रतिष्ठान
2.अम्बेडकर,बी.आर., अस्पृश्यता अथवा भारत में बहिष्कृत बस्तियों के प्राणी, नई दिल्ली, डॉ. अम्बेडकर प्रतिष्ठान 
3.अम्बेडकर,बी.आर., शुद्र कौन थे, नई दिल्ली, डॉ. अम्बेडकर प्रतिष्ठान
4.अम्बेडकर,बी.आर., अछूत कौन थे और वे अछूत कैसे बने, नई दिल्ली, डॉ. अम्बेडकर प्रतिष्ठान
5.Ambedkar,B.R., Philosophy of Hinduism, http://drambedkarbooks.com/dr-b-r-ambedkar-books/
6.Ambedkar,B.R., Untouchables or The Children of India's Ghetto, http://drambedkarbooks.com/dr-b-r-ambedkar-books/
7.Ambedkar,B.R., Who were the Shudras, http://drambedkarbooks.com/dr-b-r-ambedkar-books/
8.Ambedkar,B.R., The Untouchables-Who were they and why they became, http://drambedkarbooks.com/dr-b-r-ambedkar-books/ 
9.प्रसाद,धनजी,भारती,रणजीत, और पाण्डेय,प्रवीण कुमार, (2014), कार्पस भाषाविज्ञान, दिल्ली, प्रिय साहित्य सदन
10.प्रसाद,धनजी, (2011), भाषाविज्ञान का सैद्धांतिक, अनुप्रयुक्त एवं तकनीकी पक्ष, दिल्ली, प्रिय साहित्य सदन
11.McCarthy,M & O’Keeffe, A.(2010).The routledge handbook of corpus linguistics(edited).London & Newyork:Routledge
12.Meyar,C.(2002).English corpus linguistics.Cambridge:Cambridge University Press
13.McGlashan M.(2013).Corpus:Some key terms(edited).UK.Lancaster University 
                                                                                                            वासुदेव 
                                                                                                   शोधार्थी
                                                                                             पीएच .डीअनुवाद प्रौद्योगिकी
                                             सत्र-2014-15
                                                                                                                  Email:-vasupawar31@gmail.com 
                                                                                            संपर्क:9405525931

No comments:

Post a Comment