শব্দার্থের দ্ব্যর্থকতা নিরসন

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
(শব্দার্থে দ্ব্যর্থতা নিরসন থেকে পুনর্নির্দেশিত)

শব্দার্থের দ্ব্যর্থকতা নিরসন বলতে কোনও বাক্যে বা কোনও ভাষিক প্রতিবেশে কোনও শব্দের কোন্‌ অর্থটি বোঝানো হয়েছে, সেটি নির্ণয় করার প্রক্রিয়াকে বোঝায়।[১] মানব মস্তিষ্কে ভাষার প্রক্রিয়াজাতকরণ ও সংজ্ঞানের ক্ষেত্রে এই প্রক্রিয়াটি অবচেতনভাবে ও স্বয়ংক্রিয়ভাবে ঘটে থাকে, তবে মানুষের কথ্য যেকোনও স্বাভাবিক ভাষাতেই বহু-অর্থকতা ব্যাপকভাবে বিদ্যমান, তাই যখন বহু-অর্থকতা তথা দ্ব্যর্থকতার কারণে ভাষিক যোগাযোগে অস্পষ্টতার সৃষ্টি হয়, তখন এই প্রক্রিয়াটির ব্যাপারে মানুষ সচেতন ও মনোযোগী হয়ে ওঠে। শব্দার্থের দ্ব্যর্থকতা নিরসন পরিগণনামূলক ভাষাবিজ্ঞানের একটি উন্মুক্ত সমস্যা যা পরিগণক-সংশ্লিষ্ট লিখন যেমন অধিবাচন, অনুসন্ধান ইঞ্জিনের ফলাফলের প্রাসঙ্গিকতার উন্নতিসাধন, পূর্বগনির্দেশ মীমাংসা (Anaphora resolution), অর্থসঙ্গতি (Coherence) ও উপপত্তি (Inference), ইত্যাদির উপর প্রভাব ফেলে।

যেহেতু স্বাভাবিক ভাষাতে মানুষের মস্তিষ্কের জৈবিক স্নায়বিক জালতন্ত্রের প্রদত্ত সামর্থ্যের দ্বারা আকৃতিপ্রাপ্ত স্নায়বিক বাস্তবতার প্রতিফলন ঘটে, তাই পরিগণক যন্ত্র তথা কম্পিউটার দিয়ে কীভাবে স্বাভাবিক ভাষা প্রক্রিয়াজাতকরণ ও যান্ত্রিক শিখন সম্পাদন করানো যায়, সে ব্যাপারটি পরিগণক বিজ্ঞান তথা কম্পিউটার বিজ্ঞানের একটি দীর্ঘমেয়াদী সমস্যা। এ সংক্রান্ত বহুসংখ্যক কৌশলের উপরে গবেষণা সম্পাদন করা হয়েছে। এর মধ্যে আছে অভিধান-ভিত্তিক পদ্ধতি যেগুলিতে আভিধানিক সম্পদসমূহে সংকেতায়িত জ্ঞান ব্যবহার করা হয়। আরও আছে পর্যবেক্ষণাধীন যান্ত্রিক শিখন পদ্ধতিসমূহ, যেগুলিতে একটি শ্রেণীবদ্ধকারককে একটি মানুষ দ্বারা শব্দার্থ সংক্রান্ত টীকাটিপ্পনিবিশিষ্ট ভাষাদেহ বা কর্পাসের প্রতিটি স্বতন্ত্র শব্দের উপরে প্রশিক্ষণ দেওয়া হয়। তৃতীয় পদ্ধতিটি হল সম্পূর্ণরূপে পর্যবেক্ষণবিহীন পদ্ধতিসমূহ, যেগুলিতে একসাথে উৎপন্ন শব্দের গুচ্ছগুলি উদ্ঘাটন করে এবং এভাবে শব্দার্থ বের করে। এই তিন পদ্ধতির মধ্যে পর্যবেক্ষণাধীন শিখন পদ্ধতিগুলি অদ্যাবধি সবচেয়ে সফল কলনবিধি বা অ্যালগোরিদম।

বর্তমান কলনবিধি বা অ্যালগোরিদমগুলির সঠিকতা কতটুকু, তা নির্ণয় করা কঠিন। ইংরেজি ভাষার ক্ষেত্রে শব্দার্থের মোটা-দানা স্তরে (Coarse-grained level) অর্থাৎ সমলেখ (homograph) স্তরে সঠিকতা নিয়মিত ৯০%-এর বেশি হয় (২০০৯ সালের তথ্য অনুযায়ী)। এমনকি কিছু নির্দিষ্ট সমলেখের উপরে প্রযুক্ত কিছু পদ্ধতির সঠিকতা ৯৬%-এরও বেশি হতে পারে। অন্যদিকে শব্দার্থের তথাকথিত "মিহি দানা স্তরে" অর্থাৎ সূক্ষ্ম অর্থবিভেদের ক্ষেত্রে সর্বোচ্চ সঠিকতা ৫৯% থেকে ৬৯% (সেম-ইভ্যাল২০০৭ ও সেন্স-ইভ্যাল-২)

তথ্যসূত্র[সম্পাদনা]

  1. Dan Jurafsky; James H. Martin (২০০৯), Speech and Language Processing, Prentice Hall, পৃষ্ঠা 650