স্বয়ংক্রিয় সংক্ষিপ্তকরণ
কোন দীর্ঘ নথি থেকে মূল বিষয় সফটওয়্যারের মাধ্যমে তুলে নিয়ে সারাংশ তৈরির প্রক্রিয়াকে স্বয়ংক্রিয় সংক্ষিপ্তকরণ বলে। মূলত লেখার দৈর্ঘ্য, লেখার শৈলী এবং শব্দবিন্যাস ব্যবহার করে প্রযুক্তি একটি সুসংগত সারাংশ তৈরি করে।
স্বয়ংক্রিয় তথ্য সংক্ষিপ্তকরণ হলো মেশিন লার্নিং এবং ডেটা মাইনিং এর অংশ। সংক্ষিপ্তকরণের মূল পদ্ধতি হলো কোন পূর্ণ সেট থেকে তার উপসেট বের করা, যে উপসেট পুরো সেটের তথ্য প্রকাশ করে। বর্তমানে সারা বিশ্বের সকল শিল্পে এই পদ্ধতি ব্যবহার করা হচ্ছে। উদাহরণস্বরূপ বলা যায় সার্জ ইঞ্জিন;
নথি সংক্ষিপ্তকরণ হলো কোন দীর্ঘ নথি থেকে মূল ও গুরুত্বপূর্ণ বাক্য নিয়ে সারাংশ তৈরির প্রক্রিয়া।[১]
প্রকারভেদ
[সম্পাদনা]উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ
[সম্পাদনা]পূর্ণ সংগ্রহ থেকে বস্তুকে কোন প্রকার পরিবর্তন ছাড়াই সরাসরি স্বয়ংক্রিয়ভাবে তুলে নিয়ে আশার প্রক্রিয়াকে উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ বলে। যেমন কোন নথিকে সংক্ষিপ্ত করার জন্য সেই নথির মূল বাক্যগুলিকে কোন প্রকার সম্পাদন ছাড়াই সরাসরি তুলে নিয়ে সারাংশ তৈরি করা হলো উৎপাটন প্রক্রিয়া।
বিমূর্তন ভিত্তিক সংক্ষিপ্তকরণ
[সম্পাদনা]বিমূর্তন ভিত্তিক সারসংক্ষেপ সরাসরি কোন বস্তু কিংবা বাক্যকে উৎপাটন না করে সেগুলোর মূলভাব বা শব্দান্তরিত ভাব নিয়ে সারাংশ গঠন করে। মূলত উৎপাটন প্রক্রিয়ার চেয়ে বিমূর্তন প্রক্রিয়া অনেক শক্তিশালী কিন্তু এটিকে তৈরি করা অনেক কঠিন একটি বিষয়। কারণ এখানে নতুন শব্দ উৎপাদন বিষয়টি কাজ করে। যেটি প্রাকৃতিক ভাষা উৎপাদন প্রক্রিয়ার অংশ। যদিও কিছু কাজ বিমূর্তন ভিত্তিক সারসংক্ষেপে করা হয়েছে কিন্তু বেশির ভাগ কাজই উৎপাটন প্রক্রিয়ায় করা।
সংক্ষিপ্তকরণ পদ্ধতি ও প্রয়োগ
[সম্পাদনা]সংক্ষিপ্তকরণের একটি উদাহরণ হলো নথি সংক্ষিপ্তকরণ, যেটি সংক্রিয়ভাবে কোন নথি থেকে সারাংশ উৎপন্ন করে। কেউ হয়তো একক কোন নথির সারাংশ বের করতে পারেন কিংবা অনেকগুলো নথির। অনেকগুলো নথির সারসংক্ষেপ বের করার পদ্ধতিকে বলে 'বহু নথি সংক্ষিপ্তকরণ'। এটির একটি উৎকৃষ্ট প্রয়োগ হলো সংবাদ প্রবন্ধ সংক্ষিপ্তকরণ। এমন একটি পদ্ধতি চিন্তা করুণ যেটি স্বয়ংক্রিয় ভাবে একটি বিষয়ের উপর সংবাদ প্রবন্ধ সংগ্রহ করবে (ওয়েব থেকে) এবং সেগুলোর সারসংক্ষেপ প্রদান করবে।
চিত্র সংগ্রহ করা স্বয়ংক্রিয় সংক্ষিপ্তকরণের আরেকটি প্রয়োগিক দিক। এটি মূলত অনেকগুলো চিত্র থেকে মূল চিত্রগুলো বের করে নিয়ে আসে।[২] একইভাবে আরেকটি প্রয়োগ হলো ভিডিও সংক্ষিপ্তকরণ, যেখানে সিস্টেম স্বয়ংক্রিয়ভাবে দীর্ঘ কোন সিনেমার ট্রেলার(trailer) তৈরি করতে পারে।
তথ্যসূত্র
[সম্পাদনা]- ↑ Sankar K. Pal; Alfredo Petrosino (২৫ জানুয়ারি ২০১২)। Handbook on Soft Computing for Video Surveillance। CRC Press। পৃষ্ঠা 81–। আইএসবিএন 978-1-4398-5685-7।
- ↑ Jorge E. Camargo and Fabio A. González. A Multi-class Kernel Alignment Method for Image Collection Summarization. In Proceedings of the 14th Iberoamerican Conference on Pattern Recognition: Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications (CIARP '09), Eduardo Bayro-Corrochano and Jan-Olof Eklundh (Eds.). Springer-Verlag, Berlin, Heidelberg, 545-552. ডিওআই:10.1007/978-3-642-10268-4_64
আরও পড়া
[সম্পাদনা]- Hercules, Dalianis (২০০৩)। Porting and evaluation of automatic summarization।
- Roxana, Angheluta (২০০২)। The Use of Topic Segmentation for Automatic Summarization।
- Anne, Buist (২০০৪)। Automatic Summarization of Meeting Data: A Feasibility Study (পিডিএফ)। ৩ অক্টোবর ২০১৮ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ১ মে ২০১৯।
- Annie, Louis (২০০৯)। Performance Confidence Estimation for Automatic Summarization।
- Elena, Lloret and Manuel, Palomar (২০০৯)। Challenging Issues of Automatic Summarization: Relevance Detection and Quality-based Evaluation। ৩ অক্টোবর ২০১৮ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ১ মে ২০১৯।
- Andrew, Goldberg (২০০৭)। Automatic Summarization।
- Alrehamy, Hassan (২০১৭)। "SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation"। Automatic Keyphrases Extraction। Advances in Intelligent Systems and Computing। পৃষ্ঠা 222–235। আইএসবিএন 978-3-319-66938-0। ডিওআই:10.1007/978-3-319-66939-7_19। Alrehamy, Hassan (২০১৭)। "SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation"। Automatic Keyphrases Extraction। Advances in Intelligent Systems and Computing। পৃষ্ঠা 222–235। আইএসবিএন 978-3-319-66938-0। ডিওআই:10.1007/978-3-319-66939-7_19। Alrehamy, Hassan (২০১৭)। "SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation"। Automatic Keyphrases Extraction। Advances in Intelligent Systems and Computing। পৃষ্ঠা 222–235। আইএসবিএন 978-3-319-66938-0। ডিওআই:10.1007/978-3-319-66939-7_19।
- Endres-Niggemeyer, Brigitte (১৯৯৮)। Summarizing Information। আইএসবিএন 978-3-540-63735-6। Endres-Niggemeyer, Brigitte (১৯৯৮)। Summarizing Information। আইএসবিএন 978-3-540-63735-6। Endres-Niggemeyer, Brigitte (১৯৯৮)। Summarizing Information। আইএসবিএন 978-3-540-63735-6।
- Marcu, Daniel (২০০০)। The Theory and Practice of Discourse Parsing and Summarization। আইএসবিএন 978-0-262-13372-2। Marcu, Daniel (২০০০)। The Theory and Practice of Discourse Parsing and Summarization। আইএসবিএন 978-0-262-13372-2। Marcu, Daniel (২০০০)। The Theory and Practice of Discourse Parsing and Summarization। আইএসবিএন 978-0-262-13372-2।
- Mani, Inderjeet (২০০১)। Automatic Summarization। আইএসবিএন 978-1-58811-060-2। Mani, Inderjeet (২০০১)। Automatic Summarization। আইএসবিএন 978-1-58811-060-2। Mani, Inderjeet (২০০১)। Automatic Summarization। আইএসবিএন 978-1-58811-060-2।
- Huff, Jason (২০১০)। AutoSummarize। Huff, Jason (২০১০)। AutoSummarize। মাইক্রোসফ্ট ওয়ার্ড 2008 এ স্বয়ংক্রিয় সারসংক্ষেপ ব্যবহার করে ধারণাগত আর্টওয়ার্ক।
- Lehmam, Abderrafih (২০১০)। Essential summarizer: innovative automatic text summarization software in twenty languages - ACM Digital Library। Riao '10। পৃষ্ঠা 216–217। Lehmam, Abderrafih (২০১০)। Essential summarizer: innovative automatic text summarization software in twenty languages - ACM Digital Library। Riao '10। পৃষ্ঠা 216–217। Lehmam, Abderrafih (২০১০)। Essential summarizer: innovative automatic text summarization software in twenty languages - ACM Digital Library। Riao '10। পৃষ্ঠা 216–217।, প্রকাশিত RIAO'10 অ্যাডাপ্টিভিটি, ব্যক্তিগতকরণ এবং বৈষম্যমূলক তথ্যের সংশ্লেষণ, সিআইডি প্যারিস, ফ্রান্সে প্রকাশিত
- Xiaojin, Zhu, Andrew Goldberg, Jurgen Van Gael, and David Andrzejewski (২০০৭)। Improving diversity in ranking using absorbing random walks (পিডিএফ)। Xiaojin, Zhu, Andrew Goldberg, Jurgen Van Gael, and David Andrzejewski (২০০৭)। Improving diversity in ranking using absorbing random walks (পিডিএফ)।, GRASSHOPPER অ্যালগরিদম
- Miranda-Jiménez, Sabino, Gelbukh, Alexander, and Sidorov, Grigori (২০১৩)। "Summarizing Conceptual Graphs for Automatic Summarization Task"। Conceptual Structures for STEM Research and Education। Lecture Notes in Computer Science। পৃষ্ঠা 245–253। আইএসবিএন 978-3-642-35785-5। ডিওআই:10.1007/978-3-642-35786-2_18। Miranda-Jiménez, Sabino, Gelbukh, Alexander, and Sidorov, Grigori (২০১৩)। "Summarizing Conceptual Graphs for Automatic Summarization Task"। Conceptual Structures for STEM Research and Education। Lecture Notes in Computer Science। পৃষ্ঠা 245–253। আইএসবিএন 978-3-642-35785-5। ডিওআই:10.1007/978-3-642-35786-2_18। Miranda-Jiménez, Sabino, Gelbukh, Alexander, and Sidorov, Grigori (২০১৩)। "Summarizing Conceptual Graphs for Automatic Summarization Task"। Conceptual Structures for STEM Research and Education। Lecture Notes in Computer Science। পৃষ্ঠা 245–253। আইএসবিএন 978-3-642-35785-5। ডিওআই:10.1007/978-3-642-35786-2_18। Miranda-Jiménez, Sabino, Gelbukh, Alexander, and Sidorov, Grigori (২০১৩)। "Summarizing Conceptual Graphs for Automatic Summarization Task"। Conceptual Structures for STEM Research and Education। Lecture Notes in Computer Science। পৃষ্ঠা 245–253। আইএসবিএন 978-3-642-35785-5। ডিওআই:10.1007/978-3-642-35786-2_18। Miranda-Jiménez, Sabino, Gelbukh, Alexander, and Sidorov, Grigori (২০১৩)। "Summarizing Conceptual Graphs for Automatic Summarization Task"। Conceptual Structures for STEM Research and Education। Lecture Notes in Computer Science। পৃষ্ঠা 245–253। আইএসবিএন 978-3-642-35785-5। ডিওআই:10.1007/978-3-642-35786-2_18। Miranda-Jiménez, Sabino, Gelbukh, Alexander, and Sidorov, Grigori (২০১৩)। "Summarizing Conceptual Graphs for Automatic Summarization Task"। Conceptual Structures for STEM Research and Education। Lecture Notes in Computer Science। পৃষ্ঠা 245–253। আইএসবিএন 978-3-642-35785-5। ডিওআই:10.1007/978-3-642-35786-2_18। Miranda-Jiménez, Sabino, Gelbukh, Alexander, and Sidorov, Grigori (২০১৩)। "Summarizing Conceptual Graphs for Automatic Summarization Task"। Conceptual Structures for STEM Research and Education। Lecture Notes in Computer Science। পৃষ্ঠা 245–253। আইএসবিএন 978-3-642-35785-5। ডিওআই:10.1007/978-3-642-35786-2_18।, গবেষণা এবং শিক্ষা জন্য ধারণাগত কাঠামো।