স্বয়ংক্রিয় সংক্ষিপ্তকরণ: সংশোধিত সংস্করণের মধ্যে পার্থক্য

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
বিষয়বস্তু বিয়োগ হয়েছে বিষয়বস্তু যোগ হয়েছে
সাগর সরকার (আলোচনা | অবদান)
"Automatic summarization" পাতাটি অনুবাদ করে তৈরি করা হয়েছে
সাগর সরকার (আলোচনা | অবদান)
"Automatic summarization" পাতাটি অনুবাদ করে তৈরি করা হয়েছে
১৪ নং লাইন: ১৪ নং লাইন:
বিমূর্তন ভিত্তিক সারসংক্ষেপ সরাসরি কোন বস্তু কিংবা বাক্যকে উৎপাটন না করে সেগুলোর মূলভাব বা শব্দান্তরিত ভাব নিয়ে সারাংশ গঠন করে। মূলত উৎপাটন প্রক্রিয়ার চেয়ে বিমূর্তন প্রক্রিয়া অনেক শক্তিশালী কিন্তু এটিকে তৈরি করা অনেক কঠিন একটি বিষয়। কারণ এখানে নতুন শব্দ উৎপাদন বিষয়টি কাজ করে। যেটি [[প্রাকৃতিক ভাষা উৎপাদন]] প্রক্রিয়ার অংশ।
বিমূর্তন ভিত্তিক সারসংক্ষেপ সরাসরি কোন বস্তু কিংবা বাক্যকে উৎপাটন না করে সেগুলোর মূলভাব বা শব্দান্তরিত ভাব নিয়ে সারাংশ গঠন করে। মূলত উৎপাটন প্রক্রিয়ার চেয়ে বিমূর্তন প্রক্রিয়া অনেক শক্তিশালী কিন্তু এটিকে তৈরি করা অনেক কঠিন একটি বিষয়। কারণ এখানে নতুন শব্দ উৎপাদন বিষয়টি কাজ করে। যেটি [[প্রাকৃতিক ভাষা উৎপাদন]] প্রক্রিয়ার অংশ।


যদিও কিছু কাজ বিমূর্তন ভিত্তিক সারসংক্ষেপে করা হয়েছে কিন্তু বেশির ভাগ কাজই উৎপাটন প্রক্রিয়ায় করা।
যদিও কিছু কাজ বিমূর্তন ভিত্তিক সারসংক্ষেপে করা হয়েছে কিন্তু বেশির ভাগ কাজই উৎপাটন প্রক্রিয়ায় করা।

== সংক্ষিপ্তকরণ পদ্ধতি ও প্রয়োগ ==

সংক্ষিপ্তকরণের একটি উদাহরণ হলো নথি সংক্ষিপ্তকরণ, যেটি সংক্রিয়ভাবে কোন নথি থেকে সারাংশ উৎপন্ন করে। কেউ হয়তো একক কোন নথির সারাংশ বের করতে পারেন কিংবা অনেকগুলো নথির। অনেকগুলো নথির সারসংক্ষেপ বের করার পদ্ধতিকে বলে 'বহু নথি সংক্ষিপ্তকরণ'। এটির একটি উৎকৃষ্ট প্রয়োগ হলো সংবাদ প্রবন্ধ সংক্ষিপ্তকরণ। এমন একটি পদ্ধতি চিন্তা করুণ যেটি স্বয়ংক্রিয় ভাবে একটি বিষয়ের উপর সংবাদ প্রবন্ধ সংগ্রহ করবে (ওয়েব থেকে) এবং সেগুলোর সারসংক্ষেপ প্রদান করবে।

চিত্র সংগ্রহ করা স্বয়ংক্রিয় সংক্ষিপ্তকরণের আরেকটি প্রয়োগিক দিক। এটি মূলত অনেকগুলো চিত্র থেকে মূল চিত্রগুলো বের করে নিয়ে আসে।<ref>Jorge E. Camargo and Fabio A. González. A Multi-class Kernel Alignment Method for Image Collection Summarization. In Proceedings of the 14th Iberoamerican Conference on Pattern Recognition: Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications (CIARP '09), Eduardo Bayro-Corrochano and Jan-Olof Eklundh (Eds.). Springer-Verlag, Berlin, Heidelberg, 545-552. {{Doi|10.1007/978-3-642-10268-4_64}}</ref> একইভাবে আরেকটি প্রয়োগ হলো ভিডিও সংক্ষিপ্তকরণ, যেখানে সিস্টেম স্বয়ংক্রিয়ভাবে দীর্ঘ কোন সিনেমার ট্রেলার(trailer) তৈরি করতে পারে।





০৯:০৪, ১ মে ২০১৯ তারিখে সংশোধিত সংস্করণ

কোন দীর্ঘ নথি থেকে মূল বিষয় সফটওয়্যারের মাধ্যমে তুলে নিয়ে সারাংশ তৈরির প্রক্রিয়াকে স্বয়ংক্রিয় সংক্ষিপ্তকরণ বলে। মূলত লেখার দৈর্ঘ্য, লেখার শৈলী এবং শব্দবিন্যাস ব্যবহার করে প্রযুক্তি একটি সুসংগত সারাংশ তৈরি করে।

স্বয়ংক্রিয় তথ্য সংক্ষিপ্তকরণ হলো মেশিন লার্নিং এবং ডেটা মাইনিং এর অংশ। সংক্ষিপ্তকরণের মূল পদ্ধতি হলো কোন পূর্ণ সেট থেকে তার উপসেট বের করা, যে উপসেট পুরো সেটের তথ্য প্রকাশ করে। বর্তমানে সারা বিশ্বের সকল শিল্পে এই পদ্ধতি ব্যবহার করা হচ্ছে। উদাহরণস্বরূপ বলা যায় সার্জ ইঞ্জিন;

নথি সংক্ষিপ্তকরণ হলো কোন দীর্ঘ নথি থেকে মূল ও গুরুত্বপূর্ণ বাক্য নিয়ে সারাংশ তৈরির প্রক্রিয়া।[১]

প্রকারভেদ

উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ

পূর্ণ সংগ্রহ থেকে বস্তুকে কোন প্রকার পরিবর্তন ছাড়াই সরাসরি স্বয়ংক্রিয়ভাবে তুলে নিয়ে আশার প্রক্রিয়াকে উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ বলে। যেমন কোন নথিকে সংক্ষিপ্ত করার জন্য সেই নথির মূল বাক্যগুলিকে কোন প্রকার সম্পাদন ছাড়াই সরাসরি তুলে নিয়ে সারাংশ তৈরি করা হলো উৎপাটন প্রক্রিয়া।

বিমূর্তন ভিত্তিক সংক্ষিপ্তকরণ

বিমূর্তন ভিত্তিক সারসংক্ষেপ সরাসরি কোন বস্তু কিংবা বাক্যকে উৎপাটন না করে সেগুলোর মূলভাব বা শব্দান্তরিত ভাব নিয়ে সারাংশ গঠন করে। মূলত উৎপাটন প্রক্রিয়ার চেয়ে বিমূর্তন প্রক্রিয়া অনেক শক্তিশালী কিন্তু এটিকে তৈরি করা অনেক কঠিন একটি বিষয়। কারণ এখানে নতুন শব্দ উৎপাদন বিষয়টি কাজ করে। যেটি প্রাকৃতিক ভাষা উৎপাদন প্রক্রিয়ার অংশ।

যদিও কিছু কাজ বিমূর্তন ভিত্তিক সারসংক্ষেপে করা হয়েছে কিন্তু বেশির ভাগ কাজই উৎপাটন প্রক্রিয়ায় করা।

সংক্ষিপ্তকরণ পদ্ধতি ও প্রয়োগ

সংক্ষিপ্তকরণের একটি উদাহরণ হলো নথি সংক্ষিপ্তকরণ, যেটি সংক্রিয়ভাবে কোন নথি থেকে সারাংশ উৎপন্ন করে। কেউ হয়তো একক কোন নথির সারাংশ বের করতে পারেন কিংবা অনেকগুলো নথির। অনেকগুলো নথির সারসংক্ষেপ বের করার পদ্ধতিকে বলে 'বহু নথি সংক্ষিপ্তকরণ'। এটির একটি উৎকৃষ্ট প্রয়োগ হলো সংবাদ প্রবন্ধ সংক্ষিপ্তকরণ। এমন একটি পদ্ধতি চিন্তা করুণ যেটি স্বয়ংক্রিয় ভাবে একটি বিষয়ের উপর সংবাদ প্রবন্ধ সংগ্রহ করবে (ওয়েব থেকে) এবং সেগুলোর সারসংক্ষেপ প্রদান করবে।

চিত্র সংগ্রহ করা স্বয়ংক্রিয় সংক্ষিপ্তকরণের আরেকটি প্রয়োগিক দিক। এটি মূলত অনেকগুলো চিত্র থেকে মূল চিত্রগুলো বের করে নিয়ে আসে।[২] একইভাবে আরেকটি প্রয়োগ হলো ভিডিও সংক্ষিপ্তকরণ, যেখানে সিস্টেম স্বয়ংক্রিয়ভাবে দীর্ঘ কোন সিনেমার ট্রেলার(trailer) তৈরি করতে পারে।

  1. Sankar K. Pal; Alfredo Petrosino (২৫ জানুয়ারি ২০১২)। Handbook on Soft Computing for Video Surveillance। CRC Press। পৃষ্ঠা 81–। আইএসবিএন 978-1-4398-5685-7 
  2. Jorge E. Camargo and Fabio A. González. A Multi-class Kernel Alignment Method for Image Collection Summarization. In Proceedings of the 14th Iberoamerican Conference on Pattern Recognition: Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications (CIARP '09), Eduardo Bayro-Corrochano and Jan-Olof Eklundh (Eds.). Springer-Verlag, Berlin, Heidelberg, 545-552. ডিওআই:10.1007/978-3-642-10268-4_64