স্বয়ংক্রিয় সংক্ষিপ্তকরণ

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
পরিভ্রমণে ঝাঁপ দিন অনুসন্ধানে ঝাঁপ দিন

কোন দীর্ঘ নথি থেকে মূল বিষয় সফটওয়্যারের মাধ্যমে তুলে নিয়ে সারাংশ তৈরির প্রক্রিয়াকে স্বয়ংক্রিয় সংক্ষিপ্তকরণ বলে। মূলত লেখার দৈর্ঘ্য, লেখার শৈলী এবং শব্দবিন্যাস ব্যবহার করে প্রযুক্তি একটি সুসংগত সারাংশ তৈরি করে।

স্বয়ংক্রিয় তথ্য সংক্ষিপ্তকরণ হলো মেশিন লার্নিং এবং ডেটা মাইনিং এর অংশ। সংক্ষিপ্তকরণের মূল পদ্ধতি হলো কোন পূর্ণ সেট থেকে তার উপসেট বের করা, যে উপসেট পুরো সেটের তথ্য প্রকাশ করে। বর্তমানে সারা বিশ্বের সকল শিল্পে এই পদ্ধতি ব্যবহার করা হচ্ছে। উদাহরণস্বরূপ বলা যায় সার্জ ইঞ্জিন;

নথি সংক্ষিপ্তকরণ হলো কোন দীর্ঘ নথি থেকে মূল ও গুরুত্বপূর্ণ বাক্য নিয়ে সারাংশ তৈরির প্রক্রিয়া।[১]

প্রকারভেদ[সম্পাদনা]

উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ[সম্পাদনা]

পূর্ণ সংগ্রহ থেকে বস্তুকে কোন প্রকার পরিবর্তন ছাড়াই সরাসরি স্বয়ংক্রিয়ভাবে তুলে নিয়ে আশার প্রক্রিয়াকে উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ বলে। যেমন কোন নথিকে সংক্ষিপ্ত করার জন্য সেই নথির মূল বাক্যগুলিকে কোন প্রকার সম্পাদন ছাড়াই সরাসরি তুলে নিয়ে সারাংশ তৈরি করা হলো উৎপাটন প্রক্রিয়া।

বিমূর্তন ভিত্তিক সংক্ষিপ্তকরণ[সম্পাদনা]

বিমূর্তন ভিত্তিক সারসংক্ষেপ সরাসরি কোন বস্তু কিংবা বাক্যকে উৎপাটন না করে সেগুলোর মূলভাব বা শব্দান্তরিত ভাব নিয়ে সারাংশ গঠন করে। মূলত উৎপাটন প্রক্রিয়ার চেয়ে বিমূর্তন প্রক্রিয়া অনেক শক্তিশালী কিন্তু এটিকে তৈরি করা অনেক কঠিন একটি বিষয়। কারণ এখানে নতুন শব্দ উৎপাদন বিষয়টি কাজ করে। যেটি প্রাকৃতিক ভাষা উৎপাদন প্রক্রিয়ার অংশ। যদিও কিছু কাজ বিমূর্তন ভিত্তিক সারসংক্ষেপে করা হয়েছে কিন্তু বেশির ভাগ কাজই উৎপাটন প্রক্রিয়ায় করা।

সংক্ষিপ্তকরণ পদ্ধতি ও প্রয়োগ[সম্পাদনা]

সংক্ষিপ্তকরণের একটি উদাহরণ হলো নথি সংক্ষিপ্তকরণ, যেটি সংক্রিয়ভাবে কোন নথি থেকে সারাংশ উৎপন্ন করে। কেউ হয়তো একক কোন নথির সারাংশ বের করতে পারেন কিংবা অনেকগুলো নথির। অনেকগুলো নথির সারসংক্ষেপ বের করার পদ্ধতিকে বলে 'বহু নথি সংক্ষিপ্তকরণ'। এটির একটি উৎকৃষ্ট প্রয়োগ হলো সংবাদ প্রবন্ধ সংক্ষিপ্তকরণ। এমন একটি পদ্ধতি চিন্তা করুণ যেটি স্বয়ংক্রিয় ভাবে একটি বিষয়ের উপর সংবাদ প্রবন্ধ সংগ্রহ করবে (ওয়েব থেকে) এবং সেগুলোর সারসংক্ষেপ প্রদান করবে।

চিত্র সংগ্রহ করা স্বয়ংক্রিয় সংক্ষিপ্তকরণের আরেকটি প্রয়োগিক দিক। এটি মূলত অনেকগুলো চিত্র থেকে মূল চিত্রগুলো বের করে নিয়ে আসে।[২] একইভাবে আরেকটি প্রয়োগ হলো ভিডিও সংক্ষিপ্তকরণ, যেখানে সিস্টেম স্বয়ংক্রিয়ভাবে দীর্ঘ কোন সিনেমার ট্রেলার(trailer) তৈরি করতে পারে।

তথ্যসূত্র[সম্পাদনা]

  1. Sankar K. Pal; Alfredo Petrosino (২৫ জানুয়ারি ২০১২)। Handbook on Soft Computing for Video Surveillance। CRC Press। পৃষ্ঠা 81–। আইএসবিএন 978-1-4398-5685-7 
  2. Jorge E. Camargo and Fabio A. González. A Multi-class Kernel Alignment Method for Image Collection Summarization. In Proceedings of the 14th Iberoamerican Conference on Pattern Recognition: Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications (CIARP '09), Eduardo Bayro-Corrochano and Jan-Olof Eklundh (Eds.). Springer-Verlag, Berlin, Heidelberg, 545-552. ডিওআই:10.1007/978-3-642-10268-4_64

আরও পড়া[সম্পাদনা]