ডাটা মাইনিং

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
সরাসরি যাও: পরিভ্রমণ, অনুসন্ধান

ডাটা মাইনিং কম্পিউটার বিজ্ঞানের একটি ক্ষেত্র হিসেবে বিবেচিত হয়।[১][২][৩] এটি 'নলেজ ডিসকভারি ইন ডেটাবেসেজ (কেডিডি)[৩] এর একটি ধাপ।

ডাটা মাইনিং কৃত্রিম বুদ্ধিমত্তা বা আরটিফিসিয়াল ইন্টালইজেন্স, পরিসংখ্যান, ডেটাবেজ ম্যানেজমেন্ট সিস্টেম সমন্বয়ে গঠিত একটি কম্পিউট বা গণনা প্রক্রিয়া যার মাধ্যমে বিশালাকার ডাটা সেট থেকে নির্দিষ্ট বৈশিষ্টের ডাটা আবিস্কার করা সম্ভব হয়। ডাটা মাইনিং এর লক্ষ্য হল একটি ডাটা সেট থেকে নির্দিষ্ট বা কাংক্ষিত ডাটা খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেনীবদ্ধ ও উপস্থাপন করা।

নলেজ ডিসকভারি ইন ডেটাবেসেজ (কেডিডি)এর ধাপগুলো নিম্নরূপঃ

  • সিলেকশন (বাছাইকরণ)
  • প্রি-প্রোসেসিং (পূর্ব-প্রক্রিয়াকরণ)
  • ট্রান্সফরমেশন (রূপান্তর)
  • ডাটা মাইনিং
  • এভালুয়েশন (মূল্যায়ন)[৪]

ডাটা মাইনিং এলগরিদম বা গণনা প্রক্রিয়া[সম্পাদনা]

  • ক্লাসিফিকেশন (শ্রেণিবদ্ধকরণ)

এই প্রক্রিয়ায় পূর্বের ডাটা বিশ্লেষন করে ভবিষ্যতের ডাটার চরিত্র সম্পর্কে পূর্ভাবাস দেওয়া যায়। ডিসিশন ট্রি, নিউরাল নেটওয়ার্ক ইত্যাদি পক্রিয়ায় সাধারণত ডাটা বিশ্লেষন করা হয়।

  • ক্লাস্টারিং

এই প্রক্রিয়ায় ডাটাসমূহকে নির্দিষ্ট বৈশিষ্ট্যের ভিত্তিতে শ্রেণিবদ্ধ করা হয়। একটি নির্দিষ্ট শ্রেণির ডাটাগুলোর মধ্যে সর্বোচ্চ সাদৃশ্য বজায় রাখা এবং দু'টি শ্রেণির ডাটাগুলোর মধ্যে সর্বনিম্ন সাদৃশ্য বজায় রাখা ক্লাস্টারিং এর উদ্দেশ্য [৫]

  • অ্যাসোসিয়েশন

এই প্রক্রিয়ায় পূর্বের কোন রেকর্ডে যেসব ডাটা এক সাথে অবস্থান করে তাদের মধ্যে সম্মপর্ক স্থাপন করা হয়।

  • সিকুয়েন্স ডিসকভারি (ক্রম নির্ধারণ)

এই প্রক্রিয়ায় সময়ের ভিত্তিতে এবং ক্রমানুসারে ডাটা শ্রেণিবদ্ধ করা হয়।[৪]

তথ্যসূত্র[সম্পাদনা]

  1. Clifton, Christopher (২০১০)। "Encyclopædia Britannica: Definition of Data Mining"। সংগৃহীত ২০১০-১২-০৯ 
  2. Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (২০০৯)। "The Elements of Statistical Learning: Data Mining, Inference, and Prediction"। সংগৃহীত ২০১২-০৮-০৭ 
  3. "Data Mining Curriculum"ACM SIGKDD। ২০০৬-০৪-৩০। সংগৃহীত ২০১১-১০-২৮ 
  4. Book: Decision Support System and Business Intelligence by Efraim Turban
  5. Book: Data Mining: Concepts and Techniques by Jiawei Han, Micheline Kamber and Jian Pei