উপাত্ত বিজ্ঞান

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
(ডাটা-ড্রাইভেন সায়েন্স থেকে পুনর্নির্দেশিত)
ডেটা সায়েন্সের একটি সংক্ষিপ্ত বিবরণ

উপাত্তবিজ্ঞান (ইংরেজি Data Science) হচ্ছে একটি বহুবিষয়ী ক্ষেত্র যেখানে বিভিন্ন গঠিত ও অগঠিত উপাত্ত বিশ্লেষণে ও সেখান থেকে জ্ঞান আহরণে বৈজ্ঞানিক পদ্ধতি, প্রক্রিয়া, অ্যালগরিদম ও বিভিন্ন সিস্টেম ব্যবহার করা হয়।[১][২] উপাত্তবিজ্ঞান ডাটা মাইনিং, গভীর শিক্ষণবড় উপাত্ত বিষয়গুলোর সাথে সম্পর্কিত।

উপাত্তবিজ্ঞান হচ্ছে এমন একটি ধারণা যাতে আসল তথ্যসহ মূল ঘটনা বিশ্লেষণের জন্য পরিসংখ্যান, তথ্য বিশ্লেষণ, মেশিন লার্নিং, ডোমেইন জ্ঞান সহ অন্যান্য বিষয় একীভূত করা হয়।[৩] উপাত্ত বিজ্ঞান গণিত, পরিসংখ্যান, কম্পিউটার বিজ্ঞান, ও তথ্য বিজ্ঞানের সূত্র, তত্ত্ব ও পদ্ধতি ব্যবহার করে। ট্যুরিং পুরস্কার বিজয়ী বিজ্ঞানী জিম গ্রে উপাত্ত বিজ্ঞানকে বিজ্ঞানের ৪র্থ পর্যায় বলে আখ্যা দিয়েছেন। গবেষণামূলক, তত্ত্বীয় ও কম্পুটেশনাল বিজ্ঞানের পর উপাত্তভিত্তিক বিজ্ঞান হচ্ছে বর্তমানে বিজ্ঞানের নতুন পর্যায়। তাঁর মতে, বিজ্ঞানের ব্যপারে প্রায় সবকিছুই পালটে গেছে তথ্যপ্রযুক্তির প্রভাব ও তথ্য বিস্ফোরণের ফলে।[৪]

পরিভাষার উৎস[সম্পাদনা]

শুরুর দিকের ব্যবহার[সম্পাদনা]

১৯৬২ সালে বিজ্ঞানী জন টাকি 'উপাত্ত বিশ্লেষণ' নামক একটি নতুন বিষয়ের ধারণা দেন। [৫]<. ১৯৯২ সালের দিকে ফ্রান্সের মন্টেপিলার বিশ্ববিদ্যালয়ে একটি পরিসংখ্যান সিম্পোজিয়ামে অংশগ্রহণকারীরা সবাই একমত হন যে পরিসংখ্যানের প্রতিষ্ঠিত সূত্র ও তত্ত্ব ও কম্পিউটার বিজ্ঞানের সমন্বয়ে উপাত্ত বিশ্লেষণের একটি নতুন ক্ষেত্র প্রতিষ্ঠিত হতে যাচ্ছে। 'উপাত্ত বিজ্ঞান' পরিভাষা ব্যবহার শুরু হয় ১৯৭৪ সালে যখন পিটার নাউর এটিকে কম্পিউটার বিজ্ঞানের একটি বিকল্প পরিভাষা হিসেবে ব্যবহারের প্রস্তাব করেন।[৬]

১৯৯৬ সালে আন্তর্জাতিক শ্রেণিবিন্যাসকরণ ফাউন্ডেশনের একটি সভায় উপাত্তবিজ্ঞানকে আলোচনার একটি বিষয় হিসেবে রাখা হয়। [৭]

১৯৯৮ সালে চিকিও হায়াশি উপাত্ত বিজ্ঞানকে নতু্ন উদীয়মান ক্ষেত্র বলে আখ্যা দেন।[৮]

আধুনিক ব্যবহার[সম্পাদনা]

আধুনিক ডিসিপ্লিন হিসেবে উপাত্ত বিজ্ঞানকে পরিচিতি করানোর পথিকৃত উইলিয়াম এস ক্লিভল্যান্ড[৯]

২০০১ সালের একটি গবেষণাপত্রে তিনি উল্লেখ করেন যে পরিসংখ্যানকে আরও বিস্তৃত হওয়া দরকার। ২০০২ সাল থেকে ডাটা সায়েন্স জার্নাল প্রকাশিত হচ্ছে।[১০]

২০১৪ সালে আমেরিকার পরিসংখ্যান এসোসিয়েশান তাদের ডাটা মাইনিং বিভাগের নাম পরিবর্তন করে পরিসাংখ্যনিক শিক্ষণ ও ডাটা সায়েন্স বিভাগ নামকরণ করে। ডাটা সায়েন্টিস্ট বা উপাত্ত বিজ্ঞানীী নামকরণেেের কৃতিত্ব ডিজে প্যাটেল ও জেফ হ্যামারবেকারের। তারা ২০০৮ সালে এই শব্দ প্রথমবারের মত ব্যবহার করেন।[১১]

উপাত্ত বিজ্ঞানের আসল সংজ্ঞা কেউ আজো দিতে পারে নি। কারো কারো মতে এটি একটি বাজওয়ার্ড মাত্র।

ভিত্তি[সম্পাদনা]

উপাত্তবিজ্ঞান একটি বহুবিষয়ী ক্ষেত্র। এর মূল লক্ষ্য হচ্ছে উপাত্ত সেট সমূহ থেকে বড় আকারের ডাটা (বিগ ডাটা দেখুন) এর ভিত্তিতে জ্ঞান আহরণ।[১২]

উপাত্ত বিজ্ঞান গবেষণার প্রয়োজনে পরিসংখ্যান,গণিত, কম্পিউটার বিজ্ঞান, তথ্য ভিজুয়্যালাইজেশন, গ্রাফিক ডিজাইন ব্যবহার করা হয়।[১৩][১৪]

পরিসংখ্যানের সাথে সম্পর্ক[সম্পাদনা]

ন্যাট সিলভার সহ আরও অনেক পরিসংখ্যানবিদের মতে, উপাত্ত বিজ্ঞান পরিসংখ্যানের একটি ভিন্ন রূপ মাত্র।[১৫] অন্যদের মতে উপাত্ত বিজ্ঞান, পরিসংখ্যান থেকে আলাদা যেহেতু এটি ডিজিটাল উপাত্ত নিয়ে কাজ করে।[১৬] বসন্ত ধরের মতে, উপাত্ত বিজ্ঞান পরিমাণগত ও গুণগত উভয় ধরনের উপাত্ত (যেমন: ছবি) নিয়েই কাজ করে, অন্যদিকে পরিসংখ্যান শুধুমাত্র পরিমাণগত উপাত্ত নিয়ে কাজ করে।[১৭] তবে অনেক উপাত্ত বিজ্ঞানীর মতে, উপাত্ত বিজ্ঞান পরিসংখ্যান থেকে আলাদা হলেও পরিসংখ্যানের সাথে এর সম্বন্ধ আছে। কেউ কেউ উপাত্ত বিজ্ঞানকে পরিসংখ্যানের একটি ফলিত শাখা হিসেবে গণ্য করেন।

উপাত্ত বিজ্ঞানে ক্যারিয়ার[সম্পাদনা]

আমেরিকাতে ২০১৬-২০১৯ সময়কালে উপাত্তবিজ্ঞানীর ক্যারিয়ার ১ম সেরা ও ২০২০ সালে ৩য় সেরা ক্যারিয়ার হিসেবে বিবেচিত হয়েছে।[১৮]

শিক্ষাগত যোগ্যতা[সম্পাদনা]

উপাত্তবিজ্ঞানের ক্যারিয়ারে স্নাতকসহ পিএইচডি ডিগ্রীর প্রয়োজন পড়ে। পরবর্তীতে, এন্ট্রি লেভেল চাকরির জন্য আবেদন করতে হয়। অনেকে পরে বিশেষায়িত ক্ষেত্রে চলে যান।[১৯]

বিশেষায়িত ক্ষেত্রসমূহ[সম্পাদনা]

১.মেশিন লার্নিং সায়েন্টিস্ট। ২.ডাটা এনালিস্ট। ৩.ডাটা আর্কিটেক্ট ৪.ডাটা কনসালট্যান্ট।[২০] ৫.এপ্লিকেশনস আর্কিটেক্ট।[২১].

পদ্ধতি ও প্রযুক্তিসমূহ[সম্পাদনা]

পদ্ধতি[সম্পাদনা]

১. ক্লাস্টারিং(গুচ্ছকরণ)

২.ডাইমেনশনালিটি রিডাকশন (মাত্রা হ্রাসকরণ)

৩.মেশিন লার্নিং(যন্ত্র শিক্ষণ)

ব্যবহৃত প্রযুক্তি[সম্পাদনা]

উপাত্ত বিজ্ঞানে অনেক প্রোগ্রামিং ভাষা ব্যবহার হয়।যেমনঃ

১.পাইথন

২. আর

৩.পাইটর্চ।

৪.গুগল টেনসরফ্লো।

৫.জুপিটার নোটবুক।

৬.টেবিলইউ।

৭.এপাচি হাডুপ।

উপাত্ত বিজ্ঞানের প্রভাব[সম্পাদনা]

বিগ ডাটা খুব দ্রুতই ছোট বড় বিভিন্ন কোম্পানির জন্য অত্যন্ত গুরুত্বপূর্ণ হয়ে উঠছে। প্রাপ্যতা ও ব্যাখ্যার কারণে বিগ ডাটা পুরোনো ব্যবসার মডেল বদলিয়ে নতুন করে ফেলেছে। শুধুমাত্র ২০১৫ সাল থেকে ২০২০ সালে ডাটার/উপাত্তের উপর নির্ভরকারী ব্যবসার মূলধন ২০১৫ সালে $৩৩৩ মিলিয়ন ডলার থেকে বেড়ে ২০২০ সালে $১.২ ট্রিলিয়ন ডলার হয়েছে। উপাত্ত বিজ্ঞানী বা ডাটা সায়েন্টিস্টরা বর্তমানে বিভিন্ন ধরনের ব্যবসায়ের বিস্তারে বড় ভূমিকা রাখছেন। যতদিন বিগ ডাটা আছে তত দিন ডাটা সায়েন্স ভুমিকা পালন করবে।[২২]

আরও দেখুন[সম্পাদনা]


তথ্যসূত্র[সম্পাদনা]

  1. Dhar, V (2013), Data Science & Prediction."'Communications of the ACM"' 56(12):64-73. doi- 10.1145/2500499, Achived at web.archive.org, from the original on 9 November, 2014. Retrieved 2 sep 2015.
  2. Jeff Leek(2013) The key word In "Data Science" is not Data, it is Science, Archived at web.archive.org from the original in 2 January, 2014, Retrived 1January, 2014.
  3. Hayashi, Chikio(1 January, 1998), What is Data Science? Fundamental Concepts an d a Heuristic Example
  4. Stewert Tansley, Kristin Michelle Tolle (2009), The Fourth Paradigm:Data Intensive Scientific Discovery
  5. Donoho,David(18 september,2015), 50 Years of Data Science(PDF). Retrived 2 April 2020.
  6. CaoLongBin(29 June, 2017), Data Science.ACM Computing Surveys (CSUR)
  7. CaoLongBin(29 June, 2017),Data Science. ACM Computing Surveys (CSUR)
  8. Murtagh, Fionn, Devlin,KeithThe Development of Data Science:Implications for Education, Employment, Research and the Data Revolution for Sustainable Development. Big Data and Cognitive Computing.
  9. Gupta,Shanti(15 December, 2015),William S. Cleveland,Retrieved, 2 April, 2020
  10. Press,Gil. A Very Short History of Data Science, Forbes. Retrived, 3 April, 2020.
  11. Devenport, Thomas H, Patil, DJ(1 October,2012).Data Scientist:The Sexiest Job of The 21st Century. Harvard Business Review. Retrived 3 April 2020
  12. About Data Science, www.datascienceassn.org. Retrieved 3 April 2020
  13. 1.Introduction:What is Data Science?Doing Data Science.[Book]
  14. the three sexy skills of data geeks.
  15. Nate Silver:What I Need From Statisticians-Statistics Views, www.statisticsviews.com. Retrieved 3 April, 2020.
  16. What's the difference between Data Science and Statistics, priceonomics. Retrived 3 April, 2020
  17. DharBasant(1 December, 2013), Data Science and Prediction. 'Communications of the ACM'.
  18. Best Jobs In America. Glassdoor.
  19. What is a Data Scientist. Retrived 3 April 2020.
  20. What is a Data Scientist?.Master's in Data Science.
  21. 11 Data Science Careers That Are Shaping The Future.
  22. টেমপ্লেট:Citejournal