উপাত্তের গুণ
এই তালিকাটি অনলাইন বই "ডেটা গুণমান: উচ্চ প্রভাব কৌশল" থেকে নেওয়া হয়েছে। [5] এছাড়াও ডেটা মানের পদ শব্দকোষ দেখুন। [6]
- প্রকৃত দৃশ্যের চিত্রনাট্য সম্পর্কিত তথ্য দ্বারইলেকট
- রনিক কমার্স কোড ম্যানেজমেন্ট অ্যাসোসিয়েশন (ইসিসিএমএ), একটি সদস্য ভিত্তিক, আন্তর্জাতিক মানদণ্ড বাস্তবায়নের মাধ্যমে তথ্য মানের উন্নতির জন্য আন্তর্জাতিক অলাভজনক সংস্থা। ইসিসিএমএ ISO 8000 এবং আইএসও 22745 এর উন্নয়নের জন্য বর্তমান প্রকল্প নেতা, যা ডাটা মানের জন্য আন্তর্জাতিক মান এবং উপাদান এবং পরিষেবা মাস্টার ডেটা বিনিময়য়ের জন্য আদর্শ। ECCMA বিশ্বব্যাপী ডেটা কোয়ালিটি এবং ডেটা গভর্নেন্সের বিষয় বিশেষজ্ঞদের মধ্যে সহযোগিতার জন্য একটি প্ল্যাটফর্ম সরবরাহ করে যা বিশ্বব্যাপী, খোলা মানক অভিধানগুলি তৈরি ও বজায় রাখার জন্য যা অবিলম্বে লেবেল তথ্য ব্যবহার করে। লেবেলগুলির এই অভিধানগুলির অস্তিত্ব অর্থ হারানো ছাড়া কম্পিউটার কম্পিউটার থেকে অন্যের কাছে তথ্য প্রেরণ করতে দেয়।া শ্রেষ্ঠত্বের ডিগ্রী প্রদর্শন করা হয়।
- সম্পূর্ণতা, বৈধতা, সামঞ্জস্য, সময়সীমা এবং নির্ভুলতার অবস্থা যা একটি নির্দিষ্ট ব্যবহারের জন্য উপযুক্ত তথ্য তৈরি করে। [7]
- বৈশিষ্ট্যগুলির বৈশিষ্ট্য এবং তথ্যের বৈশিষ্ট্য যা তার প্রদত্ত উদ্দেশ্যে সন্তুষ্ট করার ক্ষমতা বহন করে; তথ্য সম্পর্কিত কারণের জন্য শ্রেষ্ঠত্ব ডিগ্রী সমষ্টি। [8]
- ব্যবসায়িক প্রয়োজনীয়তা এবং স্বীকৃতি মানদণ্ডের ডেটা মানগুলির সাথে সামঞ্জস্য নিশ্চিত করতে প্রসেস এবং প্রযুক্তিগুলি জড়িত। [9]
- সম্পূর্ণ, স্ট্যান্ডার্ড ভিত্তিক, সামঞ্জস্যপূর্ণ, সঠিক এবং সময় স্ট্যাম্প। [10]
যদি ISO 9000 : 2015 মানের সংজ্ঞা প্রয়োগ করা হয় তবে ডেটা গুণমানটি ডিগ্রি হিসাবে সংজ্ঞায়িত করা যেতে পারে যা ডেটা বৈশিষ্ট্যগুলির একটি সেট প্রয়োজনীয়তা পূরণ করে। বৈশিষ্ট্য উদাহরণ হল: সম্পূর্ণতা, বৈধতা, সঠিকতা, সামঞ্জস্য, প্রাপ্যতা এবং সময়কাল। প্রয়োজনীয়তা সাধারণত বলা বা বাধ্যতামূলক, বলা প্রয়োজন বা প্রত্যাশা হিসাবে সংজ্ঞায়িত করা হয়। তবে, ডেটা মানের সাথে সম্পর্কিত অন্যান্য মান রয়েছে। উদাহরণস্বরূপ, ISO 25012তথ্যটির 15 গুণমানের মাত্রা সংজ্ঞায়িত করে। [11]
পরিমাণ এবং মানের মাত্রা (বৈশিষ্ট্য) এর নাম তথ্য উৎসের উপর নির্ভর করে। উদাহরণস্বরূপ, ওয়েব 2.0 ডকুমেন্টের তথ্যগুলির জন্য মাত্রাগুলি অনুসরণ করার জন্য সংজ্ঞা দেওয়া যেতে পারে :: অ্যাক্সেসিবিলিটি, সম্পূর্ণতা, বিশ্বাসযোগ্যতা, জড়িততা, বস্তুগততা, পঠনযোগ্যতা, প্রাসঙ্গিকতা, খ্যাতি, শৈলী, সময়কাল, স্বতন্ত্রতা, দরকারীতা।
ইতিহাস
[সম্পাদনা]সস্তা কম্পিউটার ডেটা স্টোরেজ বৃদ্ধির পূর্বে, প্রসবের পরিষেবাদিগুলির জন্য নাম এবং ঠিকানা ডেটা বজায় রাখার জন্য বৃহদায়তন মেইনফ্রেম কম্পিউটার ব্যবহার করা হয়েছিল। এটি এমন ছিল যাতে মেইলটি তার গন্তব্যে সঠিকভাবে রাউন্ড করা যেতে পারে। ম্যানফ্রেমগুলি সাধারণ ভুল বানান এবং নাম এবং ঠিকানা ডেটাতে টাইপোগ্রাফিকাল ত্রুটিগুলি সংশোধন করার পাশাপাশি স্থানান্তরিত, মৃত্যুবরণ, কারাগারে যাওয়া, বিবাহিত, তালাকপ্রাপ্ত, বা অভিজ্ঞ অন্যান্য জীবন পরিবর্তনকারী ইভেন্টগুলির ট্র্যাক করার জন্য ব্যবসার নিয়মগুলি ব্যবহার করে। সরকারী সংস্থাগুলি জাতীয় পরিষেবা পরিবর্তনের জাতীয় পরিবর্তন (এনসিওএ) সহ গ্রাহক ডেটা ক্রস-রেফারেন্স করতে কয়েকটি পরিষেবা সংস্থার ডাক ডেটা উপলব্ধ করতে শুরু করে।। এই প্রযুক্তি গ্রাহকের ডেটা ম্যানুয়াল সংশোধন তুলনায় মিলিয়ন ডলার বড় কোম্পানি সংরক্ষিত। বড় কোম্পানিগুলি পোস্টে সংরক্ষিত হয়েছিল, কারণ বিলগুলি এবং সরাসরি বিপণন সামগ্রীগুলি অভিযুক্ত গ্রাহকের কাছে আরো সঠিকভাবে তাদের পথ তৈরি করেছিল। প্রাথমিকভাবে একটি সেবা হিসাবে বিক্রি করা হয়েছে, ডেটা কোয়ালিটি কর্পোরেশনগুলির দেয়ালের অভ্যন্তরে স্থানান্তরিত হয়েছে, যেমন কম খরচে এবং শক্তিশালী সার্ভার প্রযুক্তি পাওয়া যায়। [ উদ্ধৃতি প্রয়োজন ]
বিপণনের উপর জোর দিয়ে সংস্থাগুলির নাম ও ঠিকানা তথ্যের উপর তাদের গুণমানের প্রচেষ্টাগুলি প্রায়শই দৃষ্টি নিবদ্ধ করে, তবে ডেটা মানের স্বীকৃত হয় [ কার দ্বারা? ] সব ধরনের তথ্য একটি গুরুত্বপূর্ণ সম্পত্তি হিসাবে। তথ্য মানের মূলনীতি চেইন তথ্য, লেনদেনের তথ্য, এবং পাওয়া প্রায় প্রতিটি অন্যান্য বিভাগের বিভাগে প্রয়োগ করা যেতে পারে। উদাহরণস্বরূপ, সরবরাহ শৃঙ্খলা ডেটা তৈরির নির্দিষ্ট মানের সাথে সঙ্গতিপূর্ণ একটি সংস্থার মান রয়েছে: 1) অনুরূপ কিন্তু সামান্য ভিন্ন স্টক ওভারস্টকিং এড়ানো; 2) মিথ্যা স্টক আউট এড়ানো; 3) ভলিউম ডিসকাউন্ট কমাতে বিক্রেতার ক্রয় বোঝার উন্নতি; এবং 4) একটি বড় প্রতিষ্ঠান জুড়ে স্টকিং এবং শিপিং অংশ সরবরাহ খরচ এড়ানো। [ উদ্ধৃতি প্রয়োজন ]
উল্লেখযোগ্য গবেষণা প্রচেষ্টায় কোম্পানীর জন্য, ডাটা মানের উন্নয়নশীল অন্তর্ভুক্ত করতে পারে প্রোটোকল গবেষণা পদ্ধতি জন্য, হ্রাস পরিমাপ ত্রুটি , সীমা পরীক্ষণ ডেটা, এর ক্রস সারণি , মডেলিং এবং Outlier শনাক্তকরণ, যাচাই তথ্য অখণ্ডতা , ইত্যাদি [ তথ্যসূত্র প্রয়োজন ]
সংক্ষিপ্ত বিবরণ
[সম্পাদনা]তথ্য মানের বোঝার জন্য তাত্ত্বিক কাঠামোর একটি সংখ্যা আছে। আমেরিকান পদ্ধতিগততা দ্বারা প্রভাবিত একটি সিস্টেম-তাত্ত্বিক পদ্ধতির তথ্য মানের অন্তর্ভুক্ত করার জন্য ডেটা মানের সংজ্ঞা বিস্তৃত করে এবং বিজ্ঞান তত্ত্ব (ইভানভ, 197২) ভিত্তিতে নির্ভুলতা এবং নির্ভুলতার মৌলিক মাত্রার অন্তর্নিহিততাকে জোর দেয়। "জিরো ডিফেক্ট ডেটা" (হানসেন, 1991) ডাব্লেড একটি কাঠামো ডেটা গুণমানের পরিসংখ্যানগত প্রক্রিয়া নিয়ন্ত্রণের নীতিগুলি মেনে চলা। আরেকটি কাঠামো পণ্য দৃষ্টিকোণ (নির্দিষ্টকরণের সাথে সামঞ্জস্য) এবং পরিষেবা দৃষ্টিকোণ (গ্রাহকদের প্রত্যাশাগুলি পূরণ করা) (কান এট আল। 2002) সংহত করতে চায় । অন্য ফ্রেমওয়ার্ক semiotics ভিত্তি করেফর্ম, অর্থ এবং তথ্য ব্যবহার (মান এবং শঙ্কু, 2004) মানের মূল্যায়ন করা। একটি অত্যন্ত তাত্ত্বিক পদ্ধতির ডেটা কোয়ালিটি কঠোরভাবে (ওয়াণ্ড এবং ওয়াং, 1996) সংজ্ঞায়িত করার জন্য তথ্য সিস্টেমের স্বতন্ত্র প্রকৃতির বিশ্লেষণ করে ।
তথ্য মানের গবেষণার একটি উল্লেখযোগ্য পরিমাণে ডেটায়ের অনুকূল গুণাবলী (বা মাত্রা) এর বিভিন্ন বিভাগগুলির তদন্ত এবং বর্ণনা করা জড়িত। এই মাত্রা সাধারণত সঠিকতা, সম্পূর্ণতা, সামঞ্জস্য, timeliness, বৈধতা, এবং স্বতন্ত্রতা অন্তর্ভুক্ত। [12] প্রায় 200 ধরনের পদ চিহ্নিত করা হয়েছে এবং তাদের প্রকৃতিতে এই সামান্য চুক্তি (এই ধারণা, লক্ষ্য বা মানদণ্ড?), তাদের সংজ্ঞা বা পরিমাপ (ওয়াং এট আল।, 1993)। সফটওয়্যার ইঞ্জিনিয়ারদের "একটি অনুরূপ সমস্যা হিসেবে এই স্বীকৃতি জানাতে পারেন ilities "।
এমআইটির একটি মোট ডেটা কোয়ালিটি ম্যানেজমেন্ট প্রোগ্রাম রয়েছে, অধ্যাপক রিচার্ড ওয়াং এর নেতৃত্বে, যা প্রচুর সংখ্যক প্রকাশনা উৎপাদন করে এবং এই ক্ষেত্রে একটি উল্লেখযোগ্য আন্তর্জাতিক সম্মেলন আয়োজন করে (তথ্য মানের আন্তর্জাতিক সম্মেলন, আইসিআইকিউ)। এই প্রোগ্রামটি হেনসেনের "জিরো ডিফেক্ট ডেটা" ফ্রেমওয়ার্ক (হানসেন, 1991) এর কাজ থেকে বেড়ে উঠেছে।
বাস্তবে, তথ্য মানের একটি বিস্তৃত তথ্য সিস্টেমের সাথে জড়িত পেশাদারদের জন্য একটি উদ্বেগের বিষয়, তথ্য গুদাম এবং ব্যবসায়িক বুদ্ধিমত্তা থেকে গ্রাহক সম্পর্ক ব্যবস্থাপনা এবং সরবরাহ চেইন পরিচালনা থেকে । এক শিল্প গবেষণায় মার্কিন ডলার অর্থনীতির মোট মূল্য 600 বিলিয়ন মার্কিন ডলারেরও বেশি (ইকারসন, 2002) এ মূল্যের আনুমানিক হিসাব। ভুল তথ্য - যা অবৈধ এবং পুরানো তথ্য অন্তর্ভুক্ত করে - ডেটা এন্ট্রি, বা ডেটা মাইগ্রেশন এবং রূপান্তর প্রকল্পগুলির মাধ্যমে - বিভিন্ন ডেটা উৎস থেকে উদ্ভূত হতে পারে । [13]
২00২ সালে, ইউএসপিএস এবং প্রাইসওয়াটারহাউসকুপারস একটি রিপোর্ট প্রকাশ করে যে, মার্কিন যুক্তরাষ্ট্রের সকল মেইল পাঠানো 23.6 শতাংশ ভুলভাবে উল্লেখ করা হয়েছে। [14]
এক ডেটা যোগাযোগের তথ্যটি গড় ডাটাবেসের মধ্যে খুব দ্রুত পচা হয়ে যায় - 45 মিলিয়ন আমেরিকানরা প্রতি বছর তাদের ঠিকানা পরিবর্তন করে। [15]
প্রকৃতপক্ষে, সমস্যাটি এমন উদ্বেগের বিষয় যে কোম্পানিগুলি একটি ডেটা গভর্নেন্স টিম প্রতিষ্ঠা শুরু করে যা কর্পোরেশনের একমাত্র ভূমিকা ডেটা মানের জন্য দায়ী। কিছু [ কে? ] প্রতিষ্ঠানগুলি, এই ডেটা গভর্নেন্স ফাংশনটি একটি বৃহত্তর রেগুলেটরি সম্মতি ফাংশনের অংশ হিসাবে প্রতিষ্ঠিত হয়েছে - সংস্থার তথ্য / তথ্য গুণমানের গুরুত্বের স্বীকৃতি।
তথ্য মানের সমস্যা শুধুমাত্র ভুল তথ্য থেকে উদ্ভূত হয় না ; অসঙ্গতিপূর্ণ তথ্য পাশাপাশি একটি সমস্যা। দূর তথ্য ছায়া সিস্টেম এবং একটি গুদাম ডাটা centralizing উদ্যোগ একটি কোম্পানী তথ্য দৃঢ়তা নিশ্চিত করার সময় লাগতে পারে অন্যতম।
উদ্যোগ, বিজ্ঞানীরা, এবং গবেষকরা তাদের সাধারণ তথ্য মান উন্নত করতে ডেটা কার্যাশন সম্প্রদায়ের মধ্যে অংশগ্রহণ শুরু করছেন। [16]
বাজার ডেটা কোয়ালিটি আশ্বাস প্রদান করার কিছু উপায় যাচ্ছে। বিক্রেতারা বেশ কয়েকটি বিশ্লেষণ এবং নিম্ন মানের ডেটা মেরামত জন্য সরঞ্জাম করতে স্থানেই , পরিষেবা প্রদানকারীর একটি চুক্তি ভিত্তিতে তথ্য পরিষ্কার করতে পারেন এবং পরামর্শদাতা প্রসেস অথবা সিস্টেম স্থাপন প্রথম স্থানে তথ্য মানের সমস্যা এড়ানোর জন্য পরামর্শ করতে পারেন। বেশিরভাগ ডেটা মানের সরঞ্জামগুলি ডেটা উন্নত করার জন্য সরঞ্জামগুলির একটি সিরিজ অফার করে, এতে নিম্নলিখিত কিছু বা সমস্ত অন্তর্ভুক্ত থাকতে পারে:
- ডেটা প্রোফাইলিং - প্রাথমিকভাবে তার মানের চ্যালেঞ্জ বুঝতে ডেটা মূল্যায়ন
- ডেটা মানসম্মতকরণ - একটি ব্যবসা নিয়ম ইঞ্জিন যা নিশ্চিত করে যে ডেটা গুণমানের সাথে সঙ্গতিপূর্ণ
- জিওকোডিং - নাম এবং ঠিকানা তথ্যের জন্য। মার্কিন যুক্তরাষ্ট্র এবং বিশ্বব্যাপী পোস্টাল মান ডেটা সংশোধন করে
- মিলিং বা লিঙ্কিং - তথ্য তুলনা করার একটি উপায় যাতে অনুরূপ, তবে সামান্য ভিন্ন রেকর্ডগুলি সংলগ্ন করা যায়। ডেটাতে সদৃশ খুঁজে পেতে "মিলযুক্ত যুক্তি" ব্যবহার করা যেতে পারে। এটি প্রায়ই স্বীকার করে যে "বব" এবং "রবার্ট" একই ব্যক্তি হতে পারে। এটি উদাহরণস্বরূপ, "পরিবারের" পরিচালনা করতে, বা একই ঠিকানাতে স্বামীদের মধ্যে লিঙ্ক খুঁজে পেতে সক্ষম হতে পারে। পরিশেষে, এটি প্রায়শই "সেরা প্রজাতির" রেকর্ড তৈরি করতে পারে, একাধিক ডেটা উৎস থেকে সেরা উপাদানগুলি গ্রহণ করে এবং একটি একক সুপার-রেকর্ড তৈরি করে।
- মনিটরিং - ডেটা মানের গুণমান এবং ডেটা মানের গুণমানের বৈচিত্রের উপর নজর রাখা। সফ্টওয়্যার পূর্ব-নির্ধারিত ব্যবসায়িক নিয়মগুলির উপর ভিত্তি করে বৈচিত্রগুলি স্বয়ংক্রিয় সংশোধন করতে পারে।
- ব্যাচ এবং রিয়েল টাইম - একবার তথ্যটি প্রাথমিকভাবে পরিষ্কার করা হয় (ব্যাচ), কোম্পানিগুলি এটি পরিষ্কার রাখতে এন্টারপ্রাইজ অ্যাপ্লিকেশানগুলিতে প্রসেসগুলি তৈরি করতে চায়।
অনেক সুপরিচিত লেখক এবং আত্মনির্ভরশীল বিশেষজ্ঞ আছেন, ল্যারি ইংলিশ সম্ভবত সবচেয়ে জনপ্রিয় গুরু । উপরন্তু, আইকিউ ইন্টারন্যাশনাল - এই ক্ষেত্রের পেশাদার ও গবেষকদের জন্য একটি ফোকাল পয়েন্ট প্রদানের জন্য 2004 সালে তথ্য ও তথ্য মানের আন্তর্জাতিক সমিতির প্রতিষ্ঠা করা হয়েছিল।
আইএসও 8000 ডাটা মানের জন্য একটি আন্তর্জাতিক মান। [17]
ডেটা মান নিশ্চিতকরণ
[সম্পাদনা]ডেটা গুণমান নিশ্চিত করা প্রক্রিয়া প্রোফাইলিং তথ্য তথ্য অসঙ্গতি এবং অন্যান্য ব্যতিক্রমসমূহ আবিষ্কার, পাশাপাশি করণ হিসাবে তথ্য শোধক [18] [19] ক্রিয়াকলাপ (সরানোর যেমন outliers , ডাটা ক্ষেপক অনুপস্থিত) ডেটা মান উন্নত করার জন্য।
এই কার্যক্রমগুলি তথ্য গুদামের অংশ হিসাবে বা অ্যাপ্লিকেশন সফটওয়্যারের বিদ্যমান টুকরাটির ডাটাবেস প্রশাসনের অংশ হিসাবে গ্রহণ করা যেতে পারে । [20]
ডেটা মান নিয়ন্ত্রণ
[সম্পাদনা]ডেটা কোয়ালিটি কন্ট্রোল একটি অ্যাপ্লিকেশন বা প্রক্রিয়া জন্য ডেটা ব্যবহারের নিয়ন্ত্রণ প্রক্রিয়া। এই প্রক্রিয়াটি ডাটা গুণমান নিশ্চিতকরণ (QA) প্রক্রিয়ার আগে এবং পরে উভয় সঞ্চালিত হয় , যা ডেটা অসঙ্গতি এবং সংশোধন আবিষ্কার করে।
আগে:
- ইনপুট নিষিদ্ধ
QA প্রক্রিয়া অনুসরণের পর নিম্নোক্ত পরিসংখ্যান গুণমান নিয়ন্ত্রণ (QC) প্রক্রিয়া পরিচালনা করার জন্য সংগৃহীত হয় :
- অসঙ্গতি তীব্রতা
- অপূর্ণতা
- সঠিকতা
- স্পষ্টতা
- অনুপস্থিত / অজানা
ডেটা QC প্রক্রিয়া বিশ্লেষণের জন্য বা অ্যাপ্লিকেশান বা ব্যবসায়িক প্রক্রিয়ার ডেটা ব্যবহার করার সিদ্ধান্ত নেওয়ার জন্য QA প্রক্রিয়া থেকে তথ্য ব্যবহার করে। সাধারণ উদাহরণঃ যদি কোন ডেটা QC প্রক্রিয়াটি শনাক্ত করে যে তথ্যটিতে অনেকগুলি ত্রুটি রয়েছে বা অসঙ্গতি রয়েছে, তবে এটি সেই ডেটাটিকে তার ইচ্ছাকৃত প্রক্রিয়ার জন্য ব্যবহার করা থেকে বাধা দেয় যা বাধা সৃষ্টি করতে পারে। নির্দিষ্ট উদাহরণ: একটি বিমানের স্বয়ংক্রিয় পাইলট বৈশিষ্ট্যতে বেশ কয়েকটি সেন্সর থেকে অবৈধ পরিমাপ প্রদান করলে এটি ক্র্যাশ হতে পারে। সুতরাং, একটি QC প্রক্রিয়া প্রতিষ্ঠার তথ্য ব্যবহার সুরক্ষা প্রদান করে।
তথ্যের সর্বোত্তম ব্যবহার
[সম্পাদনা]ডেটা কোয়ালিটি (DQ) ডেটা ম্যানেজমেন্টের অখণ্ডতার জন্য ডেটা ইস্যুগুলি আচ্ছাদিত করে প্রয়োজনীয় একটি বিশেষ এলাকা। বর্তমান ডেটা ম্যানেজমেন্ট অপারেশনগুলি দ্বারা অনির্বাচিত ব্যতিক্রমগুলি খুঁজে পেতে ডেটা পর্যবেক্ষণ করে ডেটা গভর্নেন্সকে সহায়তা করে এমন একটি কী ক্রিয়াকলাপগুলির মধ্যে এটি একটি। ডেটা কোয়ালিটি চেকগুলি তার প্রতিকার পদক্ষেপগুলিতে পূর্ণ নিয়ন্ত্রণ করার জন্য গুণমান পর্যায়ে সংজ্ঞায়িত করা যেতে পারে। [ উদ্ধৃতি প্রয়োজন ]
একটি প্রতিষ্ঠান তার DQ সুযোগ সচেতন না হলে DQ চেক এবং ব্যবসা নিয়ম সহজেই ওভারল্যাপ করতে পারে। ওভারল্যাপ এড়াতে ব্যবসায়িক দলগুলি পুঙ্খানুপুঙ্খভাবে DQ সুযোগ বুঝতে হবে। ব্যবসায়ের যুক্তি একই কার্যকারিতা কভার করে এবং DQ হিসাবে একই উদ্দেশ্য পূরণ করে ডেটা মানের চেক অকার্যকর হয় । একটি প্রতিষ্ঠানের DQ সুযোগটি DQ কৌশল এবং ভালভাবে প্রয়োগ করা উচিত। অতীতের ব্যতিক্রমগুলির পুনরাবৃত্তি ঘটনার পরে কিছু ডেটা মানের চেক ব্যবসার নিয়মগুলিতে অনুবাদ করা যেতে পারে। [ উদ্ধৃতি প্রয়োজন ]
নিচে তথ্য প্রবাহের কয়েকটি ক্ষেত্র রয়েছে যা বার্ষিক DQ চেকগুলির প্রয়োজন হতে পারে:
সমস্ত তথ্য উপর সম্পূর্ণতা এবং নির্ভুলতা DQ চেক প্রতিটি উৎস সিস্টেম থেকে প্রতিটি বাধ্যতামূলক গুণাবলী জন্য এন্ট্রি পয়েন্টে সঞ্চালিত হতে পারে। লেনদেনের প্রাথমিক সৃষ্টি হওয়ার পরে কিছু বৈশিষ্ট্য মান তৈরি করা হয়; এই ক্ষেত্রে, এই চেকগুলি পরিচালনা করা চতুর হয়ে ওঠে এবং সেই বৈশিষ্ট্যটির উৎস সংজ্ঞায়িত ইভেন্টের পরে অবিলম্বে সম্পন্ন করা উচিত এবং লেনদেনের অন্যান্য মূল বৈশিষ্ট্য শর্ত পূরণ করা হয়।
উল্লেখ বৈশিষ্ট্যাবলী থাকার সমস্ত ডেটা রেফারেন্স তথ্য সংগঠনে মাধ্যমে নতুন বা বিরোধী মান আবিষ্কার রেফারেন্স ডাটা ভাল সংজ্ঞায়িত বৈধ মান সেট বিরুদ্ধে যাচাই করা যেতে পারে বৈধতা DQ চেক। ফলাফলগুলি মাস্টার ডেটা ম্যানেজমেন্ট (MDM) এর অধীনে পরিচালিত রেফারেন্স ডেটা আপডেট করতে ব্যবহার করা যেতে পারে ।
তৃতীয় পক্ষের পক্ষ থেকে সংস্থার অভ্যন্তরীণ দলগুলিতে সোর্স করা সমস্ত তথ্য তৃতীয় পক্ষের ডেটার বিরুদ্ধে সঠিকতা (DQ) চেক করতে পারে । এই ডেটা যাচাই ফলাফলগুলি যখন ডেটা এন্ট্রি পয়েন্টের পরে একাধিক হপ তৈরি করে এমন ডেটা প্রশাসিত হয় তখন মূল্যবান তবে এটির তথ্য অনুমোদিত হওয়ার আগে বা এন্টারপ্রাইজ বুদ্ধিমত্তাটির জন্য সংরক্ষিত হয়।
মাস্টার ডেটা উল্লেখ করে এমন সমস্ত ডেটা কলাম তার সামঞ্জস্য চেকের জন্য যাচাই করা যেতে পারে । এন্ট্রি পয়েন্টে ডেটাতে পরিচালিত একটি DQ চেক এমডিএম প্রক্রিয়ার জন্য নতুন তথ্য আবিষ্কার করে, তবে এন্ট্রি পয়েন্টের পরে প্রশাসিত একটি DQ চেক সংহততার ব্যর্থতা (ব্যতিক্রম নয়) আবিষ্কার করে।
ডেটা রূপান্তরিত হওয়ার সাথে সাথে, একাধিক টাইমস্ট্যাম্প এবং সেই টাইমস্ট্যাম্পগুলির অবস্থানগুলি ধরা হয় এবং এটি একটি নির্ধারিত SLA (পরিষেবা স্তরের চুক্তি) এর বিরুদ্ধে তার মান, ক্ষয়, কার্যক্ষম তাত্পর্য যাচাই করতে একে অপরকে এবং তার পথের সাথে তুলনা করা যেতে পারে। এই সময়কাল DQ চেক ডেটা মান ক্ষয় হার হ্রাস এবং তথ্য আন্দোলনের সময়রেখার নীতিগুলি সর্বোত্তম করতে ব্যবহার করা যেতে পারে।
একটি প্রতিষ্ঠানের জটিল লজিকটি সাধারণত একাধিক প্রসেস জুড়ে সহজ লজিকের মধ্যে ভাগ করা হয়। যুক্তিবাদিতাDQ যেমন জটিল লিকিকের উপর একটি লজিক্যাল ফলাফলের উপর নির্ভর করে মূল্যের নির্দিষ্ট পরিসর বা স্থিতিশীল আন্তঃসংযোগগুলির (সমষ্টিগত ব্যবসায়িক নিয়ম) জটিল বা অত্যন্ত গুরুত্বপূর্ণ ব্যবসায়িক প্রক্রিয়া এবং তথ্য বহির্ভূতদের আবিষ্কার করতে যাচাই করা যেতে পারে, এটি BAU (স্বাভাবিক হিসাবে ব্যবসা) প্রত্যাশা, এবং অবশেষে তথ্য সমস্যা ফলে সম্ভাব্য ব্যতিক্রম প্রদান করতে পারে। এই চেকটি একটি সাধারণ জেনেরিক একগ্রিগেশন রুল হতে পারে যা তথ্যটির বৃহৎ অংশ দ্বারা আবদ্ধ হয় অথবা প্রতিষ্ঠানের মূল ব্যবসায় সম্পর্কিত একটি লেনদেনের গুণাবলীর একটি জটিল যুক্তি হতে পারে। এই ডিকিউ পরীক্ষা ব্যবসা জ্ঞান এবং acumen উচ্চ ডিগ্রী প্রয়োজন। যুক্তিযুক্ত সমস্যাগুলির আবিষ্কারগুলি ব্যবসা বা ডেটা গভর্নেন্স বা উভয় দ্বারা নীতি এবং কৌশল পরিবর্তনের জন্য সহায়তা করতে পারে।
কনফার্মিটি চেক এবং অখণ্ডতা চেকগুলি সমস্ত ব্যবসায়িক চাহিদাগুলিতে আচ্ছাদিত নয়, এটি কঠোরভাবে ডাটাবেস আর্কিটেকচারের বিবেচনার অধীনে।
ডেটা চলাচলের অনেক জায়গা রয়েছে যেখানে ডিকিউ চেকগুলি প্রয়োজন হতে পারে না। উদাহরণস্বরূপ, ডকুমেন্ট থেকে ডেটা সোর্স করা তথ্যের জন্য নোট-কলামগুলির সম্পূর্ণতা এবং নির্ভুলতার জন্য নির্ভুলতা যাচাই করা হয়। অনুরূপভাবে, ডেটা সমান উৎস জুড়ে ডেটা সেলাই করা সময় সময় সাপেক্ষে তার সঠিকতার জন্য যাচাই করা উচিত। যাইহোক, এটি একটি ব্যবসায়িক নিয়ম এবং DQ সুযোগ থাকা উচিত নয়। [ উদ্ধৃতি প্রয়োজন ]
দুঃখজনকভাবে, একটি সফটওয়্যার ডেভেলপমেন্ট দৃষ্টিকোণ থেকে, DQ প্রায়ই একটি কার্যকারিতা হিসাবে দেখা হয়। এবং যেমন, কী ডেটা কোয়ালিটি চেক / প্রসেসগুলি চূড়ান্ত সফটওয়্যার সমাধানগুলিতে ফ্যাক্টরি হয় না। হেলথকেয়ারের মধ্যে, পরিধানযোগ্য প্রযুক্তি বা শারীরিক এলাকা নেটওয়ার্কগুলি , প্রচুর পরিমাণে ডেটা তৈরি করে। [21] ডেটা মানের অত্যন্ত উচ্চ এবং নিশ্চিতভাবে অবমূল্যায়ন নিশ্চিত করার জন্য প্রয়োজনীয় স্তর স্তর। এই বিশাল সংখ্যক জন্য সত্য mHealth অ্যাপ্লিকেশান, EHRs এবং অন্যান্য স্বাস্থ্য সম্পর্কিত সফ্টওয়্যার সমাধান। যাইহোক, কিছু ওপেন সোর্স সরঞ্জাম ডেটা মানের পরীক্ষা করে থাকে। [22] এর প্রাথমিক কারণ, জড়িত অতিরিক্ত খরচ থেকে উৎপাদিত সফ্টওয়্যার আর্কিটেকচারের মধ্যে উচ্চমানের কঠোরতা যোগ করা হয়।
স্বাস্থ্য তথ্য নিরাপত্তা এবং গোপনীয়তা
[সম্পাদনা]স্বাস্থ্য, বা এমএইচথলে মোবাইল ডিভাইসগুলির ব্যবহার স্বাস্থ্য তথ্য নিরাপত্তা এবং গোপনীয়তার ক্ষেত্রে নতুন চ্যালেঞ্জ সৃষ্টি করে, যা সরাসরি ডেটা মানের প্রভাবিত করে। [2] এমএইচথ হেলথ এবং মধ্যম আয়ের দেশে স্বাস্থ্যসেবা সরবরাহের জন্য ক্রমবর্ধমান গুরুত্বপূর্ণ কৌশল। [23] মোবাইল ফোন এবং ট্যাবলেটগুলি সংগ্রহ, রিপোর্টিং এবং কাছাকাছি রিয়েল টাইমে ডেটা বিশ্লেষণের জন্য ব্যবহৃত হয়। তবে, এই মোবাইল ডিভাইসগুলি সাধারণত ব্যক্তিগত ক্রিয়াকলাপগুলির জন্য ব্যবহার করা হয়, পাশাপাশি, তাদের নিরাপত্তা ঝুঁকিগুলি আরও বেশি ঝুঁকিপূর্ণ যা ডেটা লঙ্ঘনের দিকে পরিচালিত করতে পারে। সঠিক নিরাপত্তা রক্ষাকর্তা ছাড়া, এই ব্যক্তিগত ব্যবহার স্বাস্থ্যের গুণমান, নিরাপত্তা এবং গোপনীয়তাকে ঝুঁকিপূর্ণ করে তুলতে পারে ।
জনস্বাস্থ্যে উপাত্তের গুণ
[সম্পাদনা]সাম্প্রতিক বছরগুলিতে ডেটা কোয়ালিটি জনস্বাস্থ্য কর্মসূচিগুলির একটি প্রধান ফোকাস হয়ে উঠেছে, বিশেষ করে জবাবদিহিতা বৃদ্ধির দাবিতে। [25] এডস, টিউবারকুলোসিস এবং ম্যালেরিয়া রোগের বিরুদ্ধে লড়াইয়ের সাথে উচ্চাকাঙ্ক্ষী লক্ষ্যগুলির দিকে কাজ করা দৃঢ় নজরদারি এবং মূল্যায়ন সিস্টেমের উপর পূর্বনির্ধারিত হওয়া উচিত যা প্রোগ্রাম বাস্তবায়নের সাথে সম্পর্কিত মানের তথ্য উৎপাদন করে। [26] এই প্রোগ্রামগুলি এবং প্রোগ্রাম অডিটরগুলি ডেটা মানের মান নির্ধারণের প্রক্রিয়াটিকে মানানসই এবং স্ট্রিমলাইন করতে ক্রমবর্ধমান সরঞ্জামগুলি সন্ধান করে, [27] তথ্য প্রাপ্ত তথ্যের মান যাচাই করে [28] এবং সূচকগুলির জন্য অন্তর্নিহিত ডেটা ম্যানেজমেন্ট এবং রিপোর্টিং সিস্টেমগুলি মূল্যায়ন করে । [২9] একটি উদাহরণ হিউএইচও এবং পরিমাপ মূল্যায়ন এর ডেটা কোয়ালিটি রিভিউ টুল[30] ডাব্লুএইচও, গ্লোবাল ফান্ড, GAVI, এবং পরিমাপ মূল্যায়ন বিভিন্ন রোগ ও প্রোগ্রামগুলির মধ্যে ডেটা কোয়ালিটি আশ্বাসে একটি সুসংগত পদ্ধতির জন্য সহযোগিতা করেছে। [31]
উন্মুক্ত উপাত্ত গুণ
[সম্পাদনা]উইকিপিডিয়া , উইকিপিডিয়া , ডিবিপিডিয়া এবং অন্যান্যের মতো খোলা তথ্য উৎসগুলিতে ডেটা মানের বিশ্লেষণে নিয়োজিত অসংখ্য বৈজ্ঞানিক কাজ রয়েছে । উইকিপিডিয়া ক্ষেত্রে, গুণমান বিশ্লেষণ সমগ্র নিবন্ধ [32] বা তার পৃথক অংশগুলি (যেমন ইনফোবক্স [33] ) সম্পর্কিত হতে পারে। বিভিন্ন মডেলের মাধ্যমে মানের মডেলিং করা হয়। তাদের মধ্যে কয়েকটি ডেটা মাইনিং অ্যালগরিদম ব্যবহার করে , র্যান্ডম বন , [34] [35] সাপোর্ট ভেক্টর মেশিন [36] এবং অন্যান্য। বৈজ্ঞানিক কাজও রয়েছে [37] [38] ব্যবহার করে বিভিন্ন ভাষায় উইকিপিডিয়া নিবন্ধের মান নির্ধারণের জন্য কৃত্রিম পরিমাপ ।
উইকিউপাত্তের, DBpedia এবং অন্যান্য ডাটা মানের নির্ধারণে জন্য পদ্ধতি LOD সূত্র পৃথক।
পেশাগত সমিতি
[সম্পাদনা]আইকিউ ইন্টারন্যাশনাল একটি অ-লাভজনক, বিক্রেতার নিরপেক্ষ, 2004 সালে প্রতিষ্ঠিত পেশাদারী সমিতি, তথ্য ও তথ্য মানের পেশার নির্মাণের জন্য উৎসর্গীকৃত।
ইলেকট্রনিক কমার্স কোড ম্যানেজমেন্ট অ্যাসোসিয়েশন (ইসিসিএমএ), একটি সদস্য ভিত্তিক, আন্তর্জাতিক মানদণ্ড বাস্তবায়নের মাধ্যমে তথ্য মানের উন্নতির জন্য আন্তর্জাতিক অলাভজনক সংস্থা। ইসিসিএমএ ISO 8000 এবং আইএসও 22745 এর উন্নয়নের জন্য বর্তমান প্রকল্প নেতা, যা ডাটা মানের জন্য আন্তর্জাতিক মান এবং উপাদান এবং পরিষেবা মাস্টার ডেটা বিনিময়য়ের জন্য আদর্শ।
ECCMA বিশ্বব্যাপী ডেটা কোয়ালিটি এবং ডেটা গভর্নেন্সের বিষয় বিশেষজ্ঞদের মধ্যে সহযোগিতার জন্য একটি প্ল্যাটফর্ম সরবরাহ করে যা বিশ্বব্যাপী, খোলা মানক অভিধানগুলি তৈরি ও বজায় রাখার জন্য যা অবিলম্বে লেবেল তথ্য ব্যবহার করে। লেবেলগুলির এই অভিধানগুলির অস্তিত্ব অর্থ হারানো ছাড়া কম্পিউটার কম্পিউটার থেকে অন্যের কাছে তথ্য প্রেরণ করতে দেয়।
আরও দেখুন
[সম্পাদনা]- তথ্য বৈধতা
- রেকর্ড সংযোগ
- তথ্য মানের
- মাস্টার তথ্য ব্যবস্থাপনা
- তথ্য শাসন
- ডাটাবেস স্বাভাবিকীকরণ
- তথ্য ভিজ্যুয়ালাইজেশন
- বিশ্লেষণ paralysis
- তথ্য বিশ্লেষণ
তথ্যসূত্র
[সম্পাদনা]- ↑ Lewoniewski, Włodzimierz (২০১৯)। "Measures for Quality Assessment of Articles and Infoboxes in Multilingual Wikipedia"। Lecture Notes in Business Information Processing। 339: 619–633। আইএসবিএন 978-3-030-04849-5। ডিওআই:10.1007/978-3-030-04849-5_53। সংগ্রহের তারিখ ২০১৯-০৪-০৬।
- ↑ "Home"। ECCMA। সংগ্রহের তারিখ ২০১৮-১০-০৩।
বহিঃসংযোগ
[সম্পাদনা]- ডেটা কোয়ালিটি কোর্স, গ্লোবাল স্বাস্থ্য শিক্ষা কেন্দ্র থেকে