ইউনিকোড: সংশোধিত সংস্করণের মধ্যে পার্থক্য

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
বিষয়বস্তু বিয়োগ হয়েছে বিষয়বস্তু যোগ হয়েছে
Babaisarkar2 (আলোচনা | অবদান)
সঠিক স্থানে ট্যাগটিকে সরালাম ।
Babaisarkar2 (আলোচনা | অবদান)
→‎ইউনিকোডের গঠন ইউনিকোড কী?: হুবহু প্রতিলিপিকৃত তথ্য বাদ দিয়েছি । নতুন তথ্য য‌োগ করলাম ।
১৭ নং লাইন: ১৭ নং লাইন:


== ইউনিকোডের গঠন<ref>[http://www.unicode.org/standard/WhatIsUnicode.html ইউনিকোড কী?]</ref> ==
== ইউনিকোডের গঠন<ref>[http://www.unicode.org/standard/WhatIsUnicode.html ইউনিকোড কী?]</ref> ==
বুলীয় বীজগণিতের নিয়মে গণনা করায় কম্পিউটার কেবলমাত্র শূন্য বা ০ বা অফ এবং এক বা ১ বা অন এই দুটি অবস্থা বোঝে । এক-একটি সংখ্যাকে বোঝানোর জন্য কম্পিউটারে ০ এবং ১ এর বিভিন্ন ক্রম ব্যবহার করা হয় । কম্পিউটারে লিপি বা অন্যান্য অক্ষর সংরক্ষিত হয় সেই অক্ষরগুলির প্রতিটির জন্য ০ ও ১-এর অদ্বিতীয় একটি ক্রম দিয়ে<ref>[http://techterms.com/definition/characterencoding Character Encoding]</ref> । একটি বর্ণ সংকেতায়ন ব্যবহ্থা এরূপ একটি অদ্বিতীয় ক্রমের সঙ্গে একটি অক্ষরকে সংযুক্ত করে । এই সমস্ত ক্রমগুলিকে একত্রে বলা হয় ''কোডস্পেস্''<ref name="glossary">[http://unicode.org/glossary/ ইউনিকোডের পরিভাষা সূচী]</ref> এবং কোডস্পেসের অন্তর্ভুক্ত প্রত্যেকটি ক্রমকে ''ক‌োড পয়েন্ট'' বলা হয়<ref name="glossary"/> । কম্পিউটারে ব্যবহারের জন্য একাধিক বর্ণসংকেতায়ন ব্যবস্থা রয়েছে । প্রত্যেকটি অক্ষরের জন্য বিভিন্ন বর্ণসংকেতায়ন ব্যবস্থায় ওই অদ্বিতীয় সংখ্যার মান ভিন্ন হওয়ায় তথ্য আদানপ্রদানে অসুবিধা দেখা দেয় ইউনিকোড প্রত্যেকটি পরিচিত অক্ষরের জন্য একটি করে কোডপয়েন্ট বরাদ্দ করে এবং প্রত্যেকটি কোডপয়েন্টকে একটি অদ্বিতীয় [[w:Hexadecimal|ষষ্ঠদশনিধান]] বিশিষ্ট পূর্ণসংখ্য দ্বারা চিহ্নিত করে ইউনিকোডে বর্তমানে ১১,১৪,১১২ সংখ্যক ক‌োডপয়েন্ট রয়েছে, যেগুলিকে 0<sub>16</sub> থেকে 10FFFF<sub>16</sub> পর্যন্ত সংখ্যগুলি দ্বারা চিহ্নিত করা হয়<ref name="glossary"/>
{{copypaste | url=http://www.unicode.org/standard/translations/bangla.html | date=জুন ২০১৫}}
বুলীয় বীজগণিতের নিয়মে গণনা করায় কম্পিউটার কেবলমাত্র শূন্য বা ০ বা অফ এবং এক বা ১ বা অন এই দুটি অবস্থা বোঝে । এক-একটি সংখ্যাকে বোঝানোর জন্য কম্পিউটারে ০ এবং ১ এর বিভিন্ন ক্রম ব্যবহার করা হয় । কম্পিউটারে লিপি বা অন্যান্য অক্ষর সংরক্ষিত হয় সেই অক্ষরগুলির প্রতিটির পিছনে একটি করে অদ্বিতীয় সংখ্যা দিয়ে। ইউনিকোডের ক্ষেত্রে এই সংখ্যাগুলিকে বলা হয় ''কোড পয়েন্ট''<ref>[http://unicode.org/glossary/ ইউনিকোডের পরিভাষা সূচী]</ref> ইউনিকোড আবিষ্কার হওয়ার আগে কম্পিউটারে ব্যবহারের জন্য অনেক বর্ণসংকেতায়ন ব্যবস্থা ছিলো । প্রত্যেকটি অক্ষরের জন্য বিভিন্ন বর্ণসংকেতায়ন ব্যবস্থায় ওই অদ্বিতীয় সংখ্যার মান ছিল ভিন্ন একটি বর্ণসংকেতায়ন ব্যবস্থার পক্ষে সব অক্ষরের সমর্থন দেয়া সম্ভব ছিলো না: যেমন, ইউরোপিয় ইউনিয়েনেরই অনেকরকম বর্ণসংকেতায়ন ব্যবস্থার প্রয়োজন হত তাদের সব ভাষাকে সমর্থন দেয়ার জন্য। এমনকি ইংরেজির মতো একটি ভাষার স্বাভাবিক ব্যবহারের ক্ষেত্রেও একটিমাত্র বর্ণসংকেতায়ন ব্যবস্থার দিয়ে অক্ষর, বিরাম চিহ্ন এবং কারিগরি অক্ষরগুলির সমর্থন দেয়া সম্ভব হতো না।

সবচেয়ে বড় সমস্যা ছিলো যে ঐ লিপিসংকেতগুলি একটি আরেকটির সাথে ঝামেলা করত বা এখনও করে। কারণ দু'টি লিপিসংকেতে দু'টি আলাদা অক্ষরের জন্য একই সংখ্যা ব্যবহার করা হয় অথবা একই অক্ষরের জন্য আলাদা আলাদা সংখ্যা ব্যবহার করা হয়। যার জন্য, যে-কোনো কম্পিউটার (বিশেষ করে সার্ভার)-এ অনেকগুলি লিপিসংকেতের সমর্থনের প্রয়োজন হয়ে দাঁড়ায়; তার পরেও বিভিন্ন লিপিসংকেত বা প্লাটফর্মের ডাটা প্রসেস করার সময় সেটা বিকৃত হয়ে যাবার ভয় থেকেই যায়।

ইউনিকোড পৃথিবীর প্রতিটি ভাষার প্রতিটি অক্ষরের জন্য একটি একক সংখ্যা বরাদ্দ করেছে, সেটা যে প্লাটফর্মের জন্যই হোক, যে প্রোগ্রামের জন্যই হোক, আর যে ভাষার জন্যই হোক। ইউনিকোডের এই বৈশিষ্ট্য প্রযুক্তিশিল্পে নেতৃত্ব দিচ্ছে এরকম কোম্পানিগুলি যেমন, Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys সহ অনেকেই গ্রহণ করেছে। আধুনিক বৈশিষ্ট্যের ব্যবহারের জন্য যেমন, XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, ইত্যাদি, ইউনিকোডের প্রয়োজন, এবং এই ইউনিকোডই ISO/IEC 10646-এর প্রয়োগের একমাত্র উপায়। অনেক অপারেটিং সিস্টেমে, নতুন সব ইন্টারনেট ব্রাউজারে এবং এরকম অনেক অ্যাপ্লিকেশনে ইউনিকোডের সমর্থন রয়েছে। ইউনিকোড বৈশিষ্টের উত্থান, একে সমর্থন করে এরকম টুলের উপস্থিতি, বর্তমান বিশ্বের সফটওয়্যার উন্নতির গতির জন্য গুরুত্বপুর্ণ।

বিশাল লিপিসংকেতের সমর্থন থাকায় ক্লায়েন্ট সার্ভার বা বহুমুখী এ্যপ্লিকেশন এবং ওয়েবের গঠনে পুরোনো লিপিমালার ব্যবহার না করে ইউনিকোডের ব্যবহার অনেক খরচ কমিয়ে আনতে পারে। ইউনিকোড কোনো বাড়তি প্রকৌশল ছাড়াই একটি সফটওয়্যার বা ওয়েবসাইটকে বিভিন্ন প্লাটফর্ম, ভাষা এবং দেশে ব্যবহারযোগ্যতা দেয়। এটা ব্যবহারের ফলে ডাটা বিভিন্ন সিস্টেমের মধ্যে দিয়ে আনাগোনা করতে পারে কোনো রকম বিকৃতি ছাড়াই।


== ইউনিকোডে অন্তর্ভুক্ত লিপিসমূহ ==
== ইউনিকোডে অন্তর্ভুক্ত লিপিসমূহ ==

১১:৪৪, ২৬ জুলাই ২০১৫ তারিখে সংশোধিত সংস্করণ

ইউনিকোড একটি আন্তর্জাতিক বর্ণ সংকেতায়ন ব্যবস্থা। ইউনিকোড কনসোর্টিয়াম সংস্থা এর রক্ষণাবেক্ষণের দায়িত্ব পালন করে। যেকোন প্রতিষ্ঠান বা ব্যক্তি ফি দিয়ে সংস্থাটির সদস্য হতে পারে। বর্তমানে ইউনিকোডে ১০,০০০ এর বেশি বর্ণ তালিকাভুক্ত রয়েছে। বিশ্বের প্রায় সব প্রধান কম্পিউটার সফ্টওয়্যার ও হার্ডওয়্যার প্রতিষ্ঠানসমূহ সংস্থাটির বর্তমান সদস্য, যেমন Apple Computer, Microsoft, IBM, Xerox, HP, Adobe Systems এবং আরও অনেক প্রতিষ্ঠান যারা টেক্সট্-প্রসেসিং স্ট্যান্ডার্ড সম্পর্কে আগ্রহী। ইউনিকোড কনসোটিয়াম একটি অলাভজনক সংগঠন যেটি ইউনিকোডের উন্নয়নে কাজ করে যাচ্ছে এই সংগঠনের মূল লক্ষ হচ্ছে সকল ভাষাকে একটি নির্দিষ্ট মানদন্ডে নিয়ে আসা।

ইতিহাস

১৯৮৭ সালে ইউনিকোডের কাজ শুরু করেছিলেন জেরোক্স (Xerox) এর জো বেকার (Joe Becker) এবং অ্যাপল (Apple) এর লি কলিন্স (Lee Collins) ও মার্ক ডেভিস (Mark Davis)। তাঁদের মূল লক্ষ্য ছিল সকল ভাষাকে একটি সার্বজনীন সংকেতায়নের মানদন্ডে নিয়ে আসা।ফলশ্রুতিতে পরবর্তী বছরের আগষ্ট মাসে জো বেকার "International/multilingual text character encoding system, tentatively called Unicode." (অনুবাদ : "আন্তর্জাতিক/বহুভাষিক বর্ণ সংকেতায়ন ব্যবস্থা") নামে একটি খসড়া প্রস্তবনা তৈরি করেন। এই প্রস্তাবনাটি ছিল একটি ১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থা:[১]

Unicode is intended to address the need for a workable, reliable world text encoding. Unicode could be roughly described as "wide-body ASCII" that has been stretched to 16 bits to encompass the characters of all the world's living languages. In a properly engineered design, 16 bits per character are more than sufficient for this purpose.

১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থার কারণ ছিল তিনি মনে করেছিলেন শুধুমাত্র আধুনিক ভাষার বর্ণগুলি ব্যবহৃত হবে।

Unicode gives higher priority to ensuring utility for the future than to preserving past antiquities. Unicode aims in the first instance at the characters published in modern text (e.g. in the union of all newspapers and magazines printed in the world in 1988), whose number is undoubtedly far below 214 = 16,384. Beyond those modern-use characters, all others may be defined to be obsolete or rare; these are better candidates for private-use registration than for congesting the public list of generally-useful Unicodes.[১]

পরবর্তীতে অনেক পুরাতন ভাষার জন্য ও তালিকাভুক্ত করার প্রয়োজন পড়ে। এদের মাঝ এমন ভাষাও রয়েছে যেগুলি বর্তমানে আর ব্যবহৃত হয় না। (যেমন: মিশরীয় চিত্রলিপি, লিনিয়ার-এ, লিনিয়ার-বি ইত্যাদি)

১৯৮৯ সালে মেটাফোর (Metaphor)-এর কেন হুইস্লার (Ken Whistler) এবং মাইক কার্নাগান (Mike Kernaghan), আর.এল.জি (RLG)-এর ক্যারেন স্মিথ-ইয়োশিমুরা (Karen Smith-Yoshimura) ও জোয়ান আলিপ্র্যান্ড (Joan Aliprand) এবং সান মাইক্রোসিস্টেমস্ (Sun Microsystems)-এর গ্লেন্ রাইট (Glenn Wright) ইউনিকোডের গ্রুপে যোগদান করেন। পরবর্তীতে ১৯৯০ সালে মাইক্রোসফ্ট (Microsoft)-এর মিচেল সুইগনার্ড (Michel Suignard) ও অ্যাস্মাস ফ্রেইট্যাগ (Asmus Freytag) এবং NeXT এর রিক ম্যাকগোয়ান (Rick McGowan) যোগদান করেন। ১৯৯০ সালের শেষের দিকে ইউনিকোডের খসড়া প্রস্তাবনা সম্পন্ন হয়। ১৯৯১ এর অক্টবরে ইউনিকোডের প্রথম খন্ড প্রকাশিত হয়। ১৯৯২ সালের জুনে ইউনিকোডের দ্বিতীয় খন্ড প্রকাশিত হয়।

ইউনিকোডের গঠন[২]

বুলীয় বীজগণিতের নিয়মে গণনা করায় কম্পিউটার কেবলমাত্র শূন্য বা ০ বা অফ এবং এক বা ১ বা অন এই দুটি অবস্থা বোঝে । এক-একটি সংখ্যাকে বোঝানোর জন্য কম্পিউটারে ০ এবং ১ এর বিভিন্ন ক্রম ব্যবহার করা হয় । কম্পিউটারে লিপি বা অন্যান্য অক্ষর সংরক্ষিত হয় সেই অক্ষরগুলির প্রতিটির জন্য ০ ও ১-এর অদ্বিতীয় একটি ক্রম দিয়ে[৩] । একটি বর্ণ সংকেতায়ন ব্যবহ্থা এরূপ একটি অদ্বিতীয় ক্রমের সঙ্গে একটি অক্ষরকে সংযুক্ত করে । এই সমস্ত ক্রমগুলিকে একত্রে বলা হয় কোডস্পেস্[৪] এবং কোডস্পেসের অন্তর্ভুক্ত প্রত্যেকটি ক্রমকে ক‌োড পয়েন্ট বলা হয়[৪] । কম্পিউটারে ব্যবহারের জন্য একাধিক বর্ণসংকেতায়ন ব্যবস্থা রয়েছে । প্রত্যেকটি অক্ষরের জন্য বিভিন্ন বর্ণসংকেতায়ন ব্যবস্থায় ওই অদ্বিতীয় সংখ্যার মান ভিন্ন হওয়ায় তথ্য আদানপ্রদানে অসুবিধা দেখা দেয় । ইউনিকোড প্রত্যেকটি পরিচিত অক্ষরের জন্য একটি করে কোডপয়েন্ট বরাদ্দ করে এবং প্রত্যেকটি কোডপয়েন্টকে একটি অদ্বিতীয় ষষ্ঠদশনিধান বিশিষ্ট পূর্ণসংখ্য দ্বারা চিহ্নিত করে । ইউনিকোডে বর্তমানে ১১,১৪,১১২ সংখ্যক ক‌োডপয়েন্ট রয়েছে, যেগুলিকে 016 থেকে 10FFFF16 পর্যন্ত সংখ্যগুলি দ্বারা চিহ্নিত করা হয়[৪]

ইউনিকোডে অন্তর্ভুক্ত লিপিসমূহ

তথ্যসুত্র

  1. Becker, Joseph D. (আগস্ট ২৯, ১৯৮৮)। "Unicode 88" (পিডিএফ) 
  2. ইউনিকোড কী?
  3. Character Encoding
  4. ইউনিকোডের পরিভাষা সূচী