ইউনিকোড

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে

ইউনিকোড একটি আন্তর্জাতিক বর্ণ সংকেতায়ন ব্যবস্থা। ইউনিকোড কনসোর্টিয়াম সংস্থা এর রক্ষণাবেক্ষণের দায়িত্ব পালন করে। যেকোন প্রতিষ্ঠান বা ব্যক্তি ফি দিয়ে সংস্থাটির সদস্য হতে পারে। বর্তমানে ইউনিকোডে ১০,০০০ এর বেশি বর্ণ তালিকাভুক্ত রয়েছে। বিশ্বের প্রায় সব প্রধান কম্পিউটার সফ্টওয়্যার ও হার্ডওয়্যার প্রতিষ্ঠানসমূহ সংস্থাটির বর্তমান সদস্য, যেমন Apple Computer, Microsoft, IBM, Xerox, HP, Adobe Systems এবং আরও অনেক প্রতিষ্ঠান যারা টেক্সট্-প্রসেসিং স্ট্যান্ডার্ড সম্পর্কে আগ্রহী |ইউনিকোড কনসোটিয়াম একটি অলাভজনক সংগঠন যেটি ইউনিকোডের উন্নয়নে কাজ করে যাচ্ছে এই সংগঠনের মূল লক্ষ হচ্ছে সকল ভাষাকে একটি নির্দিষ্ট মানদন্ডে নিয়ে আসা।

ইতিহাস[সম্পাদনা]

১৯৮৭ সালে ইউনিকোডের কাজ শুরু করেছিলেন জেরোক্স (Xerox) এর জো বেকার (Joe Becker) এবং অ্যাপল (Apple) এর লি কলিন্স (Lee Collins) ও মার্ক ডেভিস (Mark Davis)। তাঁদের মূল লক্ষ্য ছিল সকল ভাষাকে একটি সার্বজনীন সংকেতায়নের মানদন্ডে নিয়ে আসা।ফলশ্রুতিতে পরবর্তী বছরের আগষ্ট মাসে জো বেকার "International/multilingual text character encoding system, tentatively called Unicode." (অনুবাদ : "আন্তর্জাতিক/বহুভাষিক বর্ণ সংকেতায়ন ব্যবস্থা") নামে একটি খসড়া প্রস্তবনা তৈরি করেন।এই প্রস্তাবনাটি ছিল একটি ১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থা:

‘Unicode is intended to address the need for a workable, reliable world text encoding. Unicode could be roughly described as "wide-body ASCII" that has been stretched to 16 bits to encompass the characters of all the world's living languages. In a properly engineered design, 16 bits per character are more than sufficient for this purpose.’

১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থার কারণ ছিল তিনি মনে করেছিলেন শুধুমাত্র আধুনিক ভাষার বর্ণগুলি ব্যবহৃত হবে।

‘Unicode gives higher priority to ensuring utility for the future than to preserving past antiquities. Unicode aims in the first instance at the characters published in modern text (e.g. in the union of all newspapers and magazines printed in the world in 1988), whose number is undoubtedly far below 214 = 16,384. Beyond those modern-use characters, all others may be defined to be obsolete or rare; these are better candidates for private-use registration than for congesting the public list of generally-useful Unicodes.’

পরবর্তীতে অনেক পুরাতন ভাষার জন্য ও তালিকাভুক্ত করার প্রয়োজন পড়ে। এদের মাঝ এমন ভাষাও রয়েছে যেগুলি বর্তমানে আর ব্যবহৃত হয় না। (যেমন: মিশরীয় চিত্রলিপি, লিনিয়ার-এ, লিনিয়ার-বি ইত্যাদি)

১৯৮৯ সালে মেটাফোর (Metaphor)-এর কেন হুইস্লার (Ken Whistler) এবং মাইক কার্নাগান (Mike Kernaghan), আর.এল.জি (RLG)-এর ক্যারেন স্মিথ-ইয়োশিমুরা (Karen Smith-Yoshimura) ও জোয়ান আলিপ্র্যান্ড (Joan Aliprand) এবং সান মাইক্রোসিস্টেমস্ (Sun Microsystems)-এর গ্লেন্ রাইট (Glenn Wright) ইউনিকোডের গ্রুপে যোগদান করেন। পরবর্তীতে ১৯৯০ সালে মাইক্রোসফ্ট (Microsoft)-এর মিচেল সুইগনার্ড (Michel Suignard) ও অ্যাস্মাস ফ্রেইট্যাগ (Asmus Freytag) এবং NeXT এর রিক ম্যাকগোয়ান (Rick McGowan) যোগদান করেন। ১৯৯০ সালের শেষের দিকে ইউনিকোডের খসড়া প্রস্তাবনা সম্পন্ন হয়। ১৯৯১ এর অক্টবরে ইউনিকোডের প্রথম খন্ড প্রকাশিত হয়। ১৯৯২ সালের জুনে ইউনিকোডের দ্বিতীয় খন্ড প্রকাশিত হয়।

ইউনিকোড কী?[১][সম্পাদনা]

মূলত, কম্পিউটারে শুধু সংখ্যার ব্যবহার হয়। কম্পিউটারে লিপি বা অন্যান্য অক্ষর সংরক্ষিত হয় সেই অক্ষরগুলির প্রতিটির পিছনে একটি করে একক সংখ্যা দিয়ে। ইউনিকোড আবিষ্কার হওয়ার আগে কম্পিউটারে ব্যবহারের জন্য শত শত লিপিসংকেত ছিলো ঐ একক সংখ্যা হিসাবে ব্যবহারের জন্য। একটি লিপিসংকেতের পক্ষে সব অক্ষরের সমর্থন দেয়া সম্ভব ছিলো না: যেমন, ইউরোপিয় ইউনিয়েনেরই অনেকরকম লিপিসংকেতের প্রয়োজন হত তাদের সব ভাষাকে সমর্থন দেয়ার জন্য। এমনকি ইংরেজির মতো একটি ভাষার স্বাভাবিক ব্যবহারের ক্ষেত্রেও একটিমাত্র লিপিসংকেত দিয়ে অক্ষর, বিরাম চিহ্ন এবং কারিগরি অক্ষরগুলির সমর্থন দেয়া সম্ভব হতো না।

সবচেয়ে বড় সমস্যা ছিলো যে ঐ লিপিসংকেতগুলি একটি আরেকটির সাথে ঝামেলা করত বা এখনও করে। কারণ দু'টি লিপিসংকেতে দু'টি আলাদা অক্ষরের জন্য একই সংখ্যা ব্যবহার করা হয় অথবা একই অক্ষরের জন্য আলাদা আলাদা সংখ্যা ব্যবহার করা হয়। যার জন্য, যে-কোনো কম্পিউটার (বিশেষ করে সার্ভার)-এ অনেকগুলি লিপিসংকেতের সমর্থনের প্রয়োজন হয়ে দাঁড়ায়; তার পরেও বিভিন্ন লিপিসংকেত বা প্লাটফর্মের ডাটা প্রসেস করার সময় সেটা বিকৃত হয়ে যাবার ভয় থেকেই যায়।

ইউনিকোড সেগুলো সব বদলে দিচ্ছে! ইউনিকোড পৃথিবীর প্রতিটি ভাষার প্রতিটি অক্ষরের জন্য একটি একক সংখ্যা বরাদ্দ করছে, সেটা যে প্লাটফর্মের জন্যই হোক, যে প্রোগ্রামের জন্যই হোক, আর যে ভাষার জন্যই হোক। ইউনিকোডের এই বৈশিষ্ট্য প্রযুক্তিশিল্পে নেতৃত্ব দিচ্ছে এরকম কোম্পানিগুলি যেমন, Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys সহ অনেকেই গ্রহণ করেছে। আধুনিক বৈশিষ্ট্যের ব্যবহারের জন্য যেমন, XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, ইত্যাদি, ইউনিকোডের প্রয়োজন, এবং এই ইউনিকোডই ISO/IEC 10646-এর প্রয়োগের একমাত্র উপায়। অনেক অপারেটিং সিস্টেমে, নতুন সব ইন্টারনেট ব্রাউজারে এবং এরকম অনেক অ্যাপ্লিকেশনে ইউনিকোডের সমর্থন রয়েছে। ইউনিকোড বৈশিষ্টের উত্থান, একে সমর্থন করে এরকম টুলের উপস্থিতি, বর্তমান বিশ্বের সফটওয়্যার উন্নতির গতির জন্য গুরুত্বপুর্ণ।

বিশাল লিপিসংকেতের সমর্থন থাকায় ক্লায়েন্ট সার্ভার বা বহুমুখী এ্যপ্লিকেশন এবং ওয়েবের গঠনে পুরোনো লিপিমালার ব্যবহার না করে ইউনিকোডের ব্যবহার অনেক খরচ কমিয়ে আনতে পারে। ইউনিকোড কোনো বাড়তি প্রকৌশল ছাড়াই একটি সফটওয়্যার বা ওয়েবসাইটকে বিভিন্ন প্লাটফর্ম, ভাষা এবং দেশে ব্যবহারযোগ্যতা দেয়। এটা ব্যবহারের ফলে ডাটা বিভিন্ন সিস্টেমের মধ্যে দিয়ে আনাগোনা করতে পারে কোনো রকম বিকৃতি ছাড়াই।

ইউনিকোডে অন্তর্ভুক্ত লিপিসমূহ[সম্পাদনা]

তথ্যসুত্র[সম্পাদনা]

  1. http://www.unicode.org/standard/WhatIsUnicode.html