বিষয়বস্তুতে চলুন

অ্যাস্কি

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
মূল অ্যাস্কিতে ৩২১০ থেকে ১২৬১০ কোড পয়েন্টের মধ্যে ৯৫টি মুদ্রণযোগ্য অক্ষর রয়েছে।

অ্যাস্কি (ইংরেজি: ASCII; /ˈæsk/ (শুনুন)),[]: যার পূর্ণরূপ আমেরিকান স্ট্যান্ডার্ড কোড ফর ইনফরমেশন ইন্টারচেঞ্জ (ইংরেজি: American Standard Code for Information Interchange), ইলেকট্রনিক যোগাযোগের জন্য একটি প্রতীক সংকেতায়ন পদ্ধতি। অ্যাস্কির মাধ্যমে কম্পিউটার ও অন্যান্য যন্ত্রে কোনো অক্ষর বা টেক্সটকে উপস্থাপন করা হয়। অ্যাস্কি উদ্ভাবনের সময় কম্পিউটার ব্যবস্থার প্রযুক্তিগত সীমাবদ্ধতা ছিল, তাই অ্যাস্কিতে কেবল ১২৮টি কোড পয়েন্ট রয়েছে, যার মধ্যে ৯৫টি মুদ্রণযোগ্য অক্ষর অন্তর্গত। আধুনিক কম্পিউটার ব্যবস্থা ইউনিকোড ব্যবহার করে, যেখানে লাখ লাখ কোড পয়েন্ট রয়েছে, কিন্তু এর মধ্যে ১২৮টি কোড পয়েন্ট অ্যাস্কির অনুরূপ।

ইন্টারনেট অ্যাসাইন্ড নাম্বারস অথোরিটি (আইএএনএ) প্রতীক সংকেতায়নের জন্য US-ASCII নামটি ব্যবহার করে।[]

সংক্ষিপ্ত বর্ণনা

[সম্পাদনা]

১৯৬১ সালের মে মাসে আমেরিকান স্ট্যান্ডার্ডস অ্যাসোসিয়েশনের (এএসএ) (বর্তমান আমেরিকান ন্যাশনাল স্ট্যান্ডার্ডস ইনস্টিটিউট বা আন্সি) এক্স৩.২ উপকমিটির প্রথম বৈঠকের মাধ্যমে অ্যাস্কি নিয়ে কার্য সম্পাদনা শুরু হয়েছিল। ১৯৬৩ সালে অ্যাস্কির প্রথম সংষ্করণ প্রকাশিত হয়েছিল।[][] ১৯৬৭ সালে এটি এক বড়সড় পরিমার্জনের মধ্যে দিয়ে গিয়েছিল।[][] ১৯৮৬ সালে এর সর্বশেষ সংস্করণ প্রকাশিত হয়েছিল।[]

১৯৬৯ সালে নেটওয়ার্ক ইন্টারচেঞ্জের জন্য অ্যাস্কি ফর্ম্যাটের ব্যবহার বর্ণনা করা হয়েছিল।[] ২০১৫ সালে সেই নথিকে দাপ্তরিকভাবে এক ইন্টারনেট স্ট্যান্ডার্ডের মর্যাদায় উন্নীত করা হয়েছিল।[]

আধুনিক ইংরেজি বর্ণমালার উপর ভিত্তি করে তৈরি করা অ্যাস্কিতে ১২৮টি নির্দিষ্ট অক্ষরকে ৭ বিট পূর্ণসংখ্যা দিয়ে চিহ্নিত করা হয়, যা এই নিবন্ধের অ্যাস্কি সারণিতে দেখানো হয়েছে।[১০] এই সংকেতায়িত অক্ষরের মধ্যে ৯৫টি অক্ষর মুদ্রণযোগ্য, যার মধ্যে 0 থেকে 9 পর্যন্ত আরবি অঙ্ক, a থেকে z পর্যন্ত ছোট হাতের অক্ষর, A থেকে Z পর্যন্ত বড় হাতের অক্ষর এবং যতিচিহ্ন রয়েছে। এছাড়া মূল অ্যাস্কি বর্ণনায় ৩৩টি অমুদ্রণযোগ্য কন্ট্রোল কোড অন্তর্গত ছিল, যা টেলিটাইপ মডেলের সাথে উদ্ভূত হয়েছিল। এর বেশিরভাগই বর্তমানে অপ্রচলিত,[১১] যদিও কিছু কন্ট্রোল কোড এখনও ব্যবহার করা হয়, যেমন ক্যারেজ রিটার্ন, লাইন ফিডট্যাব কোড।

উদাহরণস্বরূপ, অ্যাস্কি সংকেতায়নে ছোট হাতের i অক্ষরকে দ্বিমিক ১১০১০০১ = ষোড়শিক = ৬৯ = দশমিক ১০৫ দিয়ে উপস্থাপন করা হয়।

মার্কিন যুক্তরাষ্ট্র থেকে উদ্ভূত হলেও অ্যাস্কিতে সেন্টের (¢) জন্য কোনো কোড পয়েন্ট নেই। এছাড়া এটি ডায়াক্রিটিক চিহ্নযুক্ত ইংরেজি শব্দের পক্ষে উপযুক্ত নয়, যেমন façade, résumé ইত্যাদি।

অন্যান্য সকল বর্ণ প্রকাশকারী কম্পিউটার কোডের মত অ্যাস্কি কোডেও নির্দিষ্ট কিছু বিট প্যাটার্নের মাধ্যমে একটি করে বর্ণ প্রকাশ করা হয়। অ্যাস্কি কোডে প্রতিটি বর্ণ ৭ বিট দীর্ঘ, কাজেই সর্বমোট ১২৮টি বর্ণ প্রকাশ করা সম্ভব। কম্পিউটারে (বা অন্যকোন যন্ত্রে) একএকটি বর্ণ সংরক্ষণ করা হয় ০ থেকে ১২৭(দশমিক) পর্যন্ত সংখ্যা হিসেবে । মানুষের লৈখিক ভাষার একটি বর্নকে প্রকাশ করার জন্য যেই অক্ষর গুলো ব্যবহৃত হয় তার একটি চিত্রও সংরক্ষণ করা হয়, একে বলে গ্লিফ (glyph)। কম্পিউটারের মনিটরে বা অন্যকোন যন্ত্রের পর্দায় দেখানর সময় ০ থেকে ১২৭ পর্যন্ত সংখ্যাগুলোর সাথে সম্পৃক্ত গ্লিফটিকে দেখান হয়। অ্যাস্কি কোডে ০ থেকে ৩১ পর্যন্ত এবং ১২৭- এই সংখ্যাগুলো ব্যবহৃত হয় নিয়ন্ত্রণ সংকেত হিসেবে। অবশিষ্ট ৩২ থেকে ১২৬ পর্যন্ত সংখ্যাগুলো ব্যবহৃত হয় ছাপারযোগ্য বর্ণ সমূহের জন্য।

ইতিহাস

[সম্পাদনা]

অ্যাস্কির প্রচলন যখন শুরু হয়, তখন অধিকাংশ কম্পিউটারে অভ্যন্তরীণ ডাটা স্ট্রাকচার হিসাবে ৮ বিট দীর্ঘ বাইট বা অষ্টক ব্যবহৃত হত। একটি অ্যাস্কি অক্ষর সংরক্ষণের পরে অবশিষ্ট অষ্টম বিট তখন ব্যবহার করা হত প্যারিটি বিট হিসেবে। যেসব যন্ত্রে প্যারিটি পরীক্ষার ব্যবস্থা ছিলনা তারা অষ্টম বিটে ০ রেখে দিত।

অ্যাস্কি অক্ষরের শ্রেণীবিভাগ

[সম্পাদনা]

কন্ট্রোল কোড

[সম্পাদনা]

অ্যাস্কিতে ০ থেকে ৩১ সংখ্যাগুলো এবং ১২৭ কে ব্যবহার করা হয় নিয়ন্ত্রণ সংকেত হিসেবে। এদের জন্য কোন ছাপারযোগ্য বর্ণ নেই। ছাপার যোগ্য বর্ণগুলোকে ঠিকমত সাজিয়ে প্রকাশ করা ও অন্যান আনুষঙ্গিক কাজের জন্য যেমন, backspace ইত্যাদি প্রকাশ করতে এসব সংকেত ব্যবহৃত হয়।

BinaryOctDecHexAbbrPR[a]CS[b]CEC[c]Description
000 0000000000 NUL^@\0Null character
000 0001001101 SOH^AStart of Header
000 0010002202 STX^BStart of Text
000 0011003303 ETX^CEnd of Text
000 0100004404 EOT^DEnd of Transmission
000 0101005505 ENQ^EEnquiry
000 0110006606 ACK^FAcknowledgment
000 0111007707 BEL ^G \a Bell
000 1000010808 BS ^H \b Backspace[d][i]
000 1001011909 HT ^I \t Horizontal Tab
000 1010012100A LF ^J \n Line feed
000 1011013110B VT ^K \v Vertical Tab
000 1100014120C FF ^L \f Form feed
000 1101015130D CR ^M \r Carriage return[h]
000 1110016140E SO ^N Shift Out
000 1111017150F SI ^O Shift In
001 00000201610 DLE ^P Data Link Escape
001 00010211711 DC1 ^Q Device Control 1 (oft. XON)
001 00100221812 DC2 ^R Device Control 2
001 00110231913 DC3 ^S Device Control 3 (oft. XOFF)
001 01000242014 DC4 ^T Device Control 4
001 01010252115 NAK ^U Negative Acknowledgement
001 01100262216 SYN ^V Synchronous Idle
001 01110272317 ETB ^W End of Trans. Block
001 10000302418 CAN ^X Cancel
001 10010312519 EM ^Y End of Medium
001 1010032261A SUB ^Z Substitute
001 1011033271B ESC ^[ \e[f] Escape[g]
001 1100034281C FS ^\ File Separator
001 1101035291D GS ^] Group Separator
001 1110036301E RS ^^ Record Separator
001 1111037311F US ^_ Unit Separator
111 11111771277F DEL ^? Delete[e][i]

মুদ্রণযোগ্য অক্ষর

[সম্পাদনা]

মুদ্রণযোগ্য অ্যাস্কি অক্ষরের মধ্যে রয়েছে ইংরেজি বর্ণমালার ছোট ও বড় হাতের অক্ষরসমূহ, 0 থেকে 9 পর্যন্ত অঙ্ক, বিরাম চিহ্ন, ফাঁকা স্থান (স্পেস) ইত্যাদি।

দ্বিমিকঅষ্টকদশমিকষোড়শিকগ্লিফ
১৯৬৩১৯৬৫১৯৬৭
০১০ ০০০০০৪০৩২২০ স্পেস
০১০ ০০০১০৪১৩৩২১!
০১০ ০০১০০৪২৩৪২২"
০১০ ০০১১০৪৩৩৫২৩#
০১০ ০১০০০৪৪৩৬২৪$
০১০ ০১০১০৪৫৩৭২৫%
০১০ ০১১০০৪৬৩৮২৬&
০১০ ০১১১০৪৭৩৯২৭'
০১০ ১০০০০৫০৪০২৮(
০১০ ১০০১০৫১৪১২৯)
০১০ ১০১০০৫২৪২২A*
০১০ ১০১১০৫৩৪৩২B+
০১০ ১১০০০৫৪৪৪২C,
০১০ ১১০১০৫৫৪৫২D-
০১০ ১১১০০৫৬৪৬২E.
০১০ ১১১১০৫৭৪৭২F/
০১১ ০০০০০৬০৪৮৩০0
০১১ ০০০১০৬১৪৯৩১1
০১১ ০০১০০৬২৫০৩২2
০১১ ০০১১০৬৩৫১৩৩3
০১১ ০১০০০৬৪৫২৩৪4
০১১ ০১০১০৬৫৫৩৩৫5
০১১ ০১১০০৬৬৫৪৩৬6
০১১ ০১১১০৬৭৫৫৩৭7
০১১ ১০০০০৭০৫৬৩৮8
০১১ ১০০১০৭১৫৭৩৯9
০১১ ১০১০০৭২৫৮৩A:
০১১ ১০১১০৭৩৫৯৩B;
০১১ ১১০০০৭৪৬০৩C<
০১১ ১১০১০৭৫৬১৩D=
০১১ ১১১০০৭৬৬২৩E>
০১১ ১১১১০৭৭৬৩৩F?
১০০ ০০০০১০০৬৪৪০@`@
১০০ ০০০১১০১৬৫৪১A
১০০ ০০১০১০২৬৬৪২B
১০০ ০০১১১০৩৬৭৪৩C
১০০ ০১০০১০৪৬৮৪৪D
১০০ ০১০১১০৫৬৯৪৫E
১০০ ০১১০১০৬৭০৪৬F
100 0111১০৭৭১৪৭G
১০০ ১০০০১১০৭২৪৮H
১০০ ১০০১১১১৭৩৪৯I
১০০ ১০১০১১২৭৪৪AJ
১০০ ১০১১১১৩৭৫৪BK
১০০ ১১০০১১৪৭৬৪CL
১০০ ১১০১১১৫৭৭৪DM
১০০ ১১১০১১৬৭৮৪EN
১০০ ১১১১১১৭৭৯৪FO
১০১ ০০০০১২০৮০৫০P
১০১ ০০০১১২১৮১৫১Q
১০১ ০০১০১২২৮২৫২R
১০১ ০০১১১২৩৮৩৫৩S
১০১ ০১০০১২৪৮৪৫৪T
১০১ ০১০১১২৫৮৫৫৫U
১০১ ০১১০১২৬৮৬৫৬V
১০১ ০১১১১২৭৮৭৫৭W
১০১ ১০০০১৩০৮৮৫৮X
১০১ ১০০১১৩১৮৯৫৯Y
১০১ ১০১০১৩২৯০৫AZ
১০১ ১০১১১৩৩৯১৫B[
১০১ ১১০০১৩৪৯২৫C\~\
১০১ ১১০১১৩৫৯৩৫D]
১০১ ১১১০১৩৬৯৪৫E^
১০১ ১১১১১৩৭৯৫৫F_
১১০ ০০০০১৪০৯৬৬০@`
১১০ ০০০১১৪১৯৭৬১a
১১০ ০০১০১৪২৯৮৬২b
১১০ ০০১১১৪৩৯৯৬৩c
১১০ ০১০০১৪৪১০০৬৪d
১১০ ০১০১১৪৫১০১৬৫e
১১০ ০১১০১৪৬১০২৬৬f
১১০ ০১১১১৪৭১০৩৬৭g
১১০ ১০০০১৫০১০৪৬৮h
১১০ ১০০১১৫১১০৫৬৯i
১১০ ১০১০১৫২১০৬৬Aj
১১০ ১০১১১৫৩১০৭৬Bk
১১০ ১১০০১৫৪১০৮৬Cl
১১০ ১১০১১৫৫১০৯৬Dm
১১০ ১১১০১৫৬১১০৬En
১১০ ১১১১১৫৭১১১৬Fo
১১১ ০০০০১৬০১১২৭০p
১১১ ০০০১১৬১১১৩৭১q
১১১ ০০১০১৬২১১৪৭২r
১১১ ০০১১১৬৩১১৫৭৩s
১১১ ০১০০১৬৪১১৬৭৪t
১১১ ০১০১১৬৫১১৭৭৫u
১১১ ০১১০১৬৬১১৮৭৬v
১১১ ০১১১১৬৭১১৯৭৭w
১১১ ১০০০১৭০১২০৭৮x
১১১ ১০০১১৭১১২১৭৯y
১১১ ১০১০১৭২১২২৭Az
111 10111731237B{
111 11001741247C|
111 11011751257D}
111 11101761267E~

গঠনগত বৈশিষ্ট্য

[সম্পাদনা]
  • 0 থেকে 9 পর্যন্ত অঙ্কগুলোকে চার বিটের বাইনারিতে রূপান্তর করে তার সামনে ০০১১ জোড়া দিয়ে দিলে তাদের অ্যাস্কি প্রতীক পাওয়া যায়। এর ফলে বিসিডি থেকে অ্যাস্কিতে রূপান্তর করা সহজ।
  • ছোট ও বড় হাতের অক্ষরের মধ্যে পার্থক্য রাখা হয়েছে মাত্র একটি বিটের মাধ্যমে। বড় হাতের অক্ষরগুলোর ষষ্ঠ বিটে ০ এবং অক্ষরগুলোর ষষ্ঠ বিটে ১ রয়েছে। এর ফলে শুধুমাত্র একটি বিট পরিবর্তনের মাধ্যমেই বড় হাতের অক্ষরকে ছোট হাতের এবং ছোট হাতের অক্ষরকে বড় হাতের অক্ষরে রূপান্তর করা সম্ভব।

আরও দেখুন

[সম্পাদনা]

তথ্যসূত্র

[সম্পাদনা]
  1. Mackenzie, Charles E. (১৯৮০)। Coded Character Sets, History and Development (পিডিএফ) (1 সংস্করণ)। Addison-Wesley Publishing Company, Inc.। পৃ. ৬, ৬৬, ২১১, ২১৫, ২১৭, ২২০, ২২৩, ২২৮, ২৩৬–২৩৮, ২৪৩–২৪৫, ২৪৭–২৫৩, ৪২৩, ৪২৫–৪২৮, ৪৩৫–৪৩৯। আইএসবিএন ৯৭৮-০-২০১-১৪৪৬০-৪এলসিসিএন 77-90165। ২৬ মে ২০১৬ তারিখে মূল থেকে (পিডিএফ) আর্কাইভকৃত। সংগ্রহের তারিখ ২৫ আগস্ট ২০১৯ {{বই উদ্ধৃতি}}: |কর্ম= উপেক্ষা করা হয়েছে (সাহায্য)
  2. "Character Sets"Internet Assigned Numbers Authority (IANA)। ১৪ মে ২০০৭। সংগ্রহের তারিখ ২৫ আগস্ট ২০১৯
  3. Brandel, Mary (৬ জুলাই ১৯৯৯)। "1963: The Debut of ASCII"সিএনএন। ১৭ জুন ২০১৩ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৪ এপ্রিল ২০০৮
  4. "American Standard Code for Information Interchange, ASA X3.4-1963"Sensitive Researchআমেরিকান স্ট্যান্ডার্ডস অ্যাসোসিয়েশন। ১৭ জুন ১৯৬৩। ১১ আগস্ট ২০২০ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ৬ জুন ২০২০
  5. USA Standard Code for Information Interchange, USAS X3.4-1967 (কারিগরি প্রতিবেদন)। ইউনাইটেড স্টেটস অব আমেরিকা স্ট্যান্ডার্ডস ইনস্টিটিউট। ৭ জুলাই ১৯৬৭।
  6. Jennings, Thomas Daniel (২০ এপ্রিল ২০১৬) [1999]। "An annotated history of some character codes or ASCII: American Standard Code for Information Infiltration"Sensitive Research (SR-IX)। ২২ মে ২০১৬ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ৮ মার্চ ২০২০
  7. American National Standard for Information Systems — Coded Character Sets — 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII), ANSI X3.4-1986 (কারিগরি প্রতিবেদন)। আমেরিকান ন্যাশনাল স্ট্যান্ডার্ডস ইনস্টিটিউট (আন্সি)। ২৬ মার্চ ১৯৮৬।
  8. ASCII format for Network Interchange. Network Working Group. October 16, 1969. RFC 20. http://tools.ietf.org/html/rfc20। সংগৃহীত হয়েছে 2016-06-13.
  9. Barry Leiba (১২ জানুয়ারি ২০১৫)। "Correct classification of RFC 20 (ASCII format) to Internet Standard"IETF
  10. Internet Security Glossary, Version 2. August 2007. RFC 4949. http://tools.ietf.org/html/rfc4949। সংগৃহীত হয়েছে 2016-06-13.
  11. Maini, Anil Kumar (২০০৭)। Digital Electronics: Principles, Devices and ApplicationsJohn Wiley and Sons। পৃ. ২৮। আইএসবিএন ৯৭৮-০-৪৭০-০৩২১৪-৫In addition, it defines codes for 33 nonprinting, mostly obsolete control characters that affect how the text is processed.