আলোকভিত্তিক অক্ষর শনাক্তকরণ

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
(Optical Character Recognition থেকে পুনর্নির্দেশিত)

আলোকভিত্তিক অক্ষর শনাক্তকরণ হাতে লেখা বা টাইপযন্ত্রে টাইপকৃত লেখার ছবিকে (সাধারণত স্ক্যানার দিয়ে স্ক্যান করা) কম্পিউটারে সম্পাদনাযোগ্য লেখায় অনূদিত করার যান্ত্রিক বা ইলেকট্রনিক পদ্ধতিকে বুঝায়। ইংরেজি ভাষায় এটিকে "অপটিক্যাল ক্যারেক্টার রিকগনিশন" (সংক্ষেপে "ওসিআর") নামে ডাকা হয়। কম্পিউটার বিজ্ঞানের যে শাখাগুলি আলোকভিত্তিক অক্ষর শনাক্তকরণের সাথে সম্পর্কিত সেগুলি হচ্ছে: বিন্যাস শনাক্তকরণ (প্যাটার্ন রিকগনিশন), কৃত্রিম বুদ্ধিমত্তা এবং যান্ত্রিক দর্শন (মেশিন ভিশন)।

বাংলা আলোকভিত্তিক অক্ষর শনাক্তকরণ[সম্পাদনা]

বাংলাতে গুগল টেসারাকটের আলোকভিত্তিক অক্ষর শনাক্তকরণ আছে সেটি আগে খুবই দুর্বল এবং ছাপা হরফের জন্য প্রযোজ্য ছিল। কিন্তু বর্তমানে গুগল ড্রাইভ ও গুগল ডক গুগল টেসারাকটের যে আলোকভিত্তিক অক্ষর শনাক্তকরণ প্রযুক্তি ব্যবহার করে তা বেশ উন্নত, ফলাফলও বেশ সঠিক। ২০০৭ সালে সি.আর.বি.এল.পি ল্যাব বাংলার জন্য এটি বানানোর একটি প্রচেষ্টা শুরু করে গুগলের সহায়তায়। এর পর বাংলাদেশ ও ভারতে অনেক বিশ্ববিদ্যালয় এবং গবেষণাগারে এটির গবেষণার কাজ এখনো চলছে।

বাংলা ভাষা হল জটিল ভাষা, এতে যুক্তাক্ষর এবং মাত্রার ব্যবহার আছে, বাংলার ন্যায় হিন্দিতেও এবং বিশ্বের আরও অনেক ভাষাতে যুক্তাক্ষর এবং জটিলতা আছে। তাই অনেক সময় কম্পিউটারের পক্ষে সেটিকে বুঝতে কঠিন হয়।

তথ্যসূত্র[সম্পাদনা]

বহিঃসংযোগ[সম্পাদনা]