আলোকভিত্তিক অক্ষর শনাক্তকরণ

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
পরিভ্রমণে ঝাঁপ দিন অনুসন্ধানে ঝাঁপ দিন

আলোকভিত্তিক অক্ষর শনাক্তকরণ হাতে লেখা বা টাইপযন্ত্রে টাইপকৃত লেখার ছবিকে (সাধারণত স্ক্যানার দিয়ে স্ক্যান করা) কম্পিউটারে সম্পাদনাযোগ্য লেখায় অনূদিত করার যান্ত্রিক বা ইলেকট্রনিক পদ্ধতিকে বুঝায়। ইংরেজি ভাষায় এটিকে "অপটিক্যাল ক্যারেক্টার রিকগনিশন" (সংক্ষেপে "ওসিআর") নামে ডাকা হয়। কম্পিউটার বিজ্ঞানের যে শাখাগুলি আলোকভিত্তিক অক্ষর শনাক্তকরণের সাথে সম্পর্কিত সেগুলি হচ্ছে: বিন্যাস শনাক্তকরণ (প্যাটার্ন রিকগনিশন), কৃত্রিম বুদ্ধিমত্তা এবং যান্ত্রিক দর্শন (মেশিন ভিশন)।

বাংলা আলোকভিত্তিক অক্ষর শনাক্তকরণ[সম্পাদনা]

বাংলাতে গুগল টেসারাকটের আলোকভিত্তিক অক্ষর শনাক্তকরণ আছে সেটি আগে খুবই দুর্বল এবং ছাপা হরফের জন্য প্রযোজ্য ছিল। কিন্তু বর্তমানে গুগল ড্রাইভ ও গুগল ডক গুগল টেসারাকটের যে আলোকভিত্তিক অক্ষর শনাক্তকরণ প্রযুক্তি ব্যবহার করে তা বেশ উন্নত, ফলাফলও বেশ সঠিক। ২০০৭ সালে সি.আর.বি.এল.পি ল্যাব বাংলার জন্য এটি বানানোর একটি প্রচেষ্টা শুরু করে গুগলের সহায়তায়। এর পর বাংলাদেশ ও ভারতে অনেক বিশ্ববিদ্যালয় এবং গবেষণাগারে এটির গবেষণার কাজ এখনো চলছে।

বাংলা ভাষা হল জটিল ভাষা, এতে যুক্তাক্ষর এবং মাত্রার ব্যবহার আছে, বাংলার ন্যায় হিন্দিতেও এবং বিশ্বের আরও অনেক ভাষাতে যুক্তাক্ষর এবং জটিলতা আছে। তাই অনেক সময় কম্পিউটারের পক্ষে সেটিকে বুঝতে কঠিন হয়।

তথ্যসূত্র[সম্পাদনা]

বহিঃসংযোগ[সম্পাদনা]