অপটিক্যাল ক্যারেক্টার রিকগনিশন
অপটিক্যাল ক্যারেক্টার রিকগনিশন (সাধারণত ওসিআর নামে ডাকা হয়) হাতে লেখা বা টাইপরাইটারে টাইপকৃত লেখার ছবিকে (সাধারণত স্ক্যানার দিয়ে স্ক্যান করা) কম্পিউটারে সম্পাদনাযোগ্য লেখায় অনূদিত করার যান্ত্রিক বা ইলেকট্রনিক পদ্ধতিকে বুঝায়। কম্পিউটার বিজ্ঞানের যে শাখাগুলো ওসিআর'র সাথে সম্পর্কিত সেগুলো হচ্ছে: প্যাটার্ন রিকগনিশন, কৃত্রিম বুদ্ধিমত্তা এবং যান্ত্রিক দর্শন (মেশিন ভিশন)।
বাংলা অপটিক্যাল ক্যারেক্টার রিকগনিশন
বাংলাতে গুগল টেসারাকট এর অপ্টিকাল ক্যারেক্টার রেকগনিশন আছে কিন্তু সেটি খুবি দুর্বল এবং ছাপা হরফের জন্য প্রযোজ্য। ২০০৭ সালে সি.আর.বি.এল.পি ল্যাব বাংলার জন্য এটি বানানোর একটি প্রচেষ্টা শুরু করে গুগল এর সহায়তায়ে। এর পর বাংলাদেশ ও ভারতে অনেক বিশ্ববিদ্যালায় এবং গবেষণাগারে এটির গবেষণার কাজ এখনো চলছে।
বাংলা ভাষা হল জটিল ভাষা, এতে যুক্তাক্ষর এবাং মাত্রার ব্যবহার আছে, বাংলার ন্যায় হিন্দিতেও এবং বিশ্বের আরও অনেক ভাষাতে যুক্তাক্ষর এবং জটিলতা আছে। তাই অনেক সময় কম্পিউটার এর পক্ষে কঠিন হয়ে পরে সেটিকে বুঝতে।
তথ্যসূত্র
বহিঃসংযোগ
- ICDAR, a comprehensive conference on all aspects of document recognition
- Linux OCR: A review of free optical character recognition software