परिभाषा ओसीआर

OCR ऑप्टिकल कैरेक्टर रिकॉग्निशन का संक्षिप्त नाम है, जो अंग्रेजी में एक अभिव्यक्ति है जिसे ऑप्टिकल कैरेक्टर रिकॉग्निशन के रूप में अनुवादित किया जा सकता है। इस धारणा का उपयोग कंप्यूटर विज्ञान में एक ऐसी प्रक्रिया को नाम देने के लिए किया जाता है, जो एक स्कैनर के माध्यम से पाठ को डिजिटल बनाने की अनुमति देती है।

ओसीआर का मामला बहुत खास है, क्योंकि यह कंप्यूटर को एक ऐसा कौशल देता है जो अधिकांश मनुष्यों के लिए बुनियादी है: पढ़ना। यह ध्यान देने योग्य है कि यह हम दोनों के लिए एक आसान काम नहीं है, हालांकि हमारे मामले में हम आम तौर पर इसे बहुत कम उम्र से करना सीखते हैं, यही वजह है कि हम एक महान कौशल प्राप्त करते हैं, तब भी जब हमें समझने में कठिनाई का सामना करना पड़ता है।

प्रौद्योगिकी की प्रगति के बावजूद, OCR अभी भी कई समस्याओं का सामना कर रहा है। उदाहरण के लिए, हस्तलिखित पाठ को पहचानने के लिए एक डिजिटल प्रणाली प्राप्त करना काफी कठिन है। प्रक्रिया आम तौर पर विभिन्न पाठ इकाइयों को विभाजित करने के लिए असुविधाओं का सामना करती है। ऐसा ही तब होता है जब शब्द एक साथ बहुत करीब दिखाई देते हैं।

अन्य OCR दोष प्रकट हो सकते हैं जब शब्दों और पृष्ठभूमि के बीच पर्याप्त विपरीत नहीं होता है। मान लीजिए कि काले अक्षरों में लिखा गया पाठ एक ग्रे शीट पर छपा है: यह संभावना है कि ओसीआर प्रक्रिया अक्षरों और शब्दों को अलग नहीं कर सकती है।

चलो यह मत भूलो कि, एक कार्रवाई के रूप में, जो स्पष्ट रूप से सड़क पर चलने के रूप में सरल है, बाधाओं से बचने और हमारी अखंडता की रक्षा के लिए पूरक क्रियाओं की एक श्रृंखला की आवश्यकता होती है, एक मुद्रित पाठ का पढ़ना कई एक साथ टोही कार्यों का परिणाम है, जिसे हम ले जाते हैं लगभग अनजाने में, लेकिन वे हमें काम पर ले जाते हैं।

जब एक पाठ का सामना करना पड़ता है, तो हमारी अपनी ओसीआर प्रणाली शीर्षक की खोज और पहचान करने, पैराग्राफ, विराम चिह्न, शब्दों और संक्षिप्तीकरण के बीच रिक्त स्थान, अन्य तत्वों के बीच, साथ ही साथ सूत्रों को समझने का प्रयास करती है। बहुत अलंकृत या अस्वच्छ और उन क्षेत्रों में जानकारी को पूरा करने के लिए जिन्हें किसी भी प्रकार के पहनने का सामना करना पड़ा है, जैसे कि स्याही का दाग या गायब कागज।

अनुशंसित