जिन चीजों ने मुझे अक्सर निराश किया है उनमें से एक है कि आसानी से छवियों और कुछ पीडीएफ फाइलों से पाठ कॉपी करना अक्षमता है (उदाहरण के लिए वे स्कैन किए गए दस्तावेजों से बनाए गए हैं)। शुक्र है, समय के साथ इस मुद्दे को हल करने के लिए सॉफ्टवेयर समाधान विकसित किए गए हैं, जो महत्वपूर्ण समय की बचत के लिए अनुमति देता है जो अन्यथा पाठ को मैन्युअल रूप से कॉपी करने और फिर से टाइप करने में खर्च किया गया होगा। आज की टिप में, मैं एक मुफ्त सॉफ्टवेयर टूल के बारे में बात कर रहा हूं, जिसे कैप्चरटेक्स्ट कहा जाता है, जो ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) एल्गोरिथ्म का उपयोग करता है जो आपको छवि और पीडीएफ फाइलों से पाठ कैप्चर करने की अनुमति देगा।
स्थापना और सेटअप
शुरू करने के लिए, प्रोजेक्ट के SourceForge पेज पर जाएं और कैप्चरटेक्स्ट का नवीनतम संस्करण डाउनलोड करें। सॉफ्टवेयर एक ज़िप आर्काइव के रूप में आता है और समय पर एक समर्पित इंस्टॉलर शामिल नहीं करता है। एक बार डाउनलोड होने के बाद, संग्रह को अनज़िप करें और कैप्चर 2 टेक्स्ट टेक्स्ट को लॉन्च करें। यह सॉफ्टवेयर लॉन्च करेगा और सिस्टम ट्रे में एक आइकन नीचे रखेगा:
सबसे पहले, आप जो करना चाहते हैं, वह सॉफ़्टवेयर की वरीयताओं को सेटअप करना है, विशेष रूप से जो कैप्चर शुरू करने और बंद करने के लिए उपयोग करने के लिए गर्म कुंजी (या शॉर्टकट):
मेरे मामले में, मैंने "Windows + q" कुंजी का उपयोग करना शुरू कर दिया है ताकि कब्जा करना शुरू कर सके और इसे रोकने के लिए "दर्ज करें"। आप इन विकल्पों को समायोजित कर सकते हैं कि आपके लिए सबसे अच्छा क्या है। ध्यान रखें कि "Windows + s" कुंजी का उपयोग अक्सर स्क्रीन कैप्चर के लिए पहले से ही किया जाता है (उदाहरण के लिए जैसे Microsoft One Note)।
अगले टैब पर, इनपुट भाषा (वर्तमान में सात भाषाओं का समर्थन किया जाता है) सहित ओसीआर विकल्प कॉन्फ़िगर किए जा सकते हैं और क्या सटीकता में सुधार के लिए ओसीआर पूर्व प्रसंस्करण का उपयोग करना है (अत्यधिक अनुशंसित)। अंत में, आउटपुट टैब पर, अन्य विकल्पों में से कोई एक चुन सकता है कि क्या कैप्चर किए गए टेक्स्ट को क्लिपबोर्ड पर सहेजना है या अलग पॉपुलर विंडो को लॉन्च करना है या नहीं।
सॉफ्टवेयर का उपयोग करना
एक बार सॉफ़्टवेयर स्थापित और कॉन्फ़िगर हो जाने के बाद, आप इसे अपने स्टार्ट कैप्चर हॉट की कॉम्बिनेशन के माध्यम से उपयोग करना शुरू कर सकते हैं। अपने माउस का उपयोग करके, उस छवि पर क्षेत्र का चयन करें जिसमें वह पाठ शामिल है जिसे आप कैप्चर करना चाहते हैं। कब्जा रोकने के लिए, बस उस गर्म कुंजी को मारो जिसे आपने कब्जा रोकने के लिए चुना है। पाठ तब क्लिपबोर्ड, एक आउटपुट पॉपअप विंडो, या दोनों में कॉपी किया जाएगा। एक उदाहरण नीचे देखा जा सकता है।
छवियों के साथ टूल के मेरे त्वरित परीक्षण से, मैंने इसकी सटीकता को सभ्य पाया है। जाहिर है, सामान्य रूप से इस और ओसीआर जैसे उपकरणों की सीमाएं हैं। उदाहरण के लिए, भारी रूप से संशोधित पाठ (बहुत ही कर्सिव, इटैलिकाइज्ड या मॉडर्न) बहुत अच्छी तरह से काम नहीं कर सकता है, और कभी-कभी बिल्कुल भी नहीं। इसके अलावा, कुछ मामलों में कैप्चर बॉक्स आयामों को थोड़ा समायोजित करने या अधिक सटीक परिणाम प्राप्त करने के लिए छवि पर ज़ूम के साथ खेलने में मदद मिलेगी।
स्कैन किए गए पीडीएफ दस्तावेजों से पाठ कैप्चर करते समय सटीकता ठीक है, कुछ अंतिम संशोधनों के साथ आम तौर पर अभी भी कैप्चर किए गए आउटपुट (प्रारंभिक स्कैन की गुणवत्ता के आधार पर) पर आवश्यक है। इसके अलावा, मैंने देखा है कि सॉफ्टवेयर को संसाधित होने में कुछ सेकंड का समय लग सकता है, खासकर जब बड़ी मात्रा में पाठ को बदलने के लिए कहा जाता है।
यह सब कहा जा रहा है, कुल मिलाकर मुझे लगता है कि उपकरण एक अच्छा काम करता है, खासकर जब से यह स्वतंत्र रूप से उपलब्ध है - मैं आपको इसे आज़माने के लिए प्रोत्साहित करता हूं।
परिशिष्ट 11/16/2015:
एक अन्य विकल्प के रूप में, जिनके पास Google खाते हैं, उनके लिए Google की ओसीआर क्षमताओं को आपके Google ड्राइव पर फ़ाइल अपलोड करके उपयोग करना भी संभव है (अधिक विवरण यहां पाया जा सकता है)। इसके अलावा, Google Chrome उपयोगकर्ताओं के लिए एक OCR प्लगइन भी उपलब्ध है जिसे Copyfish कहा जाता है जिसे आप भी देख सकते हैं।
