किस IIT ने भारती लिपि को पढ़ने के लिए ओसीआर सिस्टम का विकास किया?

उत्तर – IIT मद्रास

IIT मद्रास के अनुसंधानकर्ताओं ने भारती लिपि के लिए सरल ओसीआर सिस्टम विकसित किया, इस शोधकार्य का नेतृत्व प्रोफेसर वी. श्रीनिवास चक्रवर्ती द्वारा किया गया। इस प्रणाली के द्वारा भारती स्क्रिप्ट में लिखे गये दस्तावेजों को कंप्यूटर द्वारा पढ़ा जा सकता है।

भारती स्क्रिप्ट

भारती स्क्रिप्ट एक एकीकृत लिपि है, इसमें नौ भारतीय भाषाएँ शामिल हैं। इसमें देवनागरी, बंगाली, गुरुमुखी, गुजराती, ओड़िया, तेलुगु, कन्नड़, मलयालम तथा तमिल शामिल हैं। इसमें उर्दू और अंग्रेजी को शामिल नहीं किया गया है क्योंकि इनका ध्वन्यात्मक गठन काफी भिन्न है।

यह आवश्यक क्यों है?

कई यूरोपीय भाषाएँ (अंग्रेजी, फ्रेंच, जर्मन, इटालियन इत्यादि) रोमन लिपि का उपयोग एक आम लिपि के रूप में करती है, इस उन सभी देशों में संचार में आसानी होती है, जिन देशों में इस आम लिपि का उपयोग किया जाता है। इस प्रकार हमारे देश में विभिन्न भाषाएँ हैं, यदि हमारे देश में ही एक आम लिपि हो तो संचार बाधा काफी हद तक कम हो जायेगी।

ओसीआर (ऑप्टिकल करैक्टर रिकग्निशन) स्कीम)

यह सबसे पहले डॉक्यूमेंट को टेक्स्ट तथा नॉन-टेक्स्ट में विभाजित कर देता है। बाद में टेक्स्ट को पैराग्राफ, वाक्य, शब्द तथा वर्णों में विभाजित किया जाता है। प्रत्येक वर्ण को करैक्टर के रूप में ASCII अथवा Unicode में चिन्हित किया जाता है।

Originally written on April 30, 2019 and last modified on April 30, 2019.

Leave a Reply

Your email address will not be published. Required fields are marked *