IndQA: भारत की भाषाओं और संस्कृति को समझने की दिशा में एक क्रांतिकारी कदम

IndQA: भारत की भाषाओं और संस्कृति को समझने की दिशा में एक क्रांतिकारी कदम

OpenAI ने IndQA नामक एक अभिनव बेंचमार्क लॉन्च किया है, जिसका उद्देश्य यह परखना है कि आर्टिफिशियल इंटेलिजेंस (AI) सिस्टम भारत जैसी भाषाई और सांस्कृतिक विविधताओं से भरपूर भूमि को कितनी अच्छी तरह समझ पाते हैं। यह पहल बहुभाषिकता और सांस्कृतिक सटीकता की दिशा में एक नई शुरुआत है, जो AI को मानव सोच और संवाद के अधिक वास्तविक और स्वाभाविक स्तर तक पहुँचाने की कोशिश करती है।

विकास का उद्देश्य और प्रक्रिया

IndQA का निर्माण भारत के 261 क्षेत्रीय विशेषज्ञों के सहयोग से किया गया है। यह बेंचमार्क 12 भारतीय भाषाओं में तैयार किए गए 2,278 मूल प्रश्नों का संग्रह है। इन प्रश्नों को 10 सांस्कृतिक क्षेत्रों जैसे साहित्य, भोजन, इतिहास, अध्यात्म, और दैनिक जीवन में वर्गीकृत किया गया है। इसकी सबसे बड़ी विशेषता यह है कि इसमें प्रयुक्त सामग्री “नेटिवली लिखी” गई है — अर्थात् किसी अन्य भाषा से अनुवादित नहीं, बल्कि सीधे उसी भाषा में गढ़ी गई है जिससे भाव, संदर्भ और भाषाई शुद्धता अक्षुण्ण रहती है।
OpenAI का यह प्रयास यह दर्शाता है कि AI केवल शब्दों का अनुवादक नहीं, बल्कि मानव संवाद का सांस्कृतिक रूप से संवेदनशील साथी बन सकता है।

संरचना और मूल्यांकन प्रणाली

IndQA में पारंपरिक बहुविकल्पीय परीक्षण प्रणाली के बजाय एक “रुब्रिक-आधारित मूल्यांकन प्रणाली” को अपनाया गया है। प्रत्येक प्रश्न में एक सांस्कृतिक रूप से सुसंगत प्रेरणावाक्य (prompt), उसका अंग्रेज़ी अनुवाद, एक मूल्यांकन मानदंड (rubric), और विशेषज्ञ-स्तर का आदर्श उत्तर दिया गया है। मूल्यांकन विशेषज्ञों द्वारा पूर्वनिर्धारित मापदंडों के आधार पर किया जाता है, जिनमें प्रत्येक को निर्धारित वज़न (weighted score) दिया गया है।
इस प्रणाली के तहत AI मॉडल को न केवल जानकारी देने, बल्कि उस जानकारी को सांस्कृतिक दृष्टि से सही और तार्किक ढंग से प्रस्तुत करने की क्षमता पर भी आँका जाता है।

भाषाई और सांस्कृतिक विस्तार

IndQA में शामिल 12 भाषाएँ हैं: हिंदी, अंग्रेज़ी, बंगाली, हिंग्लिश, मराठी, कन्नड़, उड़िया, तेलुगू, तमिल, गुजराती, मलयालम और पंजाबी। ये भाषाएँ देश के विविध क्षेत्रों की सांस्कृतिक पहचान को दर्शाती हैं। इस बेंचमार्क में कवर किए गए सांस्कृतिक क्षेत्र भी व्यापक हैं — जैसे वास्तुकला, कला-संस्कृति, कानून-नैतिकता, मीडिया-मनोरंजन, खेल, और धर्म-अध्यात्म।
भारत को इस प्रयास की शुरुआत के लिए इसीलिए चुना गया क्योंकि यह विश्व के सबसे भाषाई रूप से समृद्ध देशों में एक है, और यहाँ लगभग एक अरब लोग अंग्रेज़ी को अपनी प्राथमिक भाषा के रूप में नहीं प्रयोग करते।

खबर से जुड़े जीके तथ्य

  • IndQA में कुल 2,278 प्रश्न हैं, जो 12 भारतीय भाषाओं में विभाजित हैं।
  • इसे 261 विशेषज्ञों ने मिलकर विकसित किया है।
  • इसमें रूब्रिक-आधारित मूल्यांकन प्रणाली का उपयोग किया गया है, न कि पारंपरिक MCQ फॉर्मेट का।
  • इस बेंचमार्क का परीक्षण GPT-4o, GPT-4.5, GPT-5 और OpenAI o3 जैसे मॉडलों पर किया गया है।
Originally written on November 5, 2025 and last modified on November 5, 2025.

Leave a Reply

Your email address will not be published. Required fields are marked *