IndQA: भारत की भाषाओं और संस्कृति को समझने की दिशा में एक क्रांतिकारी कदम
OpenAI ने IndQA नामक एक अभिनव बेंचमार्क लॉन्च किया है, जिसका उद्देश्य यह परखना है कि आर्टिफिशियल इंटेलिजेंस (AI) सिस्टम भारत जैसी भाषाई और सांस्कृतिक विविधताओं से भरपूर भूमि को कितनी अच्छी तरह समझ पाते हैं। यह पहल बहुभाषिकता और सांस्कृतिक सटीकता की दिशा में एक नई शुरुआत है, जो AI को मानव सोच और संवाद के अधिक वास्तविक और स्वाभाविक स्तर तक पहुँचाने की कोशिश करती है।
विकास का उद्देश्य और प्रक्रिया
IndQA का निर्माण भारत के 261 क्षेत्रीय विशेषज्ञों के सहयोग से किया गया है। यह बेंचमार्क 12 भारतीय भाषाओं में तैयार किए गए 2,278 मूल प्रश्नों का संग्रह है। इन प्रश्नों को 10 सांस्कृतिक क्षेत्रों जैसे साहित्य, भोजन, इतिहास, अध्यात्म, और दैनिक जीवन में वर्गीकृत किया गया है। इसकी सबसे बड़ी विशेषता यह है कि इसमें प्रयुक्त सामग्री “नेटिवली लिखी” गई है — अर्थात् किसी अन्य भाषा से अनुवादित नहीं, बल्कि सीधे उसी भाषा में गढ़ी गई है जिससे भाव, संदर्भ और भाषाई शुद्धता अक्षुण्ण रहती है।
OpenAI का यह प्रयास यह दर्शाता है कि AI केवल शब्दों का अनुवादक नहीं, बल्कि मानव संवाद का सांस्कृतिक रूप से संवेदनशील साथी बन सकता है।
संरचना और मूल्यांकन प्रणाली
IndQA में पारंपरिक बहुविकल्पीय परीक्षण प्रणाली के बजाय एक “रुब्रिक-आधारित मूल्यांकन प्रणाली” को अपनाया गया है। प्रत्येक प्रश्न में एक सांस्कृतिक रूप से सुसंगत प्रेरणावाक्य (prompt), उसका अंग्रेज़ी अनुवाद, एक मूल्यांकन मानदंड (rubric), और विशेषज्ञ-स्तर का आदर्श उत्तर दिया गया है। मूल्यांकन विशेषज्ञों द्वारा पूर्वनिर्धारित मापदंडों के आधार पर किया जाता है, जिनमें प्रत्येक को निर्धारित वज़न (weighted score) दिया गया है।
इस प्रणाली के तहत AI मॉडल को न केवल जानकारी देने, बल्कि उस जानकारी को सांस्कृतिक दृष्टि से सही और तार्किक ढंग से प्रस्तुत करने की क्षमता पर भी आँका जाता है।
भाषाई और सांस्कृतिक विस्तार
IndQA में शामिल 12 भाषाएँ हैं: हिंदी, अंग्रेज़ी, बंगाली, हिंग्लिश, मराठी, कन्नड़, उड़िया, तेलुगू, तमिल, गुजराती, मलयालम और पंजाबी। ये भाषाएँ देश के विविध क्षेत्रों की सांस्कृतिक पहचान को दर्शाती हैं। इस बेंचमार्क में कवर किए गए सांस्कृतिक क्षेत्र भी व्यापक हैं — जैसे वास्तुकला, कला-संस्कृति, कानून-नैतिकता, मीडिया-मनोरंजन, खेल, और धर्म-अध्यात्म।
भारत को इस प्रयास की शुरुआत के लिए इसीलिए चुना गया क्योंकि यह विश्व के सबसे भाषाई रूप से समृद्ध देशों में एक है, और यहाँ लगभग एक अरब लोग अंग्रेज़ी को अपनी प्राथमिक भाषा के रूप में नहीं प्रयोग करते।
खबर से जुड़े जीके तथ्य
- IndQA में कुल 2,278 प्रश्न हैं, जो 12 भारतीय भाषाओं में विभाजित हैं।
- इसे 261 विशेषज्ञों ने मिलकर विकसित किया है।
- इसमें रूब्रिक-आधारित मूल्यांकन प्रणाली का उपयोग किया गया है, न कि पारंपरिक MCQ फॉर्मेट का।
- इस बेंचमार्क का परीक्षण GPT-4o, GPT-4.5, GPT-5 और OpenAI o3 जैसे मॉडलों पर किया गया है।