IndQA: ओपनएआई का पहला सांस्कृतिक बेंचमार्क भारतीय भाषाओं के साथ शुरू हुआ

OpenAI ने आधिकारिक रूप से IndQA (इंडक्यूए) नामक एक नया बहुभाषी और संस्कृति-संवेदनशील बेंचमार्क लॉन्च किया है, जो यह मूल्यांकन करने के लिए बनाया गया है कि एआई मॉडल भारतीय भाषाओं और सांस्कृतिक संदर्भों में आधारित प्रश्नों को कितनी प्रभावी ढंग से समझ और विश्लेषण कर सकते हैं।

यह पहल 4 नवंबर 2025 को जारी की गई और यह OpenAI का पहला क्षेत्र-विशिष्ट (region-specific) बेंचमार्क है। इसका उद्देश्य भारत की भाषाई विविधता, सांस्कृतिक सूक्ष्मताओं और संदर्भगत समझ को मापना है। भारत, ChatGPT के लिए OpenAI का दूसरा सबसे बड़ा उपयोगकर्ता बाजार है।

IndQA क्या है?

IndQA का पूरा नाम Indian Question-Answering Benchmark है।
इसमें फिलहाल 2,278 प्रश्न शामिल हैं, जो 11 भारतीय भाषाओं में तैयार किए गए हैं —

हिन्दी, हिंग्लिश, गुजराती, पंजाबी, कन्नड़, उड़िया, मराठी, मलयालम, तमिल, बंगाली और तेलुगु।

यह बेंचमार्क 10 सांस्कृतिक क्षेत्रों (domains) को कवर करता है —

  1. कानून और नैतिकता

  2. वास्तुकला और डिजाइन

  3. भोजन और पाक-परंपरा

  4. दैनिक जीवन

  5. धर्म और आध्यात्मिकता

  6. खेल और मनोरंजन

  7. साहित्य और भाषाविज्ञान

  8. मीडिया और मनोरंजन

  9. कला और संस्कृति

  10. इतिहास

IndQA का विकास 261 विशेषज्ञों — जिनमें विद्वान, पत्रकार, भाषाविद, कलाकार और विषय-विशेषज्ञ शामिल थे — की सहभागिता से किया गया है।

IndQA कैसे काम करता है?

IndQA का मूल्यांकन एक रूब्रिक-आधारित (rubric-based) ग्रेडिंग सिस्टम पर आधारित है।

  • प्रत्येक प्रश्न के लिए विशेषज्ञों द्वारा परिभाषित मानदंड तय किए गए हैं।

  • हर मानदंड को उसकी प्रासंगिकता और महत्व के अनुसार अंक (weighted points) दिए जाते हैं।

  • एक मॉडल-आधारित ग्रेडर एआई मॉडल के उत्तरों की तुलना इन मानदंडों से करता है और अंतिम स्कोर निर्धारित करता है।

सभी प्रश्नों का परीक्षण OpenAI के सबसे शक्तिशाली मॉडलों — GPT-4o, GPT-4.5, GPT-5 और OpenAI o3 — पर किया गया, ताकि यह सुनिश्चित किया जा सके कि बेंचमार्क adversarial robustness (चुनौतीपूर्ण प्रश्नों के प्रति मजबूती) रखता है।

बेंचमार्क प्रदर्शन: प्रमुख एआई मॉडलों की तुलना

मॉडल कुल प्रदर्शन (%)
GPT-5 (Thinking High) 34.9 (सर्वोच्च)
Gemini 2.5 Pro Thinking 34.3
Gemini 2.5 Flash Thinking 29.7
Grok 4 28.5
OpenAI o3 High 28.1
GPT-4o 20.3
GPT-4 Turbo 12.1

भाषा-वार प्रदर्शन

  • सर्वश्रेष्ठ प्रदर्शन: हिन्दी (45%) और हिंग्लिश (44%) में GPT-5 ने किया।

  • सबसे कम प्रदर्शन: बंगाली और तेलुगु, जो इन लिपियों में मौजूदा एआई मॉडलों की सीमाओं को दर्शाता है।

OpenAI ने स्पष्ट किया है कि IndQA कोई क्रॉस-लैंग्वेज लीडरबोर्ड नहीं है, क्योंकि हर भाषा के प्रश्न अलग हैं। बल्कि यह एक within-model benchmark है, जिसका उपयोग समय के साथ एक ही मॉडल की प्रगति मापने के लिए किया जाएगा।

[wp-faq-schema title="FAQs" accordion=1]
vikash

Recent Posts

IndiGo में बड़ा बदलाव: विलियम वॉल्श बने CEO, जानें इसका महत्व

भारत की सबसे बड़ी एयरलाइन, IndiGo ने विमानन क्षेत्र के अनुभवी विलियम वॉल्श को अपना…

2 mins ago

समुद्री अनुसंधान को नई ताकत: ‘भावसागर केंद्र’ बना राष्ट्रीय भंडार

समुद्री संरक्षण को बनाए रखने के लिए, भारत ने 'भवसागर' रेफरल सेंटर को गहरे समुद्र…

24 mins ago

भारत का पहला क्वांटम कंप्यूटर: अमरावती में नई तकनीकी शुरुआत

एडवांस्ड टेक्नोलॉजी के क्षेत्र में एक बड़ी छलांग लगाते हुए, आंध्र प्रदेश 14 अप्रैल, 2026…

41 mins ago

भारतीय नौसेना में शामिल हुई स्वदेशी स्टेल्थ फ्रिगेट ‘दूनागिरी’

भारतीय नौसेना को 30 मार्च, 2026 को स्वदेशी स्टील्थ फ्रिगेट 'दूनागिरी' प्राप्त हुआ। इसे गार्डन…

2 hours ago

भारतीय नौसेना को मजबूती: INS संशोधक स्वदेशी सर्वे पोत शामिल

एक अहम नौसैनिक प्रोजेक्ट के तहत चौथा और आखिरी जहाज़, INS संशोधक, आधिकारिक तौर पर…

2 hours ago

WTO 14वीं मंत्रीस्तरीय सम्मेलन संपन्न: भारत ने सुधार और कृषि मुद्दों को दिया महत्व

विश्व व्यापार संगठन (WTO) का 14वां मंत्रिस्तरीय सम्मेलन (MC-14) 30 मार्च को कैमरून के याउंडे…

3 hours ago