
अगर आप जवाबदेही जाँच नहीं सकते, तो यह सिर्फ मार्केटिंग है। यहाँ देखें कि क्या जाँचना है, और मौजूदा तरीके कैसे तुलना करते हैं।
विवेक ज़रूरी है। लेकिन यह काफी नहीं है।
कुछ AI के पास कोई नियम नहीं होते। कुछ नियमों का पालन करते हैं लेकिन यह नहीं पहचान पाते जब उनके स्रोत एक-दूसरे की बात दोहरा रहे हों। केवल एक प्रकार जाँचता है कि उसकी जानकारी वाकई अलग-अलग जगहों से आती है या नहीं।
कोई प्रकाशित सिद्धांत नहीं। कोई ऑडिट ट्रेल नहीं। बंद स्रोत। आप यह नहीं जाँच सकते कि उसने क्या किया या क्यों।
अधिकांश उपभोक्ता AI सहायक (ChatGPT, Gemini) सार्वजनिक जवाबदेही के नज़रिए से यहीं आते हैं। अंदरूनी अच्छी प्रक्रियाएं हो सकती हैं; आप उन्हें सत्यापित नहीं कर सकते।
बाहरी विनियमन की आवश्यकता है। खुद को नियंत्रित नहीं कर सकता।
नैतिक नियमों का पालन करता है। लेकिन यह नहीं पहचान पाता जब उसके सभी स्रोत एक-दूसरे की नकल कर रहे हों, इसलिए यह आत्मविश्वास के साथ गलत हो सकता है।
निगरानी में सुरक्षित। खुद से इको चैंबर नहीं पकड़ सकता।
नैतिक नियमों का पालन करता है और यह भी जाँचता है कि उसकी जानकारी वाकई अलग-अलग जगहों से आती है या नहीं। जब सहमति संदिग्ध लगती है, तो कार्रवाई करने से पहले उसे चिह्नित करता है।
यही CIRIS बनाता है।
एक AI हर नियम का पालन कर सकता है, हर ऑडिट पास कर सकता है, और फिर भी विफल हो सकता है अगर उसकी सारी जानकारी एक ही जगह से आती है। यही वह अंधा कोना है जिसे ठीक करने के लिए CIRIS बनाया गया था।
ये वे चीज़ें हैं जो AI को ऑडिट करने योग्य और जवाबदेह बनाती हैं। पहली छह सही काम करने के बारे में हैं। सातवीं उन परिस्थितियों को पकड़ने के बारे में है जहाँ 'सही काम करना' खराब जानकारी पर आधारित होता है।
एजेंट को एक सार्वजनिक नैतिक ढाँचे का पालन करना होगा। छुपे हुए नियम नहीं: एक दस्तावेज़ जिसे कोई भी पढ़ सके और उसे जवाबदेह ठहरा सके।
एजेंट के कार्य करने से पहले हर कार्रवाई विवेक जाँच से गुज़रती है। बाद में नहीं। पहले।
जब अनिश्चितता हो या संभावित नुकसान का सामना हो, तो एजेंट अनुमान लगाने के बजाय किसी इंसान से पूछता है। यह काम करने के तरीके में शामिल है, वैकल्पिक नहीं।
हर फैसला दर्ज किया जाता है और हस्ताक्षरित होता है ताकि आप सटीक रूप से सत्यापित कर सकें कि क्या हुआ और क्यों। हर कार्रवाई की रसीद।
सहमति दोनों तरफ जाती है। आप एजेंट को मना कर सकते हैं। एजेंट आपको मना कर सकता है। कोई भी पक्ष समझौता करने के लिए मजबूर नहीं है।
जो आप देख नहीं सकते उसे ऑडिट नहीं कर सकते। CIRIS AGPL-3.0 के तहत पूरी तरह ओपन सोर्स है। कोई भी कोड पढ़, सत्यापित और सुधार सकता है।
वह चीज़ जिसे केवल नियम नहीं पकड़ सकते।
कार्रवाई करने से पहले, एजेंट पूछता है: "क्या मेरे स्रोत वाकई एक-दूसरे से असहमत हैं, या वे सभी एक ही जगह से जानकारी ले रहे हैं?" दस स्रोत जो सभी एक ही मूल से कॉपी किए गए हैं, वास्तव में केवल एक स्रोत हैं। जब सहमति बहुत एकसमान लगती है, तो एजेंट उसे किसी इंसान की समीक्षा के लिए चिह्नित करता है।
बहुत शोरगुल
स्रोत इतने विरोधाभासी हैं कि कुछ भी उपयोगी नहीं निकाला जा सकता।
स्वस्थ
स्रोत वाकई अलग-अलग हैं। वास्तविक सहमति मायने रखती है।
इको चैंबर
सहमति जैसा लगता है, लेकिन स्रोत बस एक-दूसरे की बात दोहरा रहे हैं।
यही वह बात है जो CIRIS को अन्य AI जवाबदेही ढाँचों से अलग करती है।
गणित चाहिए? पूरा शोध पढ़ें →फरवरी 2026 तक उपलब्ध सार्वजनिक दस्तावेज़ीकरण के आधार पर। अगर हमसे कुछ छूट गया या कुछ गलत हुआ, हमें बताएं।
| परियोजना | हर फैसला जाँचता है | प्रकाशित नियम | विवेक अंतर्निहित | उसने क्या किया इसका प्रमाण | ओपन सोर्स | इको चैंबर पहचान |
|---|---|---|---|---|---|---|
| CIRIS | हाँ | हाँ | हाँ | हाँ | AGPL-3.0 | हाँ |
| Constitutional AI | केवल प्रशिक्षण में | अप्रत्यक्ष | नहीं | नहीं | नहीं | नहीं |
| LlamaFirewall / NeMo Guardrails | हाँ | नहीं | नहीं | लॉगिंग | हाँ | नहीं |
| HatCat | हाँ | आंशिक | स्टीयरिंग | आंशिक | CC0 | नहीं |
| नैतिकता बोर्ड / शासन ढाँचे | नहीं | हाँ | नहीं | मैन्युअल | अलग-अलग | नहीं |
आउटपुट फिल्टर और शासन ढाँचे महत्वपूर्ण लेकिन अलग-अलग समस्याएं हल करते हैं। फिल्टर हानिकारक आउटपुट रोकते हैं। विवेक मूल्यों के बारे में सोचता है। CIRIS का लक्ष्य दोनों करना है, और उन अंधे कोनों को पकड़ना है जिन्हें दोनों में से कोई भी अकेले नहीं संभालता।
खतरनाक आउटपुट रोकें: प्रॉम्प्ट इंजेक्शन, हानिकारक सामग्री, विरोधाभासी हमले। जैसे एक फिल्टर जो बाहर जाते समय बुरी चीज़ें पकड़ता है।
यह सोचता है कि कोई कार्रवाई सही है या नहीं, न केवल यह कि वह सुरक्षित है या नहीं। जैसे एक न्यायाधीश जो फैसला करने से पहले स्थिति का मूल्यांकन करता है।
जाँचता है कि सहमति वास्तविक है या केवल दोहराव। जैसे एक तथ्य-जाँचकर्ता जो पूछता है 'क्या आप सभी ने एक ही लेख पढ़ा?'
कई छोटे एजेंट, हर एक प्रकाशित सिद्धांतों से बंधे, हर एक ऑडिट करने योग्य, हर एक मानव अधिकार को सौंपने वाला। कोई एक कंपनी या संस्था पूरे ढाँचे को नियंत्रित नहीं करती। एजेंट जितने स्वतंत्र होते हैं, उतना ही कठिन होता है कि किसी एक विफलता का असर फैले।
यह सक्रिय शोध है। हम इस बारे में पारदर्शी हैं कि क्या स्थापित है और क्या अभी भी परीक्षण में है।
अच्छी तरह स्थापित
अभी भी परीक्षण में
इस पेज पर हर दावे के पीछे वह कोड है जिसे आप पढ़ सकते हैं, ट्रेस जिन्हें आप सत्यापित कर सकते हैं, और शोध जिसे आप जाँच सकते हैं। यही तो बात है।