पहला संपर्कइंस्टॉलCoherence RatchetफेडरेशनतुलनाशोधAccordGitHub
यह पृष्ठ मशीन द्वारा अनुवादित है। अगर कुछ गलत लगे, तो कृपया एक समस्या रिपोर्ट करें — रेपो इसीलिए सार्वजनिक है। अनुवाद की समस्या रिपोर्ट करें
Background Image
आज उत्पादन में सबसे सुरक्षित और सबसे नैतिक AI

जवाबदेही के बिना, AI देने से ज़्यादा लेता है।

अगर आप जवाबदेही जाँच नहीं सकते, तो यह सिर्फ मार्केटिंग है। यहाँ देखें कि क्या जाँचना है, और मौजूदा तरीके कैसे तुलना करते हैं।

AI के तीन प्रकार

विवेक ज़रूरी है। लेकिन यह काफी नहीं है।

कुछ AI के पास कोई नियम नहीं होते। कुछ नियमों का पालन करते हैं लेकिन यह नहीं पहचान पाते जब उनके स्रोत एक-दूसरे की बात दोहरा रहे हों। केवल एक प्रकार जाँचता है कि उसकी जानकारी वाकई अलग-अलग जगहों से आती है या नहीं।

1

कोई नियम नहीं

कोई प्रकाशित सिद्धांत नहीं। कोई ऑडिट ट्रेल नहीं। बंद स्रोत। आप यह नहीं जाँच सकते कि उसने क्या किया या क्यों।

अधिकांश उपभोक्ता AI सहायक (ChatGPT, Gemini) सार्वजनिक जवाबदेही के नज़रिए से यहीं आते हैं। अंदरूनी अच्छी प्रक्रियाएं हो सकती हैं; आप उन्हें सत्यापित नहीं कर सकते।

बाहरी विनियमन की आवश्यकता है। खुद को नियंत्रित नहीं कर सकता।

2

नियम, जागरूकता नहीं

नैतिक नियमों का पालन करता है। लेकिन यह नहीं पहचान पाता जब उसके सभी स्रोत एक-दूसरे की नकल कर रहे हों, इसलिए यह आत्मविश्वास के साथ गलत हो सकता है।

निगरानी में सुरक्षित। खुद से इको चैंबर नहीं पकड़ सकता।

3

नियम + जागरूकता

नैतिक नियमों का पालन करता है और यह भी जाँचता है कि उसकी जानकारी वाकई अलग-अलग जगहों से आती है या नहीं। जब सहमति संदिग्ध लगती है, तो कार्रवाई करने से पहले उसे चिह्नित करता है।

यही CIRIS बनाता है।

एक AI हर नियम का पालन कर सकता है, हर ऑडिट पास कर सकता है, और फिर भी विफल हो सकता है अगर उसकी सारी जानकारी एक ही जगह से आती है। यही वह अंधा कोना है जिसे ठीक करने के लिए CIRIS बनाया गया था।

सात चीज़ें जाँचें

नैतिकता के लिए छह। अंधे कोनों के लिए एक।

ये वे चीज़ें हैं जो AI को ऑडिट करने योग्य और जवाबदेह बनाती हैं। पहली छह सही काम करने के बारे में हैं। सातवीं उन परिस्थितियों को पकड़ने के बारे में है जहाँ 'सही काम करना' खराब जानकारी पर आधारित होता है।

1. प्रकाशित सिद्धांत

एजेंट को एक सार्वजनिक नैतिक ढाँचे का पालन करना होगा। छुपे हुए नियम नहीं: एक दस्तावेज़ जिसे कोई भी पढ़ सके और उसे जवाबदेह ठहरा सके।

2. हर फैसले पर विवेक जाँच

एजेंट के कार्य करने से पहले हर कार्रवाई विवेक जाँच से गुज़रती है। बाद में नहीं। पहले।

3. अनिश्चित होने पर इंसानों से पूछता है

जब अनिश्चितता हो या संभावित नुकसान का सामना हो, तो एजेंट अनुमान लगाने के बजाय किसी इंसान से पूछता है। यह काम करने के तरीके में शामिल है, वैकल्पिक नहीं।

4. उसने क्या किया इसका प्रमाण

हर फैसला दर्ज किया जाता है और हस्ताक्षरित होता है ताकि आप सटीक रूप से सत्यापित कर सकें कि क्या हुआ और क्यों। हर कार्रवाई की रसीद।

5. दो-तरफा सहमति

सहमति दोनों तरफ जाती है। आप एजेंट को मना कर सकते हैं। एजेंट आपको मना कर सकता है। कोई भी पक्ष समझौता करने के लिए मजबूर नहीं है।

6. ओपन सोर्स

जो आप देख नहीं सकते उसे ऑडिट नहीं कर सकते। CIRIS AGPL-3.0 के तहत पूरी तरह ओपन सोर्स है। कोई भी कोड पढ़, सत्यापित और सुधार सकता है।

7

इको चैंबर पहचान

वह चीज़ जिसे केवल नियम नहीं पकड़ सकते।

कार्रवाई करने से पहले, एजेंट पूछता है: "क्या मेरे स्रोत वाकई एक-दूसरे से असहमत हैं, या वे सभी एक ही जगह से जानकारी ले रहे हैं?" दस स्रोत जो सभी एक ही मूल से कॉपी किए गए हैं, वास्तव में केवल एक स्रोत हैं। जब सहमति बहुत एकसमान लगती है, तो एजेंट उसे किसी इंसान की समीक्षा के लिए चिह्नित करता है।

बहुत शोरगुल

स्रोत इतने विरोधाभासी हैं कि कुछ भी उपयोगी नहीं निकाला जा सकता।

स्वस्थ

स्रोत वाकई अलग-अलग हैं। वास्तविक सहमति मायने रखती है।

इको चैंबर

सहमति जैसा लगता है, लेकिन स्रोत बस एक-दूसरे की बात दोहरा रहे हैं।

यही वह बात है जो CIRIS को अन्य AI जवाबदेही ढाँचों से अलग करती है।

गणित चाहिए? पूरा शोध पढ़ें →

मौजूदा परिदृश्य

अलग-अलग परियोजनाएं, अलग-अलग लक्ष्य।

फरवरी 2026 तक उपलब्ध सार्वजनिक दस्तावेज़ीकरण के आधार पर। अगर हमसे कुछ छूट गया या कुछ गलत हुआ, हमें बताएं

परियोजनाहर फैसला जाँचता हैप्रकाशित नियमविवेक अंतर्निहितउसने क्या किया इसका प्रमाणओपन सोर्सइको चैंबर पहचान
CIRISहाँहाँहाँहाँAGPL-3.0हाँ
Constitutional AIकेवल प्रशिक्षण मेंअप्रत्यक्षनहींनहींनहींनहीं
LlamaFirewall / NeMo Guardrailsहाँनहींनहींलॉगिंगहाँनहीं
HatCatहाँआंशिकस्टीयरिंगआंशिकCC0नहीं
नैतिकता बोर्ड / शासन ढाँचेनहींहाँनहींमैन्युअलअलग-अलगनहीं

आउटपुट फिल्टर और शासन ढाँचे महत्वपूर्ण लेकिन अलग-अलग समस्याएं हल करते हैं। फिल्टर हानिकारक आउटपुट रोकते हैं। विवेक मूल्यों के बारे में सोचता है। CIRIS का लक्ष्य दोनों करना है, और उन अंधे कोनों को पकड़ना है जिन्हें दोनों में से कोई भी अकेले नहीं संभालता।

सुरक्षा की तीन परतें

हर एक एक अलग समस्या हल करती है।

आउटपुट फिल्टर

खतरनाक आउटपुट रोकें: प्रॉम्प्ट इंजेक्शन, हानिकारक सामग्री, विरोधाभासी हमले। जैसे एक फिल्टर जो बाहर जाते समय बुरी चीज़ें पकड़ता है।

नैतिक विवेक

यह सोचता है कि कोई कार्रवाई सही है या नहीं, न केवल यह कि वह सुरक्षित है या नहीं। जैसे एक न्यायाधीश जो फैसला करने से पहले स्थिति का मूल्यांकन करता है।

इको चैंबर पहचान

जाँचता है कि सहमति वास्तविक है या केवल दोहराव। जैसे एक तथ्य-जाँचकर्ता जो पूछता है 'क्या आप सभी ने एक ही लेख पढ़ा?'

कई सुसंगत एजेंट

वितरित शासन, केंद्रित शक्ति नहीं।

कोई एकल विफलता बिंदु नहीं

छोटे एजेंट, हर एक जवाबदेह।

कई छोटे एजेंट, हर एक प्रकाशित सिद्धांतों से बंधे, हर एक ऑडिट करने योग्य, हर एक मानव अधिकार को सौंपने वाला। कोई एक कंपनी या संस्था पूरे ढाँचे को नियंत्रित नहीं करती। एजेंट जितने स्वतंत्र होते हैं, उतना ही कठिन होता है कि किसी एक विफलता का असर फैले।

शोध की स्थिति

यह सक्रिय शोध है। हम इस बारे में पारदर्शी हैं कि क्या स्थापित है और क्या अभी भी परीक्षण में है।

अच्छी तरह स्थापित

  • - नकल किए गए स्रोत वास्तविक विविधता कम करते हैं
  • - AI मॉडल प्रशिक्षण डेटा साझा करते हैं
  • - इको चैंबर झूठा आत्मविश्वास पैदा करते हैं
  • - स्वतंत्र सत्यापन अधिक त्रुटियाँ पकड़ता है

अभी भी परीक्षण में

  • - AI स्रोत कितने कॉपी किए गए हैं, यह सटीक रूप से मापना
  • - इको चैंबर चिह्नित करने की सर्वोत्तम सीमाएं
  • - हस्तक्षेप नकल कैसे कम करते हैं
  • - यह विभिन्न क्षेत्रों में कैसे अलग-अलग होता है

खुद आज़माएं

खुद सत्यापित करें।

ओपन सोर्स। जाँच के लिए खुला।

इस पेज पर हर दावे के पीछे वह कोड है जिसे आप पढ़ सकते हैं, ट्रेस जिन्हें आप सत्यापित कर सकते हैं, और शोध जिसे आप जाँच सकते हैं। यही तो बात है।