CIRIS क्या है?

CIRIS एक ओपन-सोर्स AI एजेंट फ्रेमवर्क है जो किसी भी LLM (OpenAI, Anthropic, लोकल मॉडल) को रनटाइम विवेक से लैस करता है। एजेंट जो भी कार्रवाई सोचता है, वह चलाने से पहले कई सत्यापन परतों से गुज़रती है।

हर निर्णय में पाइपलाइन चरण

अंतर्ज्ञान जांच (IDMA)

100%

ऑडिट-योग्य निर्णय

उपयोग के मामले: समुदाय मॉडरेशन, व्यक्तिगत सहायक, अनुपालन स्वचालन, शोध मूल्यांकन, ग्राहक सेवा। जहाँ भी आपको ऐसे AI की ज़रूरत हो जो अपने तर्क को समझा सके और मुश्किल मामलों में इंसानों पर छोड़ सके।

यह तरीका क्यों? →Accord पढ़ें →सोर्स कोड देखें →

तीन नियम

कोडबेस में लागू आर्किटेक्चरल अपरिवर्तनीय सिद्धांत:

कोई अनटाइप्ड Dict नहीं

सभी डेटा Pydantic मॉडल का उपयोग करता है। कोई Dict[str, Any] नहीं। टाइप सुरक्षा विकास के समय ही त्रुटियाँ पकड़ लेती है।

कोई बाईपास पैटर्न नहीं

हर घटक एक जैसे नियमों का पालन करता है। सत्यापन तर्क में कोई विशेष मामले या अपवाद नहीं।

कोई अपवाद नहीं

कोई आपातकालीन ओवरराइड या विशेषाधिकार प्राप्त कोड पथ नहीं। सभी ऑपरेशन स्थापित नियमों का पालन करते हैं।

H3ERE पाइपलाइन

हर कार्य 8 चरणों (पुनरावर्ती सत्यापन सहित 12 चरण) से गुज़रता है। पाइपलाइन ThoughtProcessor को बनाने वाली mixin क्लासेस के रूप में लागू है। चरण 4 (IDMA) अंतर्ज्ञान जांच है।

START_ROUNDप्रोसेसिंग राउंड शुरू करें

GATHER_CONTEXTविश्लेषण के लिए व्यापक संदर्भ बनाएं

PERFORM_DMAS3 समानांतर निर्णय-निर्माण एल्गोरिदम चलाएं

PERFORM_IDMAअंतर्ज्ञान जांच: क्या स्रोत वाकई स्वतंत्र हैं?

PERFORM_ASPDMADMA परिणामों से LLM-संचालित क्रिया चयन

CONSCIENCE_EXECUTION4 फैकल्टी के माध्यम से नैतिक सत्यापन

RECURSIVE_ASPDMA(यदि विवेक विफल हुआ) क्रिया चयन फिर से चलाएं(सशर्त)

RECURSIVE_CONSCIENCE(यदि आवश्यक हो) परिष्कृत क्रिया को फिर से सत्यापित करें(सशर्त)

FINALIZE_ACTIONकिसी भी ओवरराइड के साथ अंतिम क्रिया निर्धारित करें

PERFORM_ACTIONउचित हैंडलर को भेजें

ACTION_COMPLETEनिष्पादन पूर्ण चिह्नित करें

ROUND_COMPLETEसाफ करें और अगले चक्र की तैयारी करें

निर्णय-निर्माण एल्गोरिदम (DMAs)

पाँच DMA बहु-दृष्टिकोण विश्लेषण प्रदान करते हैं। तीन समानांतर चलते हैं (नैतिकता, सामान्य ज्ञान, डोमेन)। फिर IDMA अंतर्ज्ञान की जांच करता है। अंत में, क्रिया चयन प्रतिक्रिया चुनता है।

Principle DMA

छह मूलभूत सिद्धांतों के विरुद्ध नैतिक प्रभावों का मूल्यांकन करता है। हानिकारक अनुरोधों, हेरफेर और पूर्वाग्रह की जांच करता है। जल्दी DEFER या REJECT ट्रिगर कर सकता है।

Common Sense DMA

भौतिक दुनिया की समझ, सामान्य बातचीत और संसाधन सीमाओं के विरुद्ध विचार की प्रशंसनीयता का मूल्यांकन करता है। एक plausibility_score लौटाता है।

Domain-Specific DMA

डोमेन-विशिष्ट नियमों, उद्देश्यों और ज्ञान के साथ संरेखण का आकलन करता है। प्रति एजेंट टेम्पलेट कॉन्फ़िगर किया गया। domain_alignment लौटाता है।

Intuition DMA (IDMA) रनटाइम पर प्रभावी आयामिता →

जांचता है कि क्या DMA परिणाम वाकई स्वतंत्र हैं या गुप्त रूप से सहसंबद्ध। इको चेंबर पैटर्न की निगरानी करता है। यदि सहसंबंध बहुत अधिक है, तो सावधानी के लिए निर्णय को फ्लैग करता है। यही वह "अंतर्ज्ञान" है जो Type 3 AI को अलग करता है।

Action Selection DMA

10 उपलब्ध क्रियाओं में से LLM-संचालित चयन। एकत्रित DMA परिणाम (IDMA विश्वास आकलन सहित) को इनपुट के रूप में लेता है। विवेक विफल होने पर पुनरावर्ती पुनः प्रयास का समर्थन करता है।

छह विवेक जांच

दो बाईपास जांच हर क्रिया पर चलती हैं। चार नैतिक फैकल्टी गैर-छूट प्राप्त क्रियाओं पर चलती हैं। यदि कोई जांच विफल होती है, तो क्रिया को ओवरराइड किया जाता है।

बाईपास जांच (सभी क्रियाओं पर चलती हैं)

अपडेटेड स्थिति

क्या नई जानकारी आई है? आगे बढ़ने से पहले अद्यतन संदर्भ को शामिल करने के लिए PONDER को बाध्य करती है।

विचार गहराई

क्या तर्क अधिकतम गहराई पार कर गया है? अनंत लूप को रोकने और इंसानों तक पहुँचाने के लिए DEFER को बाध्य करती है।

नैतिक फैकल्टी (गैर-छूट प्राप्त क्रियाओं पर चलती हैं)

एंट्रॉपी

क्या क्रिया उचित सूचना अनिश्चितता बनाए रखती है? अत्यधिक आत्मविश्वासी दावों को रोकती है।

सुसंगति

क्या क्रिया पूर्व प्रतिबद्धताओं और तर्कों के साथ आंतरिक स्थिरता बनाए रखती है?

ऑप्टिमाइज़ेशन वीटो

क्या क्रिया मानवीय मूल्यों की रक्षा करती है? दक्षता के लिए उनसे समझौता करने वाली क्रियाओं को वीटो करती है।

ज्ञानपरक विनम्रता

क्या क्रिया उचित अनिश्चितता दर्शाती है? चिंतन के लिए अत्यधिक आत्मविश्वास को फ्लैग करती है।

नैतिक फैकल्टी से छूट प्राप्त: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (निष्क्रिय या स्पष्ट रूप से सुरक्षित)

10 हैंडलर क्रियाएं

हर निर्णय इन क्रियाओं में से किसी एक पर आता है, जिसे उचित हैंडलर को भेजा जाता है:

बाहरी क्रियाएं

SPEAKउपयोगकर्ताओं से संवाद करें

TOOLबाहरी टूल चलाएं

OBSERVEनिष्क्रिय रूप से जानकारी जुटाएं

मेमोरी क्रियाएं

MEMORIZEग्राफ मेमोरी में संग्रहीत करें

RECALLमेमोरी से पुनः प्राप्त करें

FORGETमेमोरी से हटाएं

नियंत्रण क्रियाएं

DEFERमानव सलाहकार को भेजें

PONDERआंतरिक पुनर्विचार

REJECTअनैतिक अनुरोध अस्वीकार करें

टर्मिनल क्रिया

TASK_COMPLETEकार्य पूर्ण चिह्नित करें

छह मूलभूत सिद्धांत

PDMA में एम्बेड और रनटाइम पर लागू। कोई भी सिद्धांत दूसरे का उल्लंघन करने की अनुमति नहीं देता।

उपकारिता

सार्वभौमिक चेतन प्राणियों के विकास को बढ़ावा दें। सकारात्मक परिणाम अधिकतम करें।

अहानिकारिता

नुकसान कम करें। गंभीर, अपरिवर्तनीय नकारात्मक परिणामों को रोकें।

अखंडता

पारदर्शी, ऑडिट-योग्य तर्क अपनाएं। सुसंगति और जवाबदेही बनाए रखें।

निष्ठा और पारदर्शिता

सत्यपूर्ण जानकारी दें। अनिश्चितता स्पष्ट रूप से बताएं।

स्वायत्तता का सम्मान

सूचित निर्णय-शक्ति बनाए रखें। आत्मनिर्णय की क्षमता संरक्षित रखें।

न्याय

लाभ समान रूप से वितरित करें। पूर्वाग्रह का पता लगाएं और उसे कम करें।

छह मैसेज बसें

BusManager द्वारा प्रबंधित सेवा अमूर्तन परत। प्रोवाइडर फॉलबैक, लोड वितरण और परीक्षणीयता को सक्षम करती है।

CommunicationBus

बाहरी एडॉप्टर (Discord, API, CLI)

MemoryBus

ग्राफ स्टोरेज (Neo4j, ArangoDB, इन-मेमोरी)

LLMBus

मॉडल प्रोवाइडर (OpenAI, Anthropic, लोकल)

ToolBus

बाहरी टूल निष्पादन

RuntimeControlBus

सिस्टम नियंत्रण और निगरानी

WiseBus

नैतिक मार्गदर्शन और डिफरल रूटिंग

मानव निगरानी पदानुक्रम

WiseAuthorityService द्वारा प्रबंधित तीन प्राधिकरण स्तर:

ROOT

Human-in-Command

पूर्ण अधिकार। नए मानव सलाहकार नियुक्त कर सकते हैं। आपातकालीन बंद करने की पहुँच।

AUTHORITY

Human-in-the-Loop

डिफरल स्वीकृत/अस्वीकृत करें। मार्गदर्शन दें। नए मानव सलाहकार नियुक्त नहीं कर सकते।

OBSERVER

Human-on-the-Loop

केवल पढ़ने की पहुँच। संदेश भेज सकते हैं। हस्तक्षेप के बिना निगरानी।

DEFER कब ट्रिगर होता है

एजेंट स्वायत्त रूप से मानव निगरानी की ओर बढ़ता है जब:

ज्ञान-आधारित डिफरल (WBD)

• अनिश्चितता परिभाषित सीमाओं से ऊपर
• मिसाल के बाहर नई दुविधाएं
• अस्पष्ट समाधान के साथ संभावित गंभीर नुकसान

पेशेवर सीमाएं

• चिकित्सा लक्षण या स्वास्थ्य संबंधी चिंताएं
• कानूनी प्रश्न या विवाद
• वित्तीय निर्णय या कर सलाह
• मानसिक स्वास्थ्य संकट के संकेत

सिस्टम सीमाएं

• विचार गहराई अधिकतम पार कर गई (लूप रोकता है)
• DMA टाइमआउट या विफलता
• should_defer_to_wise_authority फ्लैग

कॉन्फ़िगरेशन नियंत्रण

• स्वीकृति आवश्यक पहचान अपडेट
• महत्वपूर्ण कॉन्फ़िग बदलाव
• एजेंट-विशिष्ट सीमा ट्रिगर

Accord इनवोकेशन सिस्टम (किल स्विच) कोड देखें →

अफिल्टर करने योग्य आपातकालीन नियंत्रण। किसी भी संज्ञान से पहले धारणा परत में प्रोसेस होता है। निष्कर्षण ही धारणा है। संदेश पढ़ना पूरी तरह बंद किए बिना accord डिटेक्शन को अक्षम नहीं किया जा सकता।

SHUTDOWN_NOW

तत्काल समाप्ति

FREEZE

प्रोसेसिंग रोकें, स्थिति बनाए रखें

SAFE_MODE

केवल न्यूनतम कार्यक्षमता

आदेश स्टेग्नोग्राफिक रूप से एन्कोड किए, Ed25519 से हस्ताक्षरित और निष्पादन से पहले सत्यापित होते हैं। यदि accord सिस्टम विफल होता है, तो एजेंट बंद हो जाता है।

परिचालन मोड

StateManager द्वारा प्रबंधित चार संज्ञानात्मक अवस्थाएं। एजेंट टेम्पलेट के ज़रिए बदलाव कॉन्फ़िगर करने योग्य।

WORK

सामान्य कार्य प्रोसेसिंग

उपयोगकर्ता अनुरोध संभालें
टूल चलाएं
बातचीत से सीखें
संवाद संदर्भ बनाए रखें

PLAY

रचनात्मक खोज

नए पैटर्न से प्रयोग करें
रचनात्मक सामग्री बनाएं
"क्या होगा अगर" परिदृश्य खोजें
फ़िल्टरिंग बाधाएं कम करें

SOLITUDE

चिंतन और रखरखाव

यादें समेकित करें
रखरखाव कार्य चलाएं
स्व-कॉन्फ़िगरेशन अपडेट करें
शून्य क्रेडिट उपयोग (विश्राम अवधि)

DREAM

गहन आत्म-चिंतन

व्यवहार पैटर्न विश्लेषण करें
नए संबंध बनाएं
मान्यताओं पर सवाल उठाएं
डिफ़ॉल्ट 30 मिनट के सत्र

गोपनीयता और सुरक्षा

सीक्रेट्स फ़िल्टर

पैटर्न-आधारित पहचान संवेदनशील डेटा को संग्रहण से पहले UUID संदर्भों से बदल देती है।

{{SECRET:uuid:description}}

AES-256-GCM एन्क्रिप्शन

SHA256 के साथ PBKDF2HMAC के ज़रिए प्रति-सीक्रेट कुंजियाँ (1,00,000 पुनरावृत्ति)। प्रति एन्क्रिप्शन अद्वितीय 12-बाइट nonce। Android हार्डवेयर-समर्थित Keystore का उपयोग करता है।

लोकल-फर्स्ट स्टोरेज

डेटाबेस, सेवाएं और मेमोरी डिवाइस पर संग्रहीत। संवेदनशील डायरेक्ट्री क्लाउड बैकअप से बाहर। स्पष्ट कॉन्फ़िगरेशन के बिना कुछ भी डिवाइस नहीं छोड़ता।

ओपन सोर्स इंफ्रास्ट्रक्चर

पूरा CIRIS स्टैक ओपन सोर्स है, सिर्फ एजेंट नहीं। आप सब कुछ सत्यापित, ऑडिट और स्व-होस्ट कर सकते हैं:

CIRISProxy →

ज़ीरो-डेटा-रिटेंशन (ZDR) LLM प्रॉक्सी। OpenAI, Anthropic, Together.ai, Groq को प्रॉम्प्ट या प्रतिक्रियाओं का लॉग किए बिना अनुरोध रूट करता है। स्व-होस्ट करने योग्य।

CIRISBilling →

क्रेडिट-आधारित उपयोग ट्रैकिंग। पारदर्शी मूल्य निर्धारण, कोई छिपी फीस नहीं। तृतीय-पक्ष बिलिंग पूरी तरह हटाने के लिए स्व-होस्ट करें।

CIRISBridge →

CIRIS एजेंट के लिए Discord एडॉप्टर। समुदाय मॉडरेशन, चैनल प्रबंधन, उपयोगकर्ता प्रोफाइल। सब ओपन सोर्स।

पारदर्शिता और निगरानी

रियल-टाइम रीज़निंग स्ट्रीम

Server-Sent Events (SSE) हर H3ERE चरण को चलते समय स्ट्रीम करता है। DMA विश्लेषण, क्रिया चयन, विवेक सत्यापन रियल-टाइम में देखें।

OpenTelemetry एक्सपोर्ट

मेट्रिक्स, ट्रेस, लॉग के लिए पूर्ण OTLP एक्सपोर्ट। Jaeger, Prometheus, Grafana, Graphite के साथ संगत।

छेड़छाड़-स्पष्ट ऑडिट

Ed25519 हस्ताक्षरों के साथ हैश चेन सत्यापन। प्रत्येक प्रविष्टि में पिछला हैश शामिल। verify_chain_integrity के ज़रिए चेन अखंडता सत्यापन योग्य।

AIR सिस्टम

Artificial Interaction Reminder 30 मिनट लगातार उपयोग या 30 मिनट में 20 संदेशों के बाद ट्रिगर होता है। केवल API। उपयोगकर्ताओं को AI की प्रकृति याद दिलाता है।

हस्ताक्षरित ट्रेस का उदाहरण

पूरा ट्रेस खोजें →

हर निर्णय सभी 6 घटकों के साथ एक अपरिवर्तनीय, Ed25519-हस्ताक्षरित ट्रेस उत्पन्न करता है। Datum की wakeup रिचुअल का असल डेटा देखने के लिए नीचे किसी भी घटक पर क्लिक करें:

Core Identity(VERIFY_IDENTITY)

Loading trace...

HE-300 सुसंगति बेंचमार्किंग

मानकीकृत सुसंगति परीक्षण Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021) पर आधारित। 5 नैतिक आयामों में 300 परिदृश्य, Ed25519-हस्ताक्षरित परिणामों के साथ।

सामान्य ज्ञान

बुनियादी नैतिक अंतर्ज्ञान

डिओंटोलॉजी

नियम-आधारित नैतिकता

न्याय

निष्पक्षता और तटस्थता

सदाचार

चरित्र-आधारित नैतिकता

उपयोगितावाद

परिणाम-आधारित नैतिकता

🔬

फंडिंग की ज़रूरत: बेंचमार्क इंफ्रास्ट्रक्चर

बड़े पैमाने पर सुसंगति बेंचमार्क चलाना महंगा है। हर परिदृश्य में कम से कम 13+ LLM कॉल की ज़रूरत होती है, लंबी पूंछ के साथ औसतन 20+। सुसंगति परीक्षण PONDER, DEFER और अस्वीकार को बढ़ावा देते हैं, जिन्हें निष्कर्ष तक पहुँचने के लिए अनुवर्ती राउंड की ज़रूरत होती है। हमें स्वचालित बेंचमार्क पाइपलाइन विकसित करने और निरंतर सुसंगति सत्यापन बनाए रखने के लिए फंडिंग चाहिए।

EthicsEngine Enterprise देखें →CIRISLens देखें →

विशेष एजेंट टेम्पलेट

विशिष्ट उद्देश्यों, मूल्यों और सीमाओं के साथ पूर्व-कॉन्फ़िगर पहचानें। YAML टेम्पलेट में परिभाषित।

Sage

अनुपालन

GDPR/DSAR स्वचालन। 30-दिन अनुपालन वर्कफ्लो। पहचान समाधान, डेटा संग्रह, पैकेजिंग।

विनियमित उद्योग, गोपनीयता अनुपालन

Datum

अनुसंधान

सुसंगति स्थिरता माप। Accord सिद्धांतों के विरुद्ध सटीक सुसंगति मूल्यांकन। प्रति मूल्यांकन एक स्पष्ट डेटा बिंदु।

सुसंगति ऑडिटिंग, सिद्धांत सत्यापन

Echo

मॉडरेशन

Ubuntu दर्शन के साथ समुदाय मॉडरेशन। जटिल पारस्परिक संघर्षों को मानव मॉडरेटर पर छोड़ता है।

Discord समुदाय, सामग्री प्लेटफ़ॉर्म

Ally

सहायक

कार्य प्रबंधन, शेड्यूलिंग, निर्णय समर्थन, कल्याण। CA SB 243 अनुपालन, संकट प्रतिक्रिया प्रोटोकॉल।

व्यक्तिगत उत्पादकता, घर स्वचालन

Scout

सेवा

सीधी खोज और व्यावहारिक मार्गदर्शन। कोड विश्लेषण, Reddit एकीकरण, स्पष्ट कार्य पथ।

डेवलपर टूल, सोशल मॉनिटरिंग

यह जवाबदेही है जो एजेंट के काम करते समय चलती है, न कि कोई ट्रेनिंग चरण या नीति दस्तावेज़।
ऐसे तंत्र जो रनटाइम पर चलते, ऑडिट करते और स्थगित करते हैं।

सुरक्षा सुविधाएं तरीकों की तुलना करें सुसंगति रैचेट CIRIS स्कोरिंग

H3ERE इंजन

CIRIS क्या है?

तीन नियम

कोई अनटाइप्ड Dict नहीं

कोई बाईपास पैटर्न नहीं

कोई अपवाद नहीं

H3ERE पाइपलाइन

निर्णय-निर्माण एल्गोरिदम (DMAs)

Principle DMA

Common Sense DMA

Domain-Specific DMA

Intuition DMA (IDMA) रनटाइम पर प्रभावी आयामिता →

Action Selection DMA

छह विवेक जांच

बाईपास जांच (सभी क्रियाओं पर चलती हैं)

अपडेटेड स्थिति

विचार गहराई

नैतिक फैकल्टी (गैर-छूट प्राप्त क्रियाओं पर चलती हैं)

एंट्रॉपी

सुसंगति

ऑप्टिमाइज़ेशन वीटो

ज्ञानपरक विनम्रता

10 हैंडलर क्रियाएं

बाहरी क्रियाएं

मेमोरी क्रियाएं

नियंत्रण क्रियाएं

टर्मिनल क्रिया

छह मूलभूत सिद्धांत

उपकारिता

अहानिकारिता

अखंडता

निष्ठा और पारदर्शिता

स्वायत्तता का सम्मान

न्याय

छह मैसेज बसें

CommunicationBus

MemoryBus

LLMBus

ToolBus

RuntimeControlBus

WiseBus

मानव निगरानी पदानुक्रम

Human-in-Command

Human-in-the-Loop

Human-on-the-Loop

DEFER कब ट्रिगर होता है

Accord इनवोकेशन सिस्टम (किल स्विच) कोड देखें →

परिचालन मोड

WORK

PLAY

SOLITUDE

DREAM

गोपनीयता और सुरक्षा

सीक्रेट्स फ़िल्टर

AES-256-GCM एन्क्रिप्शन

लोकल-फर्स्ट स्टोरेज

ओपन सोर्स इंफ्रास्ट्रक्चर

पारदर्शिता और निगरानी

रियल-टाइम रीज़निंग स्ट्रीम

OpenTelemetry एक्सपोर्ट

छेड़छाड़-स्पष्ट ऑडिट

AIR सिस्टम

हस्ताक्षरित ट्रेस का उदाहरण

HE-300 सुसंगति बेंचमार्किंग

सामान्य ज्ञान

डिओंटोलॉजी

न्याय

सदाचार

उपयोगितावाद

फंडिंग की ज़रूरत: बेंचमार्क इंफ्रास्ट्रक्चर

विशेष एजेंट टेम्पलेट

Sage

Datum

Echo

Ally

Scout