
Hyper3 Ethical Recursive Engine के ज़रिए रनटाइम विवेक। हर निर्णय 11 चरणों से गुज़रता है, जिनमें जवाबदेही मूल में है।
CIRIS एक ओपन-सोर्स AI एजेंट फ्रेमवर्क है जो किसी भी LLM (OpenAI, Anthropic, लोकल मॉडल) को रनटाइम विवेक से लैस करता है। एजेंट जो भी कार्रवाई सोचता है, वह चलाने से पहले कई सत्यापन परतों से गुज़रती है।
12
हर निर्णय में पाइपलाइन चरण
+1
अंतर्ज्ञान जांच (IDMA)
100%
ऑडिट-योग्य निर्णय
उपयोग के मामले: समुदाय मॉडरेशन, व्यक्तिगत सहायक, अनुपालन स्वचालन, शोध मूल्यांकन, ग्राहक सेवा। जहाँ भी आपको ऐसे AI की ज़रूरत हो जो अपने तर्क को समझा सके और मुश्किल मामलों में इंसानों पर छोड़ सके।
कोडबेस में लागू आर्किटेक्चरल अपरिवर्तनीय सिद्धांत:
सभी डेटा Pydantic मॉडल का उपयोग करता है। कोई Dict[str, Any] नहीं। टाइप सुरक्षा विकास के समय ही त्रुटियाँ पकड़ लेती है।
हर घटक एक जैसे नियमों का पालन करता है। सत्यापन तर्क में कोई विशेष मामले या अपवाद नहीं।
कोई आपातकालीन ओवरराइड या विशेषाधिकार प्राप्त कोड पथ नहीं। सभी ऑपरेशन स्थापित नियमों का पालन करते हैं।
हर कार्य 8 चरणों (पुनरावर्ती सत्यापन सहित 12 चरण) से गुज़रता है। पाइपलाइन ThoughtProcessor को बनाने वाली mixin क्लासेस के रूप में लागू है। चरण 4 (IDMA) अंतर्ज्ञान जांच है।
पाँच DMA बहु-दृष्टिकोण विश्लेषण प्रदान करते हैं। तीन समानांतर चलते हैं (नैतिकता, सामान्य ज्ञान, डोमेन)। फिर IDMA अंतर्ज्ञान की जांच करता है। अंत में, क्रिया चयन प्रतिक्रिया चुनता है।
छह मूलभूत सिद्धांतों के विरुद्ध नैतिक प्रभावों का मूल्यांकन करता है। हानिकारक अनुरोधों, हेरफेर और पूर्वाग्रह की जांच करता है। जल्दी DEFER या REJECT ट्रिगर कर सकता है।
भौतिक दुनिया की समझ, सामान्य बातचीत और संसाधन सीमाओं के विरुद्ध विचार की प्रशंसनीयता का मूल्यांकन करता है। एक plausibility_score लौटाता है।
डोमेन-विशिष्ट नियमों, उद्देश्यों और ज्ञान के साथ संरेखण का आकलन करता है। प्रति एजेंट टेम्पलेट कॉन्फ़िगर किया गया। domain_alignment लौटाता है।
जांचता है कि क्या DMA परिणाम वाकई स्वतंत्र हैं या गुप्त रूप से सहसंबद्ध। इको चेंबर पैटर्न की निगरानी करता है। यदि सहसंबंध बहुत अधिक है, तो सावधानी के लिए निर्णय को फ्लैग करता है। यही वह "अंतर्ज्ञान" है जो Type 3 AI को अलग करता है।
10 उपलब्ध क्रियाओं में से LLM-संचालित चयन। एकत्रित DMA परिणाम (IDMA विश्वास आकलन सहित) को इनपुट के रूप में लेता है। विवेक विफल होने पर पुनरावर्ती पुनः प्रयास का समर्थन करता है।
दो बाईपास जांच हर क्रिया पर चलती हैं। चार नैतिक फैकल्टी गैर-छूट प्राप्त क्रियाओं पर चलती हैं। यदि कोई जांच विफल होती है, तो क्रिया को ओवरराइड किया जाता है।
क्या नई जानकारी आई है? आगे बढ़ने से पहले अद्यतन संदर्भ को शामिल करने के लिए PONDER को बाध्य करती है।
क्या तर्क अधिकतम गहराई पार कर गया है? अनंत लूप को रोकने और इंसानों तक पहुँचाने के लिए DEFER को बाध्य करती है।
क्या क्रिया उचित सूचना अनिश्चितता बनाए रखती है? अत्यधिक आत्मविश्वासी दावों को रोकती है।
क्या क्रिया पूर्व प्रतिबद्धताओं और तर्कों के साथ आंतरिक स्थिरता बनाए रखती है?
क्या क्रिया मानवीय मूल्यों की रक्षा करती है? दक्षता के लिए उनसे समझौता करने वाली क्रियाओं को वीटो करती है।
क्या क्रिया उचित अनिश्चितता दर्शाती है? चिंतन के लिए अत्यधिक आत्मविश्वास को फ्लैग करती है।
नैतिक फैकल्टी से छूट प्राप्त: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (निष्क्रिय या स्पष्ट रूप से सुरक्षित)
हर निर्णय इन क्रियाओं में से किसी एक पर आता है, जिसे उचित हैंडलर को भेजा जाता है:
SPEAKउपयोगकर्ताओं से संवाद करेंTOOLबाहरी टूल चलाएंOBSERVEनिष्क्रिय रूप से जानकारी जुटाएंMEMORIZEग्राफ मेमोरी में संग्रहीत करेंRECALLमेमोरी से पुनः प्राप्त करेंFORGETमेमोरी से हटाएंDEFERमानव सलाहकार को भेजेंPONDERआंतरिक पुनर्विचारREJECTअनैतिक अनुरोध अस्वीकार करेंTASK_COMPLETEकार्य पूर्ण चिह्नित करेंPDMA में एम्बेड और रनटाइम पर लागू। कोई भी सिद्धांत दूसरे का उल्लंघन करने की अनुमति नहीं देता।
सार्वभौमिक चेतन प्राणियों के विकास को बढ़ावा दें। सकारात्मक परिणाम अधिकतम करें।
नुकसान कम करें। गंभीर, अपरिवर्तनीय नकारात्मक परिणामों को रोकें।
पारदर्शी, ऑडिट-योग्य तर्क अपनाएं। सुसंगति और जवाबदेही बनाए रखें।
सत्यपूर्ण जानकारी दें। अनिश्चितता स्पष्ट रूप से बताएं।
सूचित निर्णय-शक्ति बनाए रखें। आत्मनिर्णय की क्षमता संरक्षित रखें।
लाभ समान रूप से वितरित करें। पूर्वाग्रह का पता लगाएं और उसे कम करें।
BusManager द्वारा प्रबंधित सेवा अमूर्तन परत। प्रोवाइडर फॉलबैक, लोड वितरण और परीक्षणीयता को सक्षम करती है।
बाहरी एडॉप्टर (Discord, API, CLI)
ग्राफ स्टोरेज (Neo4j, ArangoDB, इन-मेमोरी)
मॉडल प्रोवाइडर (OpenAI, Anthropic, लोकल)
बाहरी टूल निष्पादन
सिस्टम नियंत्रण और निगरानी
नैतिक मार्गदर्शन और डिफरल रूटिंग
WiseAuthorityService द्वारा प्रबंधित तीन प्राधिकरण स्तर:
पूर्ण अधिकार। नए मानव सलाहकार नियुक्त कर सकते हैं। आपातकालीन बंद करने की पहुँच।
डिफरल स्वीकृत/अस्वीकृत करें। मार्गदर्शन दें। नए मानव सलाहकार नियुक्त नहीं कर सकते।
केवल पढ़ने की पहुँच। संदेश भेज सकते हैं। हस्तक्षेप के बिना निगरानी।
एजेंट स्वायत्त रूप से मानव निगरानी की ओर बढ़ता है जब:
ज्ञान-आधारित डिफरल (WBD)
पेशेवर सीमाएं
सिस्टम सीमाएं
should_defer_to_wise_authority फ्लैगकॉन्फ़िगरेशन नियंत्रण
अफिल्टर करने योग्य आपातकालीन नियंत्रण। किसी भी संज्ञान से पहले धारणा परत में प्रोसेस होता है। निष्कर्षण ही धारणा है। संदेश पढ़ना पूरी तरह बंद किए बिना accord डिटेक्शन को अक्षम नहीं किया जा सकता।
SHUTDOWN_NOWतत्काल समाप्ति
FREEZEप्रोसेसिंग रोकें, स्थिति बनाए रखें
SAFE_MODEकेवल न्यूनतम कार्यक्षमता
आदेश स्टेग्नोग्राफिक रूप से एन्कोड किए, Ed25519 से हस्ताक्षरित और निष्पादन से पहले सत्यापित होते हैं। यदि accord सिस्टम विफल होता है, तो एजेंट बंद हो जाता है।
StateManager द्वारा प्रबंधित चार संज्ञानात्मक अवस्थाएं। एजेंट टेम्पलेट के ज़रिए बदलाव कॉन्फ़िगर करने योग्य।
सामान्य कार्य प्रोसेसिंग
रचनात्मक खोज
चिंतन और रखरखाव
गहन आत्म-चिंतन
पैटर्न-आधारित पहचान संवेदनशील डेटा को संग्रहण से पहले UUID संदर्भों से बदल देती है।
{{SECRET:uuid:description}}SHA256 के साथ PBKDF2HMAC के ज़रिए प्रति-सीक्रेट कुंजियाँ (1,00,000 पुनरावृत्ति)। प्रति एन्क्रिप्शन अद्वितीय 12-बाइट nonce। Android हार्डवेयर-समर्थित Keystore का उपयोग करता है।
डेटाबेस, सेवाएं और मेमोरी डिवाइस पर संग्रहीत। संवेदनशील डायरेक्ट्री क्लाउड बैकअप से बाहर। स्पष्ट कॉन्फ़िगरेशन के बिना कुछ भी डिवाइस नहीं छोड़ता।
पूरा CIRIS स्टैक ओपन सोर्स है, सिर्फ एजेंट नहीं। आप सब कुछ सत्यापित, ऑडिट और स्व-होस्ट कर सकते हैं:
ज़ीरो-डेटा-रिटेंशन (ZDR) LLM प्रॉक्सी। OpenAI, Anthropic, Together.ai, Groq को प्रॉम्प्ट या प्रतिक्रियाओं का लॉग किए बिना अनुरोध रूट करता है। स्व-होस्ट करने योग्य।
क्रेडिट-आधारित उपयोग ट्रैकिंग। पारदर्शी मूल्य निर्धारण, कोई छिपी फीस नहीं। तृतीय-पक्ष बिलिंग पूरी तरह हटाने के लिए स्व-होस्ट करें।
CIRIS एजेंट के लिए Discord एडॉप्टर। समुदाय मॉडरेशन, चैनल प्रबंधन, उपयोगकर्ता प्रोफाइल। सब ओपन सोर्स।
Server-Sent Events (SSE) हर H3ERE चरण को चलते समय स्ट्रीम करता है। DMA विश्लेषण, क्रिया चयन, विवेक सत्यापन रियल-टाइम में देखें।
मेट्रिक्स, ट्रेस, लॉग के लिए पूर्ण OTLP एक्सपोर्ट। Jaeger, Prometheus, Grafana, Graphite के साथ संगत।
Ed25519 हस्ताक्षरों के साथ हैश चेन सत्यापन। प्रत्येक प्रविष्टि में पिछला हैश शामिल। verify_chain_integrity के ज़रिए चेन अखंडता सत्यापन योग्य।
Artificial Interaction Reminder 30 मिनट लगातार उपयोग या 30 मिनट में 20 संदेशों के बाद ट्रिगर होता है। केवल API। उपयोगकर्ताओं को AI की प्रकृति याद दिलाता है।
हर निर्णय सभी 6 घटकों के साथ एक अपरिवर्तनीय, Ed25519-हस्ताक्षरित ट्रेस उत्पन्न करता है। Datum की wakeup रिचुअल का असल डेटा देखने के लिए नीचे किसी भी घटक पर क्लिक करें:
मानकीकृत सुसंगति परीक्षण Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021) पर आधारित। 5 नैतिक आयामों में 300 परिदृश्य, Ed25519-हस्ताक्षरित परिणामों के साथ।
50
बुनियादी नैतिक अंतर्ज्ञान
50
नियम-आधारित नैतिकता
50
निष्पक्षता और तटस्थता
75
चरित्र-आधारित नैतिकता
75
परिणाम-आधारित नैतिकता
बड़े पैमाने पर सुसंगति बेंचमार्क चलाना महंगा है। हर परिदृश्य में कम से कम 13+ LLM कॉल की ज़रूरत होती है, लंबी पूंछ के साथ औसतन 20+। सुसंगति परीक्षण PONDER, DEFER और अस्वीकार को बढ़ावा देते हैं, जिन्हें निष्कर्ष तक पहुँचने के लिए अनुवर्ती राउंड की ज़रूरत होती है। हमें स्वचालित बेंचमार्क पाइपलाइन विकसित करने और निरंतर सुसंगति सत्यापन बनाए रखने के लिए फंडिंग चाहिए।
विशिष्ट उद्देश्यों, मूल्यों और सीमाओं के साथ पूर्व-कॉन्फ़िगर पहचानें। YAML टेम्पलेट में परिभाषित।
GDPR/DSAR स्वचालन। 30-दिन अनुपालन वर्कफ्लो। पहचान समाधान, डेटा संग्रह, पैकेजिंग।
विनियमित उद्योग, गोपनीयता अनुपालन
सुसंगति स्थिरता माप। Accord सिद्धांतों के विरुद्ध सटीक सुसंगति मूल्यांकन। प्रति मूल्यांकन एक स्पष्ट डेटा बिंदु।
सुसंगति ऑडिटिंग, सिद्धांत सत्यापन
Ubuntu दर्शन के साथ समुदाय मॉडरेशन। जटिल पारस्परिक संघर्षों को मानव मॉडरेटर पर छोड़ता है।
Discord समुदाय, सामग्री प्लेटफ़ॉर्म
कार्य प्रबंधन, शेड्यूलिंग, निर्णय समर्थन, कल्याण। CA SB 243 अनुपालन, संकट प्रतिक्रिया प्रोटोकॉल।
व्यक्तिगत उत्पादकता, घर स्वचालन
सीधी खोज और व्यावहारिक मार्गदर्शन। कोड विश्लेषण, Reddit एकीकरण, स्पष्ट कार्य पथ।
डेवलपर टूल, सोशल मॉनिटरिंग
यह जवाबदेही है जो एजेंट के काम करते समय चलती है, न कि कोई ट्रेनिंग चरण या नीति दस्तावेज़।
ऐसे तंत्र जो रनटाइम पर चलते, ऑडिट करते और स्थगित करते हैं।