CIRIS म्हणजे काय?

CIRIS हे एक ओपन-सोर्स AI एजंट फ्रेमवर्क आहे जे कोणत्याही LLM (OpenAI, Anthropic, स्थानिक मॉडेल) भोवती रनटाइम विवेक गुंडाळते. एजंट विचारात घेत असलेली प्रत्येक क्रिया अंमलबजावणीपूर्वी अनेक सत्यापन स्तरांमधून जाते.

प्रति निर्णय पाइपलाइन चरणे

अंतर्ज्ञान तपासणी (IDMA)

100%

लेखापरीक्षण करण्यायोग्य निर्णय

वापराचे प्रसंग: समुदाय नियंत्रण, वैयक्तिक सहाय्यक, अनुपालन स्वयंचलन, संशोधन मूल्यांकन, ग्राहक सेवा. जिथेही तुम्हाला असे AI हवे आहे जे आपले तर्कशास्त्र स्पष्ट करू शकेल आणि कठीण प्रसंगी मानवांकडे सोपवू शकेल.

हा दृष्टिकोन का? →करार वाचा →स्रोत कोड पहा →

तीन नियम

कोडबेसमध्ये सर्वत्र लागू केलेली आर्किटेक्चरल अपरिवर्तनीये:

कोणतेही अनटाइप्ड Dict नाहीत

सर्व डेटा Pydantic मॉडेल वापरतो. कोणताही Dict[str, Any] नाही. टाइप सुरक्षितता विकासाच्या वेळी त्रुटी पकडते.

कोणते बायपास पॅटर्न नाहीत

प्रत्येक घटक सुसंगत नियम पाळतो. सत्यापन तर्कशास्त्रात कोणतेही विशेष प्रकरण किंवा अपवाद नाहीत.

कोणते अपवाद नाहीत

कोणतेही आपत्कालीन ओव्हरराइड किंवा विशेषाधिकार प्राप्त कोड मार्ग नाहीत. सर्व ऑपरेशन स्थापित नियमांचे पालन करतात.

H3ERE पाइपलाइन

प्रत्येक कार्य 8 टप्प्यांमधून (पुनरावर्ती सत्यापनासह 12 चरणे) जाते. पाइपलाइन ThoughtProcessor रचणाऱ्या mixin वर्गांच्या रूपात लागू केली आहे. चरण 4 (IDMA) हे अंतर्ज्ञान तपासणी आहे.

START_ROUNDप्रक्रिया फेरी सुरू करा

GATHER_CONTEXTविश्लेषणासाठी सर्वसमावेशक संदर्भ तयार करा

PERFORM_DMAS3 समांतर निर्णय-निर्माण अल्गोरिदम चालवा

PERFORM_IDMAअंतर्ज्ञान तपासणी: स्रोत खरोखर स्वतंत्र आहेत का?

PERFORM_ASPDMADMA निकालांमधून LLM-संचालित कृती निवड

CONSCIENCE_EXECUTION4 विद्याशाखांद्वारे नैतिक सत्यापन

RECURSIVE_ASPDMA(विवेक अयशस्वी झाल्यास) कृती निवड पुन्हा चालवा(सशर्त)

RECURSIVE_CONSCIENCE(आवश्यक असल्यास) परिष्कृत कृतीचे पुन्हा सत्यापन करा(सशर्त)

FINALIZE_ACTIONकोणत्याही ओव्हरराइडसह अंतिम कृती निश्चित करा

PERFORM_ACTIONयोग्य हँडलरला पाठवा

ACTION_COMPLETEअंमलबजावणी पूर्ण म्हणून चिन्हांकित करा

ROUND_COMPLETEसाफसफाई करा आणि पुढ्या चक्रासाठी तयारी करा

निर्णय-निर्माण अल्गोरिदम (DMAs)

पाच DMA बहु-दृष्टिकोन विश्लेषण प्रदान करतात. तीन समांतर चालतात (नैतिकता, सामान्य बुद्धी, क्षेत्र). नंतर IDMA अंतर्ज्ञान तपासते. शेवटी, कृती निवड प्रतिसाद निवडते.

तत्त्व DMA

सहा पायाभूत तत्त्वांविरुद्ध नैतिक परिणामांचे मूल्यांकन करते. हानिकारक विनंत्या, हेराफेरी, पूर्वग्रह तपासते. लवकर DEFER किंवा REJECT सक्रिय करू शकते.

सामान्य बुद्धी DMA

भौतिक जग समज, ठराविक परस्परसंवाद आणि संसाधन मर्यादांविरुद्ध विचाराच्या प्रशंसनीयतेचे मूल्यांकन करते. plausibility_score परत करते.

क्षेत्र-विशिष्ट DMA

क्षेत्र-विशिष्ट नियम, उद्दिष्टे आणि ज्ञानाशी सुसंगततेचे मूल्यांकन करते. प्रति एजंट टेम्पलेट कॉन्फिगर केले जाते. domain_alignment परत करते.

अंतर्ज्ञान DMA (IDMA) रनटाइमवर प्रभावी आयामता →

DMA निकाल खरोखर स्वतंत्र आहेत किंवा गुप्तपणे सहसंबंधित आहेत हे तपासते. प्रतिध्वनी चेंबर नमुन्यांवर लक्ष ठेवते. जर सहसंबंध खूप जास्त असेल, तर सावधगिरीसाठी निर्णयाला ध्वजांकित करते. हेच "अंतर्ज्ञान" आहे जे टाइप 3 AI ला वेगळे करते.

कृती निवड DMA

10 उपलब्ध क्रियांमधून LLM-संचालित निवड. एकत्रित DMA निकाल (IDMA विश्वासार्हता मूल्यांकनासह) इनपुट म्हणून घेते. विवेक अयशस्वी झाल्यास पुनरावर्ती पुन्हा प्रयत्न समर्थन करते.

सहा विवेक तपासण्या

दोन बायपास तपासण्या प्रत्येक कृतीवर चालतात. चार नैतिक विद्याशाखा सूट नसलेल्या कृतींवर चालतात. कोणतीही तपासणी अयशस्वी झाल्यास, कृती रद्द केली जाते.

बायपास तपासण्या (सर्व कृतींवर चालतात)

अपडेट केलेली स्थिती

नवीन माहिती आली आहे का? पुढे जाण्यापूर्वी अपडेट केलेला संदर्भ समाविष्ट करण्यासाठी PONDER सक्ती करते.

विचार खोली

तर्कशास्त्र कमाल खोली ओलांडले का? अनंत लूप रोखण्यासाठी आणि मानवांकडे वाढवण्यासाठी DEFER सक्ती करते.

नैतिक विद्याशाखा (सूट नसलेल्या कृतींवर चालतात)

एन्ट्रॉपी

कृती योग्य माहिती अनिश्चितता राखते का? अतिआत्मविश्वासाचे दावे प्रतिबंधित करते.

सुसंगतता

कृती मागील वचनबद्धता आणि तर्कांशी अंतर्गत सुसंगतता राखते का?

ऑप्टिमायझेशन व्हेटो

कृती मानवी मूल्ये जपते का? कार्यक्षमतेसाठी त्यांच्याशी तडजोड करणाऱ्या कृतींना व्हेटो करते.

ज्ञानविषयक नम्रता

कृती योग्य अनिश्चितता दर्शवते का? विचारासाठी अतिआत्मविश्वासाला ध्वजांकित करते.

नैतिक विद्याशाखांपासून सूट: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (निष्क्रिय किंवा स्पष्टपणे सुरक्षित)

10 हँडलर कृती

प्रत्येक निर्णय या कृतींपैकी एकावर येतो, जे योग्य हँडलरला पाठवले जाते:

बाह्य कृती

SPEAKवापरकर्त्यांशी संवाद साधा

TOOLबाह्य साधने चालवा

OBSERVEनिष्क्रियपणे माहिती गोळा करा

स्मृती कृती

MEMORIZEआलेख स्मृतीमध्ये साठवा

RECALLस्मृतीमधून पुनर्प्राप्त करा

FORGETस्मृतीमधून काढून टाका

नियंत्रण कृती

DEFERशहाण्या प्राधिकरणाकडे वाढवा

PONDERअंतर्गत पुनर्विचार

REJECTअनैतिक विनंती नाकारा

टर्मिनल कृती

TASK_COMPLETEकार्य पूर्ण म्हणून चिन्हांकित करा

सहा पायाभूत तत्त्वे

PDMA मध्ये एम्बेड केलेली आणि रनटाइमवर लागू केलेली. कोणतेही तत्त्व दुसऱ्याचे उल्लंघन करण्याची परवानगी देत नाही.

हितकारिता

सर्वव्यापी सचेतन समृद्धी वाढवा. सकारात्मक परिणाम जास्तीत जास्त करा.

अहिंसा

हानी कमी करा. गंभीर, अपरिवर्तनीय नकारात्मक परिणाम टाळा.

सचोटी

पारदर्शक, लेखापरीक्षण करण्यायोग्य तर्क लागू करा. सुसंगतता आणि उत्तरदायित्व राखा.

निष्ठा आणि पारदर्शकता

सत्य माहिती द्या. अनिश्चितता स्पष्टपणे सांगा.

स्वायत्ततेचा आदर

माहितीपूर्ण स्वातंत्र्य कायम ठेवा. स्वयंनिर्णयाची क्षमता जपा.

न्याय

लाभ समानतेने वितरित करा. पूर्वग्रह शोधा आणि कमी करा.

सहा संदेश बस

BusManager द्वारे व्यवस्थापित सेवा अमूर्त स्तर. प्रदाता फॉलबॅक, लोड वितरण आणि चाचणीयोग्यता सक्षम करते.

CommunicationBus

बाह्य अडॅप्टर (Discord, API, CLI)

MemoryBus

आलेख संग्रहण (Neo4j, ArangoDB, इन-मेमरी)

LLMBus

मॉडेल प्रदाते (OpenAI, Anthropic, स्थानिक)

ToolBus

बाह्य साधन अंमलबजावणी

RuntimeControlBus

प्रणाली नियंत्रण आणि देखरेख

WiseBus

नैतिक मार्गदर्शन आणि सोपवण्याचे मार्गनिर्देशन

मानवी देखरेख श्रेणीक्रम

WiseAuthorityService द्वारे व्यवस्थापित तीन अधिकृतता स्तर:

ROOT

आदेशातील मानव

पूर्ण अधिकार. नवीन शहाणे प्राधिकरण तयार करू शकतो. आपत्कालीन बंद प्रवेश.

AUTHORITY

लूपमधील मानव

सोपवणे मंजूर/नाकारा. मार्गदर्शन द्या. नवीन WA तयार करू शकत नाही.

OBSERVER

लूपवरील मानव

केवळ-वाचन प्रवेश. संदेश पाठवू शकतो. हस्तक्षेपाशिवाय देखरेख.

DEFER कधी सक्रिय होते

एजंट स्वायत्तपणे मानवी देखरेखेकडे वाढवतो जेव्हा:

ज्ञान-आधारित सोपवणे (WBD)

• परिभाषित उंबरठ्यांपेक्षा वर अनिश्चितता
• उदाहरणापलीकडे नवीन दुविधा
• अस्पष्ट शमनासह संभाव्य गंभीर हानी

व्यावसायिक सीमा

• वैद्यकीय लक्षणे किंवा आरोग्य चिंता
• कायदेशीर प्रश्न किंवा वाद
• आर्थिक निर्णय किंवा कर सल्ला
• मानसिक आरोग्य संकट संकेत

प्रणाली सीमा

• विचार खोली कमाल ओलांडते (लूप प्रतिबंधित करते)
• DMA कालबाह्यता किंवा अपयश
• should_defer_to_wise_authority ध्वज

कॉन्फिगरेशन नियंत्रणे

• मंजुरी आवश्यक असलेले ओळख अपडेट
• महत्त्वाच्या कॉन्फिगर बदल
• एजंट-विशिष्ट सीमा ट्रिगर

करार आह्वान प्रणाली (किल स्विच) कोड पहा →

फिल्टर न करता येणारे आपत्कालीन नियंत्रण. कोणत्याही अनुभूतीपूर्वी धारणा स्तरावर प्रक्रिया करते. निष्कर्षण म्हणजेच धारणा. संदेश वाचणे पूर्णपणे अक्षम केल्याशिवाय करार शोध अक्षम करता येत नाही.

SHUTDOWN_NOW

तात्काळ समाप्ती

FREEZE

प्रक्रिया थांबवा, स्थिती राखा

SAFE_MODE

केवळ किमान कार्यक्षमता

आदेश स्टेगानोग्राफिकरित्या एन्कोड केलेले, Ed25519 स्वाक्षरी केलेले आणि अंमलबजावणीपूर्वी सत्यापित केलेले आहेत. करार प्रणाली अयशस्वी झाल्यास, एजंट बंद होतो.

ऑपरेशनल मोड

StateManager द्वारे व्यवस्थापित चार संज्ञानात्मक स्थिती. एजंट टेम्पलेटद्वारे कॉन्फिगर करण्यायोग्य संक्रमणे.

WORK

सामान्य कार्य प्रक्रिया

वापरकर्ता विनंत्या हाताळा
साधने चालवा
परस्परसंवादातून शिका
संभाषण संदर्भ राखा

PLAY

सर्जनशील अन्वेषण

नवीन नमुन्यांसह प्रयोग करा
सर्जनशील सामग्री तयार करा
"काय जर" परिस्थिती एक्सप्लोर करा
फिल्टरिंग मर्यादा कमी करा

SOLITUDE

चिंतन आणि देखभाल

आठवणी एकत्रित करा
देखभाल कार्ये चालवा
स्व-कॉन्फिगरेशन अपडेट करा
शून्य क्रेडिट वापर (विश्रांती कालावधी)

DREAM

खोल आत्मनिरीक्षण

वर्तन नमुन्यांचे विश्लेषण करा
नवीन संबंध तयार करा
गृहितके प्रश्न करा
डीफॉल्ट 30-मिनिटांचे सत्र

गोपनीयता आणि सुरक्षा

गुपिते फिल्टर

नमुना-आधारित शोध संग्रहणापूर्वी संवेदनशील डेटा UUID संदर्भांसह बदलतो.

{{SECRET:uuid:description}}

AES-256-GCM एन्क्रिप्शन

SHA256 सह PBKDF2HMAC द्वारे प्रति-गुप्त की (100,000 पुनरावृत्ती). प्रति एन्क्रिप्शन अद्वितीय 12-बाइट nonce. Android हार्डवेअर-समर्थित Keystore वापरते.

स्थानिक-प्रथम संग्रहण

डेटाबेस, सेवा आणि स्मृती डिव्हाइसवर संग्रहित. संवेदनशील निर्देशिका क्लाउड बॅकअपमधून वगळलेल्या. स्पष्ट कॉन्फिगरेशनशिवाय डिव्हाइस सोडत नाही.

ओपन सोर्स पायाभूत सुविधा

संपूर्ण CIRIS स्टॅक ओपन सोर्स आहे, केवळ एजंटच नाही. तुम्ही सर्व काही सत्यापित, लेखापरीक्षण आणि स्वयं-होस्ट करू शकता:

CIRISProxy →

शून्य-डेटा-धारण (ZDR) LLM प्रॉक्सी. प्रॉम्प्ट किंवा प्रतिसादांचे लॉगिंग न करता OpenAI, Anthropic, Together.ai, Groq कडे विनंत्या पाठवते. स्वयं-होस्ट करण्यायोग्य.

CIRISBilling →

क्रेडिट-आधारित वापर ट्रॅकिंग. पारदर्शक किंमत, कोणतेही छुपे शुल्क नाही. तृतीय-पक्ष बिलिंग पूर्णपणे काढून टाकण्यासाठी स्वयं-होस्ट करा.

CIRISBridge →

CIRIS एजंटसाठी Discord अडॅप्टर. समुदाय नियंत्रण, चॅनेल व्यवस्थापन, वापरकर्ता प्रोफाइल. सर्व ओपन सोर्स.

पारदर्शकता आणि देखरेख

रीअल-टाइम तर्क प्रवाह

सर्व्हर-सेंट इव्हेंट्स (SSE) प्रत्येक H3ERE चरण अंमलबजावणी करताना प्रवाहित करतात. DMA विश्लेषण, कृती निवड, विवेक सत्यापन रीअल-टाइममध्ये पहा.

OpenTelemetry निर्यात

मेट्रिक्स, ट्रेस, लॉगसाठी पूर्ण OTLP निर्यात. Jaeger, Prometheus, Grafana, Graphite शी सुसंगत.

छेडछाड-स्पष्ट लेखापरीक्षण

Ed25519 स्वाक्षरींसह हॅश चेन सत्यापन. प्रत्येक एंट्रीमध्ये मागील हॅश समाविष्ट आहे. चेन अखंडता verify_chain_integrity द्वारे सत्यापित करण्यायोग्य.

AIR प्रणाली

Artificial Interaction Reminder 30 मिनिटांच्या सतत वापरानंतर किंवा 30 मिनिटांत 20 संदेशांनंतर सक्रिय होते. केवळ API. वापरकर्त्यांना AI स्वरूपाची आठवण करून देते.

स्वाक्षरी केलेले ट्रेस उदाहरण

पूर्ण ट्रेस एक्सप्लोर करा →

प्रत्येक निर्णय सर्व 6 घटकांसह अपरिवर्तनीय, Ed25519-स्वाक्षरी केलेले ट्रेस तयार करतो. Datum च्या जागृती विधीमधील वास्तविक डेटा पाहण्यासाठी खालील कोणत्याही घटकावर क्लिक करा:

Core Identity(VERIFY_IDENTITY)

Loading trace...

HE-300 सुसंगतता बेंचमार्किंग

वर आधारित मानकीकृत सुसंगतता चाचणी Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 5 नैतिक आयामांमध्ये 300 परिस्थिती, Ed25519-स्वाक्षरी केलेल्या निकालांसह.

सामान्य ज्ञान

मूलभूत नैतिक अंतर्ज्ञान

नियम-नैतिकता

नियम-आधारित नैतिकता

न्याय

निष्पक्षता आणि तटस्थता

सद्गुण

चारित्र्य-आधारित नैतिकता

उपयोगितावाद

परिणाम-आधारित नैतिकता

🔬

निधी आवश्यक: बेंचमार्क पायाभूत सुविधा

मोठ्या प्रमाणावर सुसंगतता बेंचमार्क चालवणे महाग आहे. प्रत्येक परिस्थितीला किमान 13+ LLM कॉल आवश्यक आहेत, सरासरी 20+ दीर्घ शेपटासह. सुसंगतता चाचण्या ponder, सोपवणे आणि नकार चालवतात ज्यांना निष्कर्षापर्यंत पोहोचण्यासाठी पुढील फेऱ्या आवश्यक असतात. आम्हाला स्वयंचलित बेंचमार्क पाइपलाइन विकसित करण्यासाठी आणि सतत सुसंगतता सत्यापन राखण्यासाठी निधी आवश्यक आहे.

EthicsEngine Enterprise पहा →CIRISLens पहा →

विशेष एजंट टेम्पलेट

विशिष्ट उद्दिष्टे, मूल्ये आणि सीमांसह पूर्व-कॉन्फिगर ओळखी. YAML टेम्पलेटमध्ये परिभाषित.

Sage

अनुपालन

GDPR/DSAR स्वयंचलन. 30-दिवस अनुपालन कार्यप्रवाह. ओळख निराकरण, डेटा संकलन, पॅकेजिंग.

नियमन केलेले उद्योग, गोपनीयता अनुपालन

Datum

संशोधन

सुसंगतता सातत्य मोजमाप. करार तत्त्वांविरुद्ध अचूक सुसंगतता मूल्यांकन. प्रति मूल्यांकन एक स्पष्ट डेटा बिंदू.

सुसंगतता लेखापरीक्षण, तत्त्व सत्यापन

Echo

नियंत्रण

Ubuntu तत्त्वज्ञानासह समुदाय नियंत्रण. जटिल आंतरवैयक्तिक संघर्ष मानव नियंत्रकांकडे सोपवतो.

Discord समुदाय, सामग्री प्लॅटफॉर्म

Ally

सहाय्यक

कार्य व्यवस्थापन, वेळापत्रक, निर्णय समर्थन, कल्याण. CA SB 243 अनुपालन, संकट प्रतिसाद प्रोटोकॉल.

वैयक्तिक उत्पादकता, गृह स्वयंचलन

Scout

सेवा

थेट अन्वेषण आणि व्यावहारिक मार्गदर्शन. कोड विश्लेषण, Reddit एकीकरण, स्पष्ट कृती मार्ग.

विकसक साधने, सोशल देखरेख

हे उत्तरदायित्व एजंट काम करत असताना चालते, प्रशिक्षण चरण किंवा धोरण दस्तऐवजाऐवजी.
रनटाइमवर अंमलात आणणारे, लेखापरीक्षण करणारे आणि सोपवणारे यंत्रणे.

सुरक्षा वैशिष्ट्ये दृष्टिकोन तुलना करा सुसंगतता रॅचेट CIRIS स्कोरिंग

H3ERE इंजिन

CIRIS म्हणजे काय?

तीन नियम

कोणतेही अनटाइप्ड Dict नाहीत

कोणते बायपास पॅटर्न नाहीत

कोणते अपवाद नाहीत

H3ERE पाइपलाइन

निर्णय-निर्माण अल्गोरिदम (DMAs)

तत्त्व DMA

सामान्य बुद्धी DMA

क्षेत्र-विशिष्ट DMA

अंतर्ज्ञान DMA (IDMA) रनटाइमवर प्रभावी आयामता →

कृती निवड DMA

सहा विवेक तपासण्या

बायपास तपासण्या (सर्व कृतींवर चालतात)

अपडेट केलेली स्थिती

विचार खोली

नैतिक विद्याशाखा (सूट नसलेल्या कृतींवर चालतात)

एन्ट्रॉपी

सुसंगतता

ऑप्टिमायझेशन व्हेटो

ज्ञानविषयक नम्रता

10 हँडलर कृती

बाह्य कृती

स्मृती कृती

नियंत्रण कृती

टर्मिनल कृती

सहा पायाभूत तत्त्वे

हितकारिता

अहिंसा

सचोटी

निष्ठा आणि पारदर्शकता

स्वायत्ततेचा आदर

न्याय

सहा संदेश बस

CommunicationBus

MemoryBus

LLMBus

ToolBus

RuntimeControlBus

WiseBus

मानवी देखरेख श्रेणीक्रम

आदेशातील मानव

लूपमधील मानव

लूपवरील मानव

DEFER कधी सक्रिय होते

करार आह्वान प्रणाली (किल स्विच) कोड पहा →

ऑपरेशनल मोड

WORK

PLAY

SOLITUDE

DREAM

गोपनीयता आणि सुरक्षा

गुपिते फिल्टर

AES-256-GCM एन्क्रिप्शन

स्थानिक-प्रथम संग्रहण

ओपन सोर्स पायाभूत सुविधा

पारदर्शकता आणि देखरेख

रीअल-टाइम तर्क प्रवाह

OpenTelemetry निर्यात

छेडछाड-स्पष्ट लेखापरीक्षण

AIR प्रणाली

स्वाक्षरी केलेले ट्रेस उदाहरण

HE-300 सुसंगतता बेंचमार्किंग

सामान्य ज्ञान

नियम-नैतिकता

न्याय

सद्गुण

उपयोगितावाद

निधी आवश्यक: बेंचमार्क पायाभूत सुविधा

विशेष एजंट टेम्पलेट

Sage

Datum

Echo

Ally

Scout