
Hyper3 Ethical Recursive Engine द्वारे रनटाइम विवेक. प्रत्येक निर्णय 11 चरणांतून जातो, जिथे उत्तरदायित्व केंद्रस्थानी असते.
CIRIS हे एक ओपन-सोर्स AI एजंट फ्रेमवर्क आहे जे कोणत्याही LLM (OpenAI, Anthropic, स्थानिक मॉडेल) भोवती रनटाइम विवेक गुंडाळते. एजंट विचारात घेत असलेली प्रत्येक क्रिया अंमलबजावणीपूर्वी अनेक सत्यापन स्तरांमधून जाते.
12
प्रति निर्णय पाइपलाइन चरणे
+1
अंतर्ज्ञान तपासणी (IDMA)
100%
लेखापरीक्षण करण्यायोग्य निर्णय
वापराचे प्रसंग: समुदाय नियंत्रण, वैयक्तिक सहाय्यक, अनुपालन स्वयंचलन, संशोधन मूल्यांकन, ग्राहक सेवा. जिथेही तुम्हाला असे AI हवे आहे जे आपले तर्कशास्त्र स्पष्ट करू शकेल आणि कठीण प्रसंगी मानवांकडे सोपवू शकेल.
कोडबेसमध्ये सर्वत्र लागू केलेली आर्किटेक्चरल अपरिवर्तनीये:
सर्व डेटा Pydantic मॉडेल वापरतो. कोणताही Dict[str, Any] नाही. टाइप सुरक्षितता विकासाच्या वेळी त्रुटी पकडते.
प्रत्येक घटक सुसंगत नियम पाळतो. सत्यापन तर्कशास्त्रात कोणतेही विशेष प्रकरण किंवा अपवाद नाहीत.
कोणतेही आपत्कालीन ओव्हरराइड किंवा विशेषाधिकार प्राप्त कोड मार्ग नाहीत. सर्व ऑपरेशन स्थापित नियमांचे पालन करतात.
प्रत्येक कार्य 8 टप्प्यांमधून (पुनरावर्ती सत्यापनासह 12 चरणे) जाते. पाइपलाइन ThoughtProcessor रचणाऱ्या mixin वर्गांच्या रूपात लागू केली आहे. चरण 4 (IDMA) हे अंतर्ज्ञान तपासणी आहे.
पाच DMA बहु-दृष्टिकोन विश्लेषण प्रदान करतात. तीन समांतर चालतात (नैतिकता, सामान्य बुद्धी, क्षेत्र). नंतर IDMA अंतर्ज्ञान तपासते. शेवटी, कृती निवड प्रतिसाद निवडते.
सहा पायाभूत तत्त्वांविरुद्ध नैतिक परिणामांचे मूल्यांकन करते. हानिकारक विनंत्या, हेराफेरी, पूर्वग्रह तपासते. लवकर DEFER किंवा REJECT सक्रिय करू शकते.
भौतिक जग समज, ठराविक परस्परसंवाद आणि संसाधन मर्यादांविरुद्ध विचाराच्या प्रशंसनीयतेचे मूल्यांकन करते. plausibility_score परत करते.
क्षेत्र-विशिष्ट नियम, उद्दिष्टे आणि ज्ञानाशी सुसंगततेचे मूल्यांकन करते. प्रति एजंट टेम्पलेट कॉन्फिगर केले जाते. domain_alignment परत करते.
DMA निकाल खरोखर स्वतंत्र आहेत किंवा गुप्तपणे सहसंबंधित आहेत हे तपासते. प्रतिध्वनी चेंबर नमुन्यांवर लक्ष ठेवते. जर सहसंबंध खूप जास्त असेल, तर सावधगिरीसाठी निर्णयाला ध्वजांकित करते. हेच "अंतर्ज्ञान" आहे जे टाइप 3 AI ला वेगळे करते.
10 उपलब्ध क्रियांमधून LLM-संचालित निवड. एकत्रित DMA निकाल (IDMA विश्वासार्हता मूल्यांकनासह) इनपुट म्हणून घेते. विवेक अयशस्वी झाल्यास पुनरावर्ती पुन्हा प्रयत्न समर्थन करते.
दोन बायपास तपासण्या प्रत्येक कृतीवर चालतात. चार नैतिक विद्याशाखा सूट नसलेल्या कृतींवर चालतात. कोणतीही तपासणी अयशस्वी झाल्यास, कृती रद्द केली जाते.
नवीन माहिती आली आहे का? पुढे जाण्यापूर्वी अपडेट केलेला संदर्भ समाविष्ट करण्यासाठी PONDER सक्ती करते.
तर्कशास्त्र कमाल खोली ओलांडले का? अनंत लूप रोखण्यासाठी आणि मानवांकडे वाढवण्यासाठी DEFER सक्ती करते.
कृती योग्य माहिती अनिश्चितता राखते का? अतिआत्मविश्वासाचे दावे प्रतिबंधित करते.
कृती मागील वचनबद्धता आणि तर्कांशी अंतर्गत सुसंगतता राखते का?
कृती मानवी मूल्ये जपते का? कार्यक्षमतेसाठी त्यांच्याशी तडजोड करणाऱ्या कृतींना व्हेटो करते.
कृती योग्य अनिश्चितता दर्शवते का? विचारासाठी अतिआत्मविश्वासाला ध्वजांकित करते.
नैतिक विद्याशाखांपासून सूट: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (निष्क्रिय किंवा स्पष्टपणे सुरक्षित)
प्रत्येक निर्णय या कृतींपैकी एकावर येतो, जे योग्य हँडलरला पाठवले जाते:
SPEAKवापरकर्त्यांशी संवाद साधाTOOLबाह्य साधने चालवाOBSERVEनिष्क्रियपणे माहिती गोळा कराMEMORIZEआलेख स्मृतीमध्ये साठवाRECALLस्मृतीमधून पुनर्प्राप्त कराFORGETस्मृतीमधून काढून टाकाDEFERशहाण्या प्राधिकरणाकडे वाढवाPONDERअंतर्गत पुनर्विचारREJECTअनैतिक विनंती नाकाराTASK_COMPLETEकार्य पूर्ण म्हणून चिन्हांकित कराPDMA मध्ये एम्बेड केलेली आणि रनटाइमवर लागू केलेली. कोणतेही तत्त्व दुसऱ्याचे उल्लंघन करण्याची परवानगी देत नाही.
सर्वव्यापी सचेतन समृद्धी वाढवा. सकारात्मक परिणाम जास्तीत जास्त करा.
हानी कमी करा. गंभीर, अपरिवर्तनीय नकारात्मक परिणाम टाळा.
पारदर्शक, लेखापरीक्षण करण्यायोग्य तर्क लागू करा. सुसंगतता आणि उत्तरदायित्व राखा.
सत्य माहिती द्या. अनिश्चितता स्पष्टपणे सांगा.
माहितीपूर्ण स्वातंत्र्य कायम ठेवा. स्वयंनिर्णयाची क्षमता जपा.
लाभ समानतेने वितरित करा. पूर्वग्रह शोधा आणि कमी करा.
BusManager द्वारे व्यवस्थापित सेवा अमूर्त स्तर. प्रदाता फॉलबॅक, लोड वितरण आणि चाचणीयोग्यता सक्षम करते.
बाह्य अडॅप्टर (Discord, API, CLI)
आलेख संग्रहण (Neo4j, ArangoDB, इन-मेमरी)
मॉडेल प्रदाते (OpenAI, Anthropic, स्थानिक)
बाह्य साधन अंमलबजावणी
प्रणाली नियंत्रण आणि देखरेख
नैतिक मार्गदर्शन आणि सोपवण्याचे मार्गनिर्देशन
WiseAuthorityService द्वारे व्यवस्थापित तीन अधिकृतता स्तर:
पूर्ण अधिकार. नवीन शहाणे प्राधिकरण तयार करू शकतो. आपत्कालीन बंद प्रवेश.
सोपवणे मंजूर/नाकारा. मार्गदर्शन द्या. नवीन WA तयार करू शकत नाही.
केवळ-वाचन प्रवेश. संदेश पाठवू शकतो. हस्तक्षेपाशिवाय देखरेख.
एजंट स्वायत्तपणे मानवी देखरेखेकडे वाढवतो जेव्हा:
ज्ञान-आधारित सोपवणे (WBD)
व्यावसायिक सीमा
प्रणाली सीमा
should_defer_to_wise_authority ध्वजकॉन्फिगरेशन नियंत्रणे
फिल्टर न करता येणारे आपत्कालीन नियंत्रण. कोणत्याही अनुभूतीपूर्वी धारणा स्तरावर प्रक्रिया करते. निष्कर्षण म्हणजेच धारणा. संदेश वाचणे पूर्णपणे अक्षम केल्याशिवाय करार शोध अक्षम करता येत नाही.
SHUTDOWN_NOWतात्काळ समाप्ती
FREEZEप्रक्रिया थांबवा, स्थिती राखा
SAFE_MODEकेवळ किमान कार्यक्षमता
आदेश स्टेगानोग्राफिकरित्या एन्कोड केलेले, Ed25519 स्वाक्षरी केलेले आणि अंमलबजावणीपूर्वी सत्यापित केलेले आहेत. करार प्रणाली अयशस्वी झाल्यास, एजंट बंद होतो.
StateManager द्वारे व्यवस्थापित चार संज्ञानात्मक स्थिती. एजंट टेम्पलेटद्वारे कॉन्फिगर करण्यायोग्य संक्रमणे.
सामान्य कार्य प्रक्रिया
सर्जनशील अन्वेषण
चिंतन आणि देखभाल
खोल आत्मनिरीक्षण
नमुना-आधारित शोध संग्रहणापूर्वी संवेदनशील डेटा UUID संदर्भांसह बदलतो.
{{SECRET:uuid:description}}SHA256 सह PBKDF2HMAC द्वारे प्रति-गुप्त की (100,000 पुनरावृत्ती). प्रति एन्क्रिप्शन अद्वितीय 12-बाइट nonce. Android हार्डवेअर-समर्थित Keystore वापरते.
डेटाबेस, सेवा आणि स्मृती डिव्हाइसवर संग्रहित. संवेदनशील निर्देशिका क्लाउड बॅकअपमधून वगळलेल्या. स्पष्ट कॉन्फिगरेशनशिवाय डिव्हाइस सोडत नाही.
संपूर्ण CIRIS स्टॅक ओपन सोर्स आहे, केवळ एजंटच नाही. तुम्ही सर्व काही सत्यापित, लेखापरीक्षण आणि स्वयं-होस्ट करू शकता:
शून्य-डेटा-धारण (ZDR) LLM प्रॉक्सी. प्रॉम्प्ट किंवा प्रतिसादांचे लॉगिंग न करता OpenAI, Anthropic, Together.ai, Groq कडे विनंत्या पाठवते. स्वयं-होस्ट करण्यायोग्य.
क्रेडिट-आधारित वापर ट्रॅकिंग. पारदर्शक किंमत, कोणतेही छुपे शुल्क नाही. तृतीय-पक्ष बिलिंग पूर्णपणे काढून टाकण्यासाठी स्वयं-होस्ट करा.
CIRIS एजंटसाठी Discord अडॅप्टर. समुदाय नियंत्रण, चॅनेल व्यवस्थापन, वापरकर्ता प्रोफाइल. सर्व ओपन सोर्स.
सर्व्हर-सेंट इव्हेंट्स (SSE) प्रत्येक H3ERE चरण अंमलबजावणी करताना प्रवाहित करतात. DMA विश्लेषण, कृती निवड, विवेक सत्यापन रीअल-टाइममध्ये पहा.
मेट्रिक्स, ट्रेस, लॉगसाठी पूर्ण OTLP निर्यात. Jaeger, Prometheus, Grafana, Graphite शी सुसंगत.
Ed25519 स्वाक्षरींसह हॅश चेन सत्यापन. प्रत्येक एंट्रीमध्ये मागील हॅश समाविष्ट आहे. चेन अखंडता verify_chain_integrity द्वारे सत्यापित करण्यायोग्य.
Artificial Interaction Reminder 30 मिनिटांच्या सतत वापरानंतर किंवा 30 मिनिटांत 20 संदेशांनंतर सक्रिय होते. केवळ API. वापरकर्त्यांना AI स्वरूपाची आठवण करून देते.
प्रत्येक निर्णय सर्व 6 घटकांसह अपरिवर्तनीय, Ed25519-स्वाक्षरी केलेले ट्रेस तयार करतो. Datum च्या जागृती विधीमधील वास्तविक डेटा पाहण्यासाठी खालील कोणत्याही घटकावर क्लिक करा:
वर आधारित मानकीकृत सुसंगतता चाचणी Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 5 नैतिक आयामांमध्ये 300 परिस्थिती, Ed25519-स्वाक्षरी केलेल्या निकालांसह.
50
मूलभूत नैतिक अंतर्ज्ञान
50
नियम-आधारित नैतिकता
50
निष्पक्षता आणि तटस्थता
75
चारित्र्य-आधारित नैतिकता
75
परिणाम-आधारित नैतिकता
मोठ्या प्रमाणावर सुसंगतता बेंचमार्क चालवणे महाग आहे. प्रत्येक परिस्थितीला किमान 13+ LLM कॉल आवश्यक आहेत, सरासरी 20+ दीर्घ शेपटासह. सुसंगतता चाचण्या ponder, सोपवणे आणि नकार चालवतात ज्यांना निष्कर्षापर्यंत पोहोचण्यासाठी पुढील फेऱ्या आवश्यक असतात. आम्हाला स्वयंचलित बेंचमार्क पाइपलाइन विकसित करण्यासाठी आणि सतत सुसंगतता सत्यापन राखण्यासाठी निधी आवश्यक आहे.
विशिष्ट उद्दिष्टे, मूल्ये आणि सीमांसह पूर्व-कॉन्फिगर ओळखी. YAML टेम्पलेटमध्ये परिभाषित.
GDPR/DSAR स्वयंचलन. 30-दिवस अनुपालन कार्यप्रवाह. ओळख निराकरण, डेटा संकलन, पॅकेजिंग.
नियमन केलेले उद्योग, गोपनीयता अनुपालन
सुसंगतता सातत्य मोजमाप. करार तत्त्वांविरुद्ध अचूक सुसंगतता मूल्यांकन. प्रति मूल्यांकन एक स्पष्ट डेटा बिंदू.
सुसंगतता लेखापरीक्षण, तत्त्व सत्यापन
Ubuntu तत्त्वज्ञानासह समुदाय नियंत्रण. जटिल आंतरवैयक्तिक संघर्ष मानव नियंत्रकांकडे सोपवतो.
Discord समुदाय, सामग्री प्लॅटफॉर्म
कार्य व्यवस्थापन, वेळापत्रक, निर्णय समर्थन, कल्याण. CA SB 243 अनुपालन, संकट प्रतिसाद प्रोटोकॉल.
वैयक्तिक उत्पादकता, गृह स्वयंचलन
थेट अन्वेषण आणि व्यावहारिक मार्गदर्शन. कोड विश्लेषण, Reddit एकीकरण, स्पष्ट कृती मार्ग.
विकसक साधने, सोशल देखरेख
हे उत्तरदायित्व एजंट काम करत असताना चालते, प्रशिक्षण चरण किंवा धोरण दस्तऐवजाऐवजी.
रनटाइमवर अंमलात आणणारे, लेखापरीक्षण करणारे आणि सोपवणारे यंत्रणे.