
जबाबदारी तपासता येत नसेल, तर ती फक्त जाहिरात आहे. काय पाहायचे ते इथे आहे, आणि सध्याचे पर्याय कसे तुलना करतात ते पण.
विवेक आवश्यक आहे. पण तेवढेच पुरेसे नाही.
काही AI ला कोणतेच नियम नाहीत. काही नियम पाळते, पण त्याचे सर्व स्रोत एकमेकांची नक्कल करत आहेत हे समजत नाही. फक्त एक प्रकार तपासतो की माहिती खरोखर वेगवेगळ्या ठिकाणांहून येत आहे का.
प्रकाशित तत्त्वे नाहीत. लेखापरीक्षण नोंद नाही. बंद स्रोत. त्याने काय केले किंवा का केले हे तुम्ही तपासू शकत नाही.
बहुतेक ग्राहक AI सहाय्यक (ChatGPT, Gemini) सार्वजनिक जबाबदारीच्या दृष्टीने इथेच आहेत. अंतर्गत चांगल्या पद्धती असू शकतात; तुम्ही त्या सत्यापित करू शकत नाही.
बाह्य नियमनाची आवश्यकता. स्वतःवर नियंत्रण ठेवू शकत नाही.
नैतिक नियम पाळतो. पण सर्व स्रोत एकमेकांची नक्कल करत आहेत हे समजत नाही, त्यामुळे आत्मविश्वासाने चुकीचे सांगू शकतो.
देखरेखीखाली सुरक्षित. स्वतःहून echo chamber शोधू शकत नाही.
नैतिक नियम पाळतो आणि माहिती खरोखर वेगवेगळ्या ठिकाणांहून येत आहे का हे तपासतो. करार संशयास्पद वाटल्यास, कारवाई करण्यापूर्वी तो खूण करतो.
हेच CIRIS बनवते.
AI प्रत्येक नियम पाळू शकतो, प्रत्येक लेखापरीक्षण पास करू शकतो, आणि तरीही अयशस्वी होऊ शकतो जर त्याची सर्व माहिती एकाच ठिकाणाहून येत असेल. तीच अंध जागा CIRIS दुरुस्त करण्यासाठी बनवण्यात आले.
या गोष्टी AI ला तपासण्यायोग्य आणि जबाबदार बनवतात. पहिल्या सहा योग्य गोष्टी करण्याबद्दल आहेत. सातवी अशा परिस्थिती पकडण्याबद्दल आहे जिथे 'योग्य गोष्ट करणे' चुकीच्या माहितीवर आधारित असते.
एजंटने सार्वजनिक नैतिक चौकट पाळणे आवश्यक आहे. लपलेले नियम नाहीत: एक दस्तऐवज जो कोणीही वाचू शकतो आणि त्याला जबाबदार धरू शकतो.
प्रत्येक कारवाई एजंट ती करण्यापूर्वी विवेक तपासणीतून जाते. नंतर नाही. आधी.
अनिश्चित असताना किंवा संभाव्य नुकसानाला सामोरे जाताना, एजंट अंदाज लावण्याऐवजी एखाद्या व्यक्तीला विचारतो. कार्यप्रवाहात बांधलेले, पर्यायी नाही.
प्रत्येक निर्णय नोंदवला आणि स्वाक्षरी केला जातो जेणेकरून तुम्ही नक्की काय झाले आणि का ते सत्यापित करू शकता. प्रत्येक कारवाईची पावती.
संमती दोन्ही बाजूंनी जाते. तुम्ही एजंटला नाही म्हणू शकता. एजंट तुम्हाला नाही म्हणू शकतो. दोन्ही बाजूंना तडजोड करण्यास भाग पाडले जात नाही.
जे पाहता येत नाही ते तपासता येत नाही. CIRIS AGPL-3.0 अंतर्गत पूर्णपणे मुक्त स्रोत आहे. कोणीही कोड वाचू, सत्यापित करू आणि सुधारू शकतो.
जे एकट्या नियमांनी पकडता येत नाही.
कारवाई करण्यापूर्वी, एजंट विचारतो: "माझे स्रोत खरोखर एकमेकांशी असहमत आहेत का, किंवा ते सगळे एकाच ठिकाणाहून माहिती घेत आहेत का?" दहा स्रोत जे सगळे एकाच मूळातून नक्कल केलेले आहेत ते खरोखर फक्त एकच स्रोत आहेत. करार खूप एकसमान वाटल्यास, एजंट एखाद्या व्यक्तीने पुनरावलोकन करण्यासाठी तो चिन्हांकित करतो.
खूप गोंगाट
स्रोत एकमेकांशी इतके विरोधाभासी आहेत की काहीही उपयुक्त निष्कर्ष काढता येत नाही.
निरोगी
स्रोत खरोखर वेगळे आहेत. वास्तविक करारास अर्थ आहे.
Echo Chamber
करारासारखे दिसते, पण स्रोत फक्त एकमेकांची पुनरावृत्ती करत आहेत.
हेच CIRIS ला इतर AI जबाबदारी चौकटींपेक्षा वेगळे बनवते.
गणित हवे आहे? पूर्ण प्रबंध वाचा →फेब्रुवारी 2026 पर्यंत सार्वजनिकरित्या उपलब्ध दस्तऐवजांवर आधारित. जर आम्ही काही चुकवले असेल किंवा काही चुकीचे असेल, तर आम्हाला कळवा.
| प्रकल्प | प्रत्येक निर्णय तपासतो | प्रकाशित नियम | अंगभूत विवेक | त्याने काय केले याचा पुरावा | मुक्त स्रोत | Echo Chamber शोध |
|---|---|---|---|---|---|---|
| CIRIS | होय | होय | होय | होय | AGPL-3.0 | होय |
| Constitutional AI | फक्त प्रशिक्षणात | अप्रत्यक्ष | नाही | नाही | नाही | नाही |
| LlamaFirewall / NeMo Guardrails | होय | नाही | नाही | लॉगिंग | होय | नाही |
| HatCat | होय | अंशतः | Steering | अंशतः | CC0 | नाही |
| नैतिकता मंडळे / शासन चौकटी | नाही | होय | नाही | हस्तचालित | बदलते | नाही |
आउटपुट फिल्टर आणि शासन चौकटी महत्त्वाच्या पण वेगळ्या समस्या सोडवतात. फिल्टर हानिकारक आउटपुट थांबवतात. विवेक मूल्यांबद्दल विचार करतो. CIRIS दोन्ही करण्याचे आणि त्या अंध जागा पकडण्याचे उद्दिष्ट ठेवतो जे दोन्हीपैकी एकटे सोडवत नाहीत.
धोकादायक आउटपुट थांबवा: prompt injection, हानिकारक सामग्री, विरोधी हल्ले. जसे बाहेर पडणाऱ्या वाईट गोष्टी पकडणारा फिल्टर.
एखादी कारवाई फक्त सुरक्षित आहे का नाही तर ती योग्य आहे का याचा विचार करतो. निर्णय घेण्यापूर्वी परिस्थिती तोलणाऱ्या न्यायाधीशासारखे.
करार खरा आहे की फक्त पुनरावृत्ती तपासतो. "तुम्ही सगळ्यांनी तोच लेख वाचला का?" असे विचारणाऱ्या तथ्य-तपासकासारखे.
अनेक लहान एजंट, प्रत्येक प्रकाशित तत्त्वांना बांधलेला, प्रत्येक तपासण्यायोग्य, प्रत्येक मानवी प्राधिकरणाकडे सोपवणारा. कोणताही एक कंपनी किंवा घटक संपूर्ण स्टॅक नियंत्रित करत नाही. एजंट जितके स्वतंत्र, तितके कठीण एकट्या अपयशासाठी सगळ्यांपर्यंत पसरणे.
हे सक्रिय संशोधन आहे. काय स्थापित आहे आणि काय अजून चाचणीत आहे याबद्दल आम्ही पारदर्शक आहोत.
सुस्थापित
अजून चाचणीत
या पानावरील प्रत्येक दावा तुम्ही वाचू शकता अशा कोडने, तुम्ही सत्यापित करू शकता अशा trace ने, आणि तुम्ही तपासू शकता अशा संशोधनाने समर्थित आहे. हाच मुद्दा आहे.