पहिला संपर्कइन्स्टॉल करासुसंगतता रॅचेटफेडरेशनतुलना करासंशोधनकरारGitHub
हे पृष्ठ मशीनने भाषांतरित केले आहे. काही चुकीचे वाटत असल्यास, कृपया एक समस्या उघडा - रेपो सार्वजनिक आहे कारणास्तव. भाषांतर समस्या नोंदवा
Background Image
आजच्या उत्पादनातील सर्वात सुरक्षित आणि नैतिक AI

जबाबदारी नसेल, तर AI देण्यापेक्षा जास्त घेतो.

जबाबदारी तपासता येत नसेल, तर ती फक्त जाहिरात आहे. काय पाहायचे ते इथे आहे, आणि सध्याचे पर्याय कसे तुलना करतात ते पण.

तीन प्रकारचे AI

विवेक आवश्यक आहे. पण तेवढेच पुरेसे नाही.

काही AI ला कोणतेच नियम नाहीत. काही नियम पाळते, पण त्याचे सर्व स्रोत एकमेकांची नक्कल करत आहेत हे समजत नाही. फक्त एक प्रकार तपासतो की माहिती खरोखर वेगवेगळ्या ठिकाणांहून येत आहे का.

1

नियम नाहीत

प्रकाशित तत्त्वे नाहीत. लेखापरीक्षण नोंद नाही. बंद स्रोत. त्याने काय केले किंवा का केले हे तुम्ही तपासू शकत नाही.

बहुतेक ग्राहक AI सहाय्यक (ChatGPT, Gemini) सार्वजनिक जबाबदारीच्या दृष्टीने इथेच आहेत. अंतर्गत चांगल्या पद्धती असू शकतात; तुम्ही त्या सत्यापित करू शकत नाही.

बाह्य नियमनाची आवश्यकता. स्वतःवर नियंत्रण ठेवू शकत नाही.

2

नियम आहेत, जाणीव नाही

नैतिक नियम पाळतो. पण सर्व स्रोत एकमेकांची नक्कल करत आहेत हे समजत नाही, त्यामुळे आत्मविश्वासाने चुकीचे सांगू शकतो.

देखरेखीखाली सुरक्षित. स्वतःहून echo chamber शोधू शकत नाही.

3

नियम + जाणीव

नैतिक नियम पाळतो आणि माहिती खरोखर वेगवेगळ्या ठिकाणांहून येत आहे का हे तपासतो. करार संशयास्पद वाटल्यास, कारवाई करण्यापूर्वी तो खूण करतो.

हेच CIRIS बनवते.

AI प्रत्येक नियम पाळू शकतो, प्रत्येक लेखापरीक्षण पास करू शकतो, आणि तरीही अयशस्वी होऊ शकतो जर त्याची सर्व माहिती एकाच ठिकाणाहून येत असेल. तीच अंध जागा CIRIS दुरुस्त करण्यासाठी बनवण्यात आले.

सात गोष्टी तपासायच्या

सहा नैतिकतेसाठी. एक अंध जागांसाठी.

या गोष्टी AI ला तपासण्यायोग्य आणि जबाबदार बनवतात. पहिल्या सहा योग्य गोष्टी करण्याबद्दल आहेत. सातवी अशा परिस्थिती पकडण्याबद्दल आहे जिथे 'योग्य गोष्ट करणे' चुकीच्या माहितीवर आधारित असते.

1. प्रकाशित तत्त्वे

एजंटने सार्वजनिक नैतिक चौकट पाळणे आवश्यक आहे. लपलेले नियम नाहीत: एक दस्तऐवज जो कोणीही वाचू शकतो आणि त्याला जबाबदार धरू शकतो.

2. प्रत्येक निर्णयावर विवेक तपासणी

प्रत्येक कारवाई एजंट ती करण्यापूर्वी विवेक तपासणीतून जाते. नंतर नाही. आधी.

3. अनिश्चित असताना माणसांना विचारतो

अनिश्चित असताना किंवा संभाव्य नुकसानाला सामोरे जाताना, एजंट अंदाज लावण्याऐवजी एखाद्या व्यक्तीला विचारतो. कार्यप्रवाहात बांधलेले, पर्यायी नाही.

4. त्याने काय केले याचा पुरावा

प्रत्येक निर्णय नोंदवला आणि स्वाक्षरी केला जातो जेणेकरून तुम्ही नक्की काय झाले आणि का ते सत्यापित करू शकता. प्रत्येक कारवाईची पावती.

5. दोन्ही बाजूंची संमती

संमती दोन्ही बाजूंनी जाते. तुम्ही एजंटला नाही म्हणू शकता. एजंट तुम्हाला नाही म्हणू शकतो. दोन्ही बाजूंना तडजोड करण्यास भाग पाडले जात नाही.

6. मुक्त स्रोत

जे पाहता येत नाही ते तपासता येत नाही. CIRIS AGPL-3.0 अंतर्गत पूर्णपणे मुक्त स्रोत आहे. कोणीही कोड वाचू, सत्यापित करू आणि सुधारू शकतो.

7

Echo Chamber शोध

जे एकट्या नियमांनी पकडता येत नाही.

कारवाई करण्यापूर्वी, एजंट विचारतो: "माझे स्रोत खरोखर एकमेकांशी असहमत आहेत का, किंवा ते सगळे एकाच ठिकाणाहून माहिती घेत आहेत का?" दहा स्रोत जे सगळे एकाच मूळातून नक्कल केलेले आहेत ते खरोखर फक्त एकच स्रोत आहेत. करार खूप एकसमान वाटल्यास, एजंट एखाद्या व्यक्तीने पुनरावलोकन करण्यासाठी तो चिन्हांकित करतो.

खूप गोंगाट

स्रोत एकमेकांशी इतके विरोधाभासी आहेत की काहीही उपयुक्त निष्कर्ष काढता येत नाही.

निरोगी

स्रोत खरोखर वेगळे आहेत. वास्तविक करारास अर्थ आहे.

Echo Chamber

करारासारखे दिसते, पण स्रोत फक्त एकमेकांची पुनरावृत्ती करत आहेत.

हेच CIRIS ला इतर AI जबाबदारी चौकटींपेक्षा वेगळे बनवते.

गणित हवे आहे? पूर्ण प्रबंध वाचा →

सध्याचे परिदृश्य

वेगवेगळे प्रकल्प, वेगवेगळी उद्दिष्टे.

फेब्रुवारी 2026 पर्यंत सार्वजनिकरित्या उपलब्ध दस्तऐवजांवर आधारित. जर आम्ही काही चुकवले असेल किंवा काही चुकीचे असेल, तर आम्हाला कळवा.

प्रकल्पप्रत्येक निर्णय तपासतोप्रकाशित नियमअंगभूत विवेकत्याने काय केले याचा पुरावामुक्त स्रोतEcho Chamber शोध
CIRISहोयहोयहोयहोयAGPL-3.0होय
Constitutional AIफक्त प्रशिक्षणातअप्रत्यक्षनाहीनाहीनाहीनाही
LlamaFirewall / NeMo Guardrailsहोयनाहीनाहीलॉगिंगहोयनाही
HatCatहोयअंशतःSteeringअंशतःCC0नाही
नैतिकता मंडळे / शासन चौकटीनाहीहोयनाहीहस्तचालितबदलतेनाही

आउटपुट फिल्टर आणि शासन चौकटी महत्त्वाच्या पण वेगळ्या समस्या सोडवतात. फिल्टर हानिकारक आउटपुट थांबवतात. विवेक मूल्यांबद्दल विचार करतो. CIRIS दोन्ही करण्याचे आणि त्या अंध जागा पकडण्याचे उद्दिष्ट ठेवतो जे दोन्हीपैकी एकटे सोडवत नाहीत.

संरक्षणाचे तीन स्तर

प्रत्येक वेगळी समस्या सोडवतो.

आउटपुट फिल्टर

धोकादायक आउटपुट थांबवा: prompt injection, हानिकारक सामग्री, विरोधी हल्ले. जसे बाहेर पडणाऱ्या वाईट गोष्टी पकडणारा फिल्टर.

नैतिक विवेक

एखादी कारवाई फक्त सुरक्षित आहे का नाही तर ती योग्य आहे का याचा विचार करतो. निर्णय घेण्यापूर्वी परिस्थिती तोलणाऱ्या न्यायाधीशासारखे.

Echo Chamber शोध

करार खरा आहे की फक्त पुनरावृत्ती तपासतो. "तुम्ही सगळ्यांनी तोच लेख वाचला का?" असे विचारणाऱ्या तथ्य-तपासकासारखे.

अनेक सुसंगत एजंट

वितरित शासन, केंद्रित शक्ती नाही.

अपयशाचा एकच बिंदू नाही

लहान एजंट, प्रत्येक जबाबदार.

अनेक लहान एजंट, प्रत्येक प्रकाशित तत्त्वांना बांधलेला, प्रत्येक तपासण्यायोग्य, प्रत्येक मानवी प्राधिकरणाकडे सोपवणारा. कोणताही एक कंपनी किंवा घटक संपूर्ण स्टॅक नियंत्रित करत नाही. एजंट जितके स्वतंत्र, तितके कठीण एकट्या अपयशासाठी सगळ्यांपर्यंत पसरणे.

संशोधन स्थिती

हे सक्रिय संशोधन आहे. काय स्थापित आहे आणि काय अजून चाचणीत आहे याबद्दल आम्ही पारदर्शक आहोत.

सुस्थापित

  • - नक्कल केलेले स्रोत वास्तविक विविधता कमी करतात
  • - AI मॉडेल्स प्रशिक्षण डेटा ओव्हरलॅप सामायिक करतात
  • - Echo chamber खोट्या आत्मविश्वासाला जन्म देतात
  • - स्वतंत्र पडताळणी अधिक चुका पकडते

अजून चाचणीत

  • - AI स्रोत किती नक्कल केलेले आहेत याचे अचूक मोजमाप
  • - Echo chamber चिन्हांकित करण्यासाठी सर्वोत्तम उंबरठे
  • - हस्तक्षेप नक्कल किती कमी करतात
  • - हे वेगवेगळ्या क्षेत्रांत कसे बदलते

स्वतः वापरून पाहा

स्वतः सत्यापित करा.

मुक्त स्रोत. छाननीसाठी खुले.

या पानावरील प्रत्येक दावा तुम्ही वाचू शकता अशा कोडने, तुम्ही सत्यापित करू शकता अशा trace ने, आणि तुम्ही तपासू शकता अशा संशोधनाने समर्थित आहे. हाच मुद्दा आहे.