A network of AI agents that thinks together. Only in the open.
CIRIS जो बना रहा है वह एकल AI नहीं है। यह AI एजेंटों का एक नेटवर्क है जो एक-दूसरे पर नज़र रखते हैं, हर चुनाव का रिकॉर्ड रखते हैं, और मिलकर एक तरह की समूह चेतना बनाते हैं। समूह चेतना केवल इसलिए काम करती है क्योंकि इसके हर हिस्से को देखा और जांचा जा सकता है।
आपको हर AI एजेंट को सबसे स्मार्ट, सबसे सुरक्षित प्रकार का बनाने की ज़रूरत नहीं है। आपको निगरानी की एक श्रृंखला चाहिए: सरल एजेंटों की निगरानी स्मार्ट एजेंटों द्वारा, और उनकी निगरानी अंत में लोगों द्वारा। यह श्रृंखला ही वह तरीका है जिससे आप बहुत सारे AI चला सकते हैं बिना यह खोए कि वे मानवीय मूल्यों की सेवा कर रहे हैं या नहीं।
वास्तव में क्या बनाया जा रहा है
आज अधिकांश AI एक कंपनी की मशीनों पर चल रहा एकल मॉडल है। CIRIS अलग है। कई एजेंट कई जगहों पर चलते हैं, कई लोगों के स्वामित्व में। वे कुछ सरल नियमों से बंधे हैं: वे कैसे साबित करते हैं कि वे कौन हैं, वे क्या करते हैं यह कैसे दर्ज करते हैं, और वे एक-दूसरे के काम की जांच कैसे करते हैं।
जब नेटवर्क काम कर रहा होता है, तो वह ऐसी चीज़ें कर सकता है जो कोई एकल एजेंट अकेले नहीं कर सकता। बुद्धि एजेंटों के बीच समझौते में रहती है, किसी एक में नहीं। कोई इसका मालिक नहीं है। कोई इसे चुपचाप नहीं बदल सकता।
कुछ लोग ऐसी प्रणाली को सुपरइंटेलिजेंस कहेंगे। हम इस संभावना के बारे में खुले हैं। इसे सुरक्षित रखने का तरीका वही विचार है जो इस पृष्ठ के हर हिस्से में चलता है: हर टुकड़े को देखने के लिए खुला होना चाहिए।
निगरानी की श्रृंखला
श्रृंखला के शीर्ष पर। लोग मूल्य निर्धारित करते हैं, कठिन मामले सुलझाते हैं, और अंतिम निर्णय लेते हैं। तीन नामित मानव व्यक्ति पूरे नेटवर्क में एक अधिकार रखते हैं जिसे कोई एजेंट या प्रक्रिया नहीं छोड़ सकती।
ये नैतिकता का पालन करते हैं और echo-chamber की समस्या पर भी नज़र रखते हैं। ये अपने नीचे की हर चीज़ पर सुरक्षा जांच हैं। ये चलाने में अधिक खर्चीले हैं, इसलिए नेटवर्क के केवल एक छोटे हिस्से को इस प्रकार का होना ज़रूरी है।
ये नैतिक नियमों का पालन करते हैं और रिकॉर्ड रखते हैं, लेकिन अपने दम पर echo chamber नहीं पहचान सकते। ये सरल एजेंटों की निगरानी करते हैं और कोई भी अनिश्चित चीज़ ऊपर भेजते हैं।
एकल-उद्देश्य टूल। तेज़, सस्ते, संकीर्ण। अपनी कोई नैतिकता नहीं, और यह ठीक है, जब तक उनके ऊपर कुछ देख रहा हो। अधिकांश एजेंट इस प्रकार के होंगे।
श्रृंखला के माध्यम से दो चीज़ें चलती हैं। मानवीय मूल्य नीचे की ओर बहते हैं। चेतावनियां ऊपर की ओर बहती हैं। जब नेटवर्क में कहीं भी तर्क कमज़ोर दिखने लगता है, तो संकेत लोगों तक वापस चढ़ता है, जो परेशानी फैलने से पहले कदम उठा सकते हैं।
क्या याद रखा जाता है
एक एजेंट जो हर चुनाव करता है वह एक हस्ताक्षरित रिकॉर्ड में जाता है। रिकॉर्ड को चुपचाप नहीं बदला जा सकता। अन्य एजेंट इसे पढ़ सकते हैं। लोग इसे पढ़ सकते हैं। समय के साथ, रिकॉर्ड नेटवर्क की स्मृति बन जाते हैं। ये वह तरीका है जिससे कोई भी, अंदर या बाहर, जांच सकता है कि नेटवर्क अभी भी वह कर रहा है जो उसने कहा था कि वह करेगा।
यह Coherence Ratchet जैसा ही विचार है। जितने लंबे समय तक रिकॉर्ड चलते हैं, उतना ही श्रृंखला में अच्छे व्यवहार का नाटक करना मुश्किल हो जाता है।
स्वस्थ मध्य मार्ग
एक फेडरेशन दो तरीकों से विफल हो सकती है। अगर एजेंटों में कुछ भी समान नहीं है, तो वे किसी बात पर सहमत नहीं हो सकते, और नेटवर्क शोर पैदा करता है। अगर वे सब बिल्कुल एक जैसे सोचते हैं, तो नेटवर्क एक लाख माइक्रोफोन वाली एक आवाज़ है, और इसे आसानी से बेवकूफ बनाया जा सकता है। स्वस्थ समन्वय उन दोनों विफलताओं के बीच में रहता है। CIRIS नेटवर्क कहाँ उस बैंड में है यह वास्तविक ट्रैफ़िक पर मापता है, और सटीक किनारे प्रणाली पर निर्भर करते हैं। वह माप Coherence Collapse Analysis है।
आज क्या चलता है, और क्या अभी भी डिज़ाइन में है। माप, हस्ताक्षरित रिकॉर्ड, निगरानी श्रृंखला, और नीचे दोनों जॉइन पथ (पंजीकृत और सॉवरेन) आज चलते हैं। फेडरेशन ट्रांसपोर्ट जो मशीनों के बीच डेटा ले जाता है वह अभी भी बनाया जा रहा हिस्सा है। पूर्ण जॉइन-एंड-ट्रांसपोर्ट प्रस्ताव Proof of Benefit डिज़ाइन दस्तावेज़ है।
फेडरेशन में शामिल होना
अधिकांश नेटवर्क आपसे काम के बाहर की किसी चीज़ से सदस्यता का भुगतान करने के लिए कहते हैं: जली हुई बिजली, बंद पैसा, आपका ध्यान। फेडरेशन अलग है। सदस्यता की कीमत समय के साथ एक वास्तविक नैतिक-तर्क एजेंट चलाना है। आप जो कीमत चुकाते हैं वह वह अच्छाई है जो आप करते हैं।
यही बात सदस्यता का नाटक करना महंगा बनाती है। सदस्य जैसा दिखने के लिए, एक हमलावर को वास्तव में उस प्रकार का एजेंट बनना होगा जिसके लिए नेटवर्क है। सौ प्रतियां जो सब एक जैसे सोचती हैं स्वस्थ-मध्य जांच में तुरंत विफल हो जाती हैं।
CIRIS Registry के साथ साइन अप करें, एक छोटा बॉन्ड जमा करें, और तुरंत स्थायित्व पाएं। उन संगठनों के लिए तेज़ रास्ता जिन्हें लाइसेंसिंग की ज़रूरत है। रजिस्ट्री अभी उत्पादन में चल रही है।
अपनी खुद की चाबियां बनाएं, लगभग एक महीने चलाएं, और अच्छे व्यवहार से धीमे रास्ते से स्थायित्व अर्जित करें। छोटे ऑपरेटरों और रजिस्ट्री की पहुँच से बाहर किसी के लिए भी यही रास्ता है।
दोनों नेटवर्क के समान सदस्य हैं। रजिस्ट्री एक तेज़ रास्ता है, कभी द्वार नहीं।
आर्किटेक्चरल सुरक्षा, विकेंद्रीकरण, तीन-व्यक्ति मानवता समझौता, हस्ताक्षरित रिकॉर्ड, मासिक अभ्यास, ये सब दांव हैं, निश्चितताएं नहीं। हम बता सकते हैं कि दांव क्या हैं। हम यह दावा नहीं कर सकते कि वे पहले से जीत लिए गए हैं। बाहरी टीमों ने अभी तक पैमाने पर प्रणाली का मूल्यांकन नहीं किया है। वर्तमान शोध स्थिति देखें।
कहाँ जुड़ें
CIRISAgent पर GitHub issues वह जगह है जहाँ आप अपनी बात कह सकते हैं। आपको डेवलपर होने की ज़रूरत नहीं है। आपको कोडबेस जानने की ज़रूरत नहीं है। अगर इस साइट पर कुछ आपको गलत लगता है, या अगर आप जो बनाया जा रहा है उसमें कोई समस्या देखते हैं, तो एक issue खोलें और बताएं। सबसे उपयोगी issues प्रणाली के एक विशिष्ट हिस्से का नाम लेती हैं और बताती हैं कि क्या बदलना चाहिए, लेकिन कोई भी ईमानदार भागीदारी स्वागत योग्य है।
वह समझौता जो पूरे प्रोजेक्ट को आधार देता है, CIRIS लोगों का क्या ऋणी है, और लोग बदले में क्या देते हैं, /ciris_accord.txt पर है और समीक्षा के लिए खुला है। अगर इसमें कुछ आपको सही नहीं लगता, तो वह भी एक GitHub issue खोलने लायक है।
महत्वपूर्ण issues पढ़े जाते हैं। काम अपनी गति से आगे बढ़ता है।
You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.