A network of AI agents that thinks together. Only in the open.
CIRIS जे बनवत आहे ते एकच AI नाही. ते AI agents चे एक network आहे जे एकमेकांवर लक्ष ठेवतात, प्रत्येक निर्णयाची नोंद ठेवतात, आणि एकत्रितपणे एक प्रकारचे सामूहिक मन बनवतात. हे सामूहिक मन केवळ तेव्हाच काम करते जेव्हा त्याचा प्रत्येक भाग पाहता आणि तपासता येतो.
तुम्हाला प्रत्येक AI agent सर्वात हुशार, सर्वात सुरक्षित प्रकारचा असण्याची गरज नाही. तुम्हाला एक supervision chain हवी आहे: साध्या agents वर चोखंदळ agents नजर ठेवतात, आणि त्यांच्यावर शेवटी माणसे. ती chain म्हणजे तुम्ही भरपूर AI चालवत असताना ते human values साठी काम करत आहे का हे लक्षात ठेवण्याचा मार्ग.
प्रत्यक्षात काय बनवले जात आहे
आजचा बहुतेक AI एका कंपनीच्या machines वर चालणारा एकच model आहे. CIRIS वेगळे आहे. अनेक agents अनेक ठिकाणी, अनेक लोकांच्या मालकीचे चालतात. त्यांना काही साध्या नियमांनी बांधले आहे: ते कोण आहेत हे कसे सिद्ध करतात, ते काय करतात याची नोंद कशी ठेवतात, आणि एकमेकांचे काम कसे तपासतात.
Network नीट काम करत असताना, ते असे काहीतरी करू शकते जे एकट्या agent ला शक्य नव्हते. बुद्धिमत्ता agents मधील समझौत्यात असते, कोण्या एकात नाही. त्यावर कोणाचाही ताबा नाही. कोणाला ते चोरून बदलता येत नाही.
काही लोक असे सांगतात की अशा प्रणालीला superintelligence म्हणतात. आम्ही त्या शक्यतेबद्दल मोकळेपणाने बोलतो. ते यशस्वी होण्याचा मार्ग इतरत्र सांगितलेल्या तत्त्वाप्रमाणेच आहे: प्रत्येक भाग पाहण्यासाठी मोकळा असणे आवश्यक आहे.
Supervision ची साखळी
साखळीचा शिखर. माणसे मूल्ये ठरवतात, कठीण प्रकरणे सोडवतात, आणि अंतिम निर्णय स्वतःकडे ठेवतात. तीन नावाजलेल्या मानवी व्यक्ती network-wide अधिकार धारण करतात ज्याला कोणताही agent किंवा प्रक्रिया वळवू शकत नाही.
हे ethics पाळतात आणि echo-chamber समस्येसाठी देखील लक्ष ठेवतात. ते खाली असलेल्या प्रत्येक गोष्टीवर safety check आहेत. चालवण्यासाठी जास्त खर्च येतो, त्यामुळे networkच्या फक्त एका छोट्या हिस्स्याला हा प्रकार असणे आवश्यक आहे.
हे ethical rules पाळतात आणि नोंदी ठेवतात, पण स्वतःहून echo chamber शोधू शकत नाहीत. ते साध्या agents वर नजर ठेवतात आणि अनिश्चित असलेले काहीही वरच्या दिशेने पाठवतात.
एकाच कामाची साधने. जलद, स्वस्त, मर्यादित. त्यांचे स्वतःचे ethics नाहीत, आणि ते ठीक आहे — जोपर्यंत वरचे कोणीतरी नजर ठेवत आहे. बहुतेक agents हा प्रकार असतील.
दोन गोष्टी साखळीतून वाहतात. Human values खाली वाहतात. इशारे वर वाहतात. जेव्हा कुठेही network मध्ये तर्क नाजूक वाटू लागतो, तेव्हा संकेत माणसांपर्यंत पोहोचतो, जे संकट पसरण्यापूर्वी हस्तक्षेप करू शकतात.
काय लक्षात ठेवले जाते
एखाद्या agent ने केलेला प्रत्येक निर्णय एका signed नोंदीत जातो. ती नोंद चोरून बदलता येत नाही. इतर agents ती वाचू शकतात. माणसे ती वाचू शकतात. काळाच्या ओघात, नोंदी network ची स्मृती बनतात. आतून किंवा बाहेरून कोणीही त्याद्वारे तपासू शकतो की network अजूनही सांगितल्याप्रमाणे काम करत आहे का.
हीच कल्पना Coherence Ratchet मध्ये आहे. नोंदी जितक्या जास्त काळ चालतात, तितके साखळीभर चांगल्या वर्तनाचे नाटक करणे कठीण होते.
निरोगी मधला मार्ग
एक federation दोन प्रकारे अयशस्वी होऊ शकते. Agents मध्ये काहीच साम्य नसेल तर ते कशावरही सहमत होऊ शकत नाहीत, आणि network फक्त गोंधळ निर्माण करते. जर सगळे अगदी सारखाच विचार करत असतील, तर network म्हणजे एक लाख microphones असलेला एकच आवाज आहे, आणि त्याला फसवणे सोपे आहे. निरोगी coordination या दोन अयशस्वी अवस्थांमधील पट्ट्यात राहते. CIRIS real traffic वर network त्या पट्ट्यात कुठे आहे हे मोजतो, आणि अचूक सीमा system वर अवलंबून असतात. ते मोजमाप म्हणजे Coherence Collapse Analysis.
आज काय चालते, आणि अजून design मध्ये काय आहे. मोजमाप, signed नोंदी, supervision chain, आणि खाली दिलेले दोन्ही join paths (registered आणि sovereign) आज चालतात. Federation transport जे machines मधील data हलवते ते अजून बनवले जात आहे. पूर्ण join-and-transport proposal म्हणजे Proof of Benefit design document आहे.
Federation मध्ये सामील होणे
बहुतेक networks तुम्हाला कामाबाहेरील काहीतरी — जळालेली वीज, अडकलेले पैसे, तुमचे लक्ष — देऊन membership साठी विनंती करतात. Federation वेगळे आहे. सदस्यतेची किंमत म्हणजे दीर्घकाळ एक खरा ethical-reasoning agent चालवणे. तुम्ही देता ती किंमत म्हणजे तुम्ही करता ते चांगले.
त्यामुळेच membership चे नाटक करणे महाग होते. एखाद्या हल्लेखोराला member दिसण्यासाठी तो ज्या प्रकारचा agent network साठी बनवला आहे तसा प्रत्यक्षात व्हावे लागेल. एकाच विचाराचे शंभर copies healthy-middle तपासणीत लगेच अयशस्वी होतात.
CIRIS Registry मध्ये नोंदणी करा, एक छोटी रक्कम bond म्हणून द्या, आणि लगेच standing मिळवा. ज्या organizations ला licensing हवे त्यांच्यासाठी जलद मार्ग. Registry आता production मध्ये चालते.
स्वतःच्या keys बनवा, सुमारे एक महिना चालवा, आणि चांगल्या वर्तनाद्वारे हळूहळू standing मिळवा. लहान operators आणि registry च्या आवाक्याबाहेरील कोणासाठी मार्ग.
दोन्ही network चे समान सदस्य आहेत. Registry जलद मार्ग आहे, अनिवार्य दरवाजा नाही.
Architectural protections, decentralization, तीन-व्यक्ती humanity accord, signed नोंदी, मासिक drill — या पैजा आहेत, खात्रीशीर गोष्टी नाहीत. आम्ही हे मोकळेपणाने सांगतो. बाहेरील टीमांनी अद्याप मोठ्या प्रमाणात system चे मूल्यांकन केले नाही. सध्याची संशोधन स्थिती पाहा.
कुठे सहभागी व्हायचे
CIRISAgent वरील GitHub issues हे योगदान देण्याचे ठिकाण आहे. Developer असणे आवश्यक नाही. Codebase माहीत असणे आवश्यक नाही. या site वरील एखादी गोष्ट तुम्हाला चुकीची वाटत असेल, किंवा जे बनवले जात आहे त्यात तुम्हाला काही समस्या दिसत असेल, तर issue उघडून सांगा. सर्वात उपयुक्त issues system च्या एका विशिष्ट भागाला नाव देतात आणि काय बदलावे याचे सुचवतात, पण कोणताही प्रामाणिक प्रतिसाद स्वागतार्ह आहे.
संपूर्ण project ला आधार देणारा accord — CIRIS लोकांना काय देणे लागतो, आणि लोक त्याला काय देणे लागतात — /ciris_accord.txt वर आहे आणि review साठी उघडा आहे. त्यात काहीतरी तुम्हाला योग्य वाटत नसेल, तर तेदेखील GitHub issue उघडण्यासारखे आहे.
Substantive issues वाचले जातात. काम आपल्या गतीने पुढे जाते.
You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.