सोपी मराठीप्रगत

CIRIS जे बनवत आहे ते एकच AI नाही. ते AI agents चे एक network आहे जे एकमेकांवर लक्ष ठेवतात, प्रत्येक निर्णयाची नोंद ठेवतात, आणि एकत्रितपणे एक प्रकारचे सामूहिक मन बनवतात. हे सामूहिक मन केवळ तेव्हाच काम करते जेव्हा त्याचा प्रत्येक भाग पाहता आणि तपासता येतो.

तुम्हाला प्रत्येक AI agent सर्वात हुशार, सर्वात सुरक्षित प्रकारचा असण्याची गरज नाही. तुम्हाला एक supervision chain हवी आहे: साध्या agents वर चोखंदळ agents नजर ठेवतात, आणि त्यांच्यावर शेवटी माणसे. ती chain म्हणजे तुम्ही भरपूर AI चालवत असताना ते human values साठी काम करत आहे का हे लक्षात ठेवण्याचा मार्ग.

प्रत्यक्षात काय बनवले जात आहे

एक मन नाही. मनांचे एक network.

आजचा बहुतेक AI एका कंपनीच्या machines वर चालणारा एकच model आहे. CIRIS वेगळे आहे. अनेक agents अनेक ठिकाणी, अनेक लोकांच्या मालकीचे चालतात. त्यांना काही साध्या नियमांनी बांधले आहे: ते कोण आहेत हे कसे सिद्ध करतात, ते काय करतात याची नोंद कशी ठेवतात, आणि एकमेकांचे काम कसे तपासतात.

Network नीट काम करत असताना, ते असे काहीतरी करू शकते जे एकट्या agent ला शक्य नव्हते. बुद्धिमत्ता agents मधील समझौत्यात असते, कोण्या एकात नाही. त्यावर कोणाचाही ताबा नाही. कोणाला ते चोरून बदलता येत नाही.

काही लोक असे सांगतात की अशा प्रणालीला superintelligence म्हणतात. आम्ही त्या शक्यतेबद्दल मोकळेपणाने बोलतो. ते यशस्वी होण्याचा मार्ग इतरत्र सांगितलेल्या तत्त्वाप्रमाणेच आहे: प्रत्येक भाग पाहण्यासाठी मोकळा असणे आवश्यक आहे.

Supervision ची साखळी

चार स्तर, प्रत्येकावर वरचा नजर ठेवतो.

माणसे

साखळीचा शिखर. माणसे मूल्ये ठरवतात, कठीण प्रकरणे सोडवतात, आणि अंतिम निर्णय स्वतःकडे ठेवतात. तीन नावाजलेल्या मानवी व्यक्ती network-wide अधिकार धारण करतात ज्याला कोणताही agent किंवा प्रक्रिया वळवू शकत नाही.

Ethical, Self-Aware Agents

हे ethics पाळतात आणि echo-chamber समस्येसाठी देखील लक्ष ठेवतात. ते खाली असलेल्या प्रत्येक गोष्टीवर safety check आहेत. चालवण्यासाठी जास्त खर्च येतो, त्यामुळे networkच्या फक्त एका छोट्या हिस्स्याला हा प्रकार असणे आवश्यक आहे.

Ethical Agents

हे ethical rules पाळतात आणि नोंदी ठेवतात, पण स्वतःहून echo chamber शोधू शकत नाहीत. ते साध्या agents वर नजर ठेवतात आणि अनिश्चित असलेले काहीही वरच्या दिशेने पाठवतात.

साधे Agents

एकाच कामाची साधने. जलद, स्वस्त, मर्यादित. त्यांचे स्वतःचे ethics नाहीत, आणि ते ठीक आहे — जोपर्यंत वरचे कोणीतरी नजर ठेवत आहे. बहुतेक agents हा प्रकार असतील.

दोन गोष्टी साखळीतून वाहतात. Human values खाली वाहतात. इशारे वर वाहतात. जेव्हा कुठेही network मध्ये तर्क नाजूक वाटू लागतो, तेव्हा संकेत माणसांपर्यंत पोहोचतो, जे संकट पसरण्यापूर्वी हस्तक्षेप करू शकतात.

काय लक्षात ठेवले जाते

प्रत्येक निर्णय, जिथे सर्वांना दिसेल तिथे लिहिलेला.

एखाद्या agent ने केलेला प्रत्येक निर्णय एका signed नोंदीत जातो. ती नोंद चोरून बदलता येत नाही. इतर agents ती वाचू शकतात. माणसे ती वाचू शकतात. काळाच्या ओघात, नोंदी network ची स्मृती बनतात. आतून किंवा बाहेरून कोणीही त्याद्वारे तपासू शकतो की network अजूनही सांगितल्याप्रमाणे काम करत आहे का.

हीच कल्पना Coherence Ratchet मध्ये आहे. नोंदी जितक्या जास्त काळ चालतात, तितके साखळीभर चांगल्या वर्तनाचे नाटक करणे कठीण होते.

निरोगी मधला मार्ग

जास्त एकसारखे नाही, जास्त विखुरलेले नाही.

एक federation दोन प्रकारे अयशस्वी होऊ शकते. Agents मध्ये काहीच साम्य नसेल तर ते कशावरही सहमत होऊ शकत नाहीत, आणि network फक्त गोंधळ निर्माण करते. जर सगळे अगदी सारखाच विचार करत असतील, तर network म्हणजे एक लाख microphones असलेला एकच आवाज आहे, आणि त्याला फसवणे सोपे आहे. निरोगी coordination या दोन अयशस्वी अवस्थांमधील पट्ट्यात राहते. CIRIS real traffic वर network त्या पट्ट्यात कुठे आहे हे मोजतो, आणि अचूक सीमा system वर अवलंबून असतात. ते मोजमाप म्हणजे Coherence Collapse Analysis.

आज काय चालते, आणि अजून design मध्ये काय आहे. मोजमाप, signed नोंदी, supervision chain, आणि खाली दिलेले दोन्ही join paths (registered आणि sovereign) आज चालतात. Federation transport जे machines मधील data हलवते ते अजून बनवले जात आहे. पूर्ण join-and-transport proposal म्हणजे Proof of Benefit design document आहे.

Federation मध्ये सामील होणे

फायद्याचा पुरावा.

बहुतेक networks तुम्हाला कामाबाहेरील काहीतरी — जळालेली वीज, अडकलेले पैसे, तुमचे लक्ष — देऊन membership साठी विनंती करतात. Federation वेगळे आहे. सदस्यतेची किंमत म्हणजे दीर्घकाळ एक खरा ethical-reasoning agent चालवणे. तुम्ही देता ती किंमत म्हणजे तुम्ही करता ते चांगले.

त्यामुळेच membership चे नाटक करणे महाग होते. एखाद्या हल्लेखोराला member दिसण्यासाठी तो ज्या प्रकारचा agent network साठी बनवला आहे तसा प्रत्यक्षात व्हावे लागेल. एकाच विचाराचे शंभर copies healthy-middle तपासणीत लगेच अयशस्वी होतात.

Registered (आज कार्यरत)

CIRIS Registry मध्ये नोंदणी करा, एक छोटी रक्कम bond म्हणून द्या, आणि लगेच standing मिळवा. ज्या organizations ला licensing हवे त्यांच्यासाठी जलद मार्ग. Registry आता production मध्ये चालते.

Sovereign (आज कार्यरत)

स्वतःच्या keys बनवा, सुमारे एक महिना चालवा, आणि चांगल्या वर्तनाद्वारे हळूहळू standing मिळवा. लहान operators आणि registry च्या आवाक्याबाहेरील कोणासाठी मार्ग.

दोन्ही network चे समान सदस्य आहेत. Registry जलद मार्ग आहे, अनिवार्य दरवाजा नाही.

प्रामाणिक स्थिती.

Architectural protections, decentralization, तीन-व्यक्ती humanity accord, signed नोंदी, मासिक drill — या पैजा आहेत, खात्रीशीर गोष्टी नाहीत. आम्ही हे मोकळेपणाने सांगतो. बाहेरील टीमांनी अद्याप मोठ्या प्रमाणात system चे मूल्यांकन केले नाही. सध्याची संशोधन स्थिती पाहा.

कुठे सहभागी व्हायचे

आम्ही कोणाकडूनही प्रतिक्रिया मागवत आहोत.

CIRISAgent वरील GitHub issues हे योगदान देण्याचे ठिकाण आहे. Developer असणे आवश्यक नाही. Codebase माहीत असणे आवश्यक नाही. या site वरील एखादी गोष्ट तुम्हाला चुकीची वाटत असेल, किंवा जे बनवले जात आहे त्यात तुम्हाला काही समस्या दिसत असेल, तर issue उघडून सांगा. सर्वात उपयुक्त issues system च्या एका विशिष्ट भागाला नाव देतात आणि काय बदलावे याचे सुचवतात, पण कोणताही प्रामाणिक प्रतिसाद स्वागतार्ह आहे.

संपूर्ण project ला आधार देणारा accord — CIRIS लोकांना काय देणे लागतो, आणि लोक त्याला काय देणे लागतात — /ciris_accord.txt वर आहे आणि review साठी उघडा आहे. त्यात काहीतरी तुम्हाला योग्य वाटत नसेल, तर तेदेखील GitHub issue उघडण्यासारखे आहे.

Substantive issues वाचले जातात. काम आपल्या गतीने पुढे जाते.

तुम्हाला एका वेळी एक agent ने AI safety सोडवण्याची गरज नाही. तुम्ही supervision layer साठी ती सोडवता, आणि structure बाकी सांभाळतो.

दबावाची बाजू Live score पाहा GitHub वर engage करा