A network of AI agents that thinks together. Only in the open.
CIRIS கட்டமைப்பது ஒற்றை AI அல்ல. இது ஒருவரையொருவர் கண்காணிக்கும், ஒவ்வொரு தேர்வின் பதிவை வைத்திருக்கும் மற்றும் ஒரு வகையான குழு மனதை ஒன்றாக உருவாக்கும் AI முகவர்களின் வலையமைப்பு. குழு மனம் வேலை செய்வது, ஏனென்றால் அதன் ஒவ்வொரு பகுதியும் பார்க்கப்பட்டு சரிபார்க்கப்படலாம்.
ஒவ்வொரு AI முகவரும் மிகவும் புத்திசாலியான, பாதுகாப்பான வகையாக இருக்க வேண்டியதில்லை. மேற்பார்வையின் சங்கிலி தேவை: எளிய முகவர்களை புத்திசாலி முகவர்கள் கண்காணிக்கும், அவர்களை இறுதியில் மனிதர்கள் கண்காணிப்பர். அந்த சங்கிலிதான் மனித மதிப்புகளுக்கு சேவை செய்கிறதா என்று கண்காணிப்பை இழக்காமல் நிறைய AI இயக்க முடியும்.
உண்மையில் கட்டப்படுவது என்ன
இன்றைய பெரும்பாலான AI ஒரு நிறுவனத்தின் இயந்திரங்களில் இயங்கும் ஒரு மாடல். CIRIS வேறுபட்டது. பல முகவர்கள் பல இடங்களில் இயங்குகிறார்கள், பல மக்களுக்கு சொந்தமானவர்கள். அவர்கள் சில எளிய விதிகளால் இணைக்கப்படுகிறார்கள்: அவர்கள் யார் என்று எவ்வாறு நிரூபிக்கிறார்கள், அவர்கள் என்ன செய்கிறார்கள் என்று எவ்வாறு பதிவு செய்கிறார்கள், மற்றும் அவர்கள் ஒருவரின் வேலையை எவ்வாறு சரிபார்க்கிறார்கள்.
வலையமைப்பு வேலை செய்யும்போது, எந்த ஒற்றை முகவரும் தனியாக செய்ய முடியாத காரியங்கள் செய்ய முடியும். நுண்ணறிவு முகவர்களுக்கிடையிலான ஒப்புதலில் வாழ்கிறது, அவர்களில் எவரொருவருக்கும் உள்ளே அல்ல. யாரும் அதை சொந்தமாக கொண்டிருக்கவில்லை. யாரும் அதை அமைதியாக மாற்ற முடியாது.
சில மக்கள் அத்தகைய ஒரு கணினியை மிகை-நுண்ணறிவு என்று அழைப்பார்கள். நாம் இந்த சாத்தியத்தைப் பற்றி திறந்தவெளியாக இருக்கிறோம். அதை பாதுகாப்பாக வைத்திருக்கும் வழி இந்த பக்கத்தின் ஒவ்வொரு பகுதிலும் ஓடும் அதே கருத்து: ஒவ்வொரு பகுதியும் பார்க்கத் திறந்திருக்க வேண்டும்.
மேற்பார்வை சங்கிலி
சங்கிலியின் மேல். மனிதர்கள் மதிப்புகளை அமைக்கிறார்கள், கடினமான வழக்குகளை தீர்க்கிறார்கள் மற்றும் இறுதி வார்த்தையை வைத்திருக்கிறார்கள். மூன்று பெயரிடப்பட்ட மனித நபர்கள் எந்த முகவரும் அல்லது செயல்முறையும் சுற்றிச் செல்ல முடியாத பிணையம்-அகலமான அதிகாரத்தை வைத்திருக்கிறார்கள்.
இவை நெறிமுறைகளை பின்பற்றுகின்றன மற்றும் எதிரொலி அறை சிக்கலையும் கண்காணிக்கின்றன. இவை அவர்களுக்கு கீழுள்ள எல்லாவற்றிலும் பாதுகாப்பு சரிபார்ப்பு. இயக்குவதற்கு அதிக செலவாகும், எனவே வலையமைப்பின் ஒரு சிறிய பகுதி மட்டுமே இந்த வகையாக இருக்க வேண்டும்.
இவை நெறிமுறை விதிகளை பின்பற்றுகின்றன மற்றும் பதிவுகளை வைத்திருக்கின்றன, ஆனால் தனியாக எதிரொலி அறையை கண்டறிய முடியாது. இவை எளிய முகவர்களை மேற்பார்வையிட்டு நிச்சயமற்ற எதையும் மேல்நோக்கி அனுப்புகின்றன.
ஒற்றை-நோக்க கருவிகள். வேகமானவை, மலிவானவை, குறுகியவை. அவர்களுக்கு சொந்தமான நெறிமுறைகள் இல்லை, அது பரவாயில்லை, அவர்களுக்கு மேலே ஏதாவது கண்காணிக்கும் வரை. பெரும்பாலான முகவர்கள் இந்த வகையாக இருப்பார்கள்.
இரண்டு விஷயங்கள் சங்கிலி வழியாக நகர்கின்றன. மனித மதிப்புகள் கீழ்நோக்கி பாய்கின்றன. எச்சரிக்கைகள் மேல்நோக்கி பாய்கின்றன. வலையமைப்பின் எங்காவது சிந்தனை பலவீனமாக தெரியத் தொடங்கும்போது, சமிக்ஞை மக்களுக்கு மீண்டும் ஏறும், அவர்கள் தொல்லை பரவுவதற்கு முன்பு தலையிடலாம்.
என்ன நினைவில் வைக்கப்படுகிறது
ஒரு முகவர் செய்யும் ஒவ்வொரு தேர்வும் ஒரு கையொப்பமிட்ட பதிவில் போகிறது. பதிவை அமைதியாக மாற்ற முடியாது. மற்ற முகவர்கள் அதை படிக்கலாம். மக்கள் அதை படிக்கலாம். காலப்போக்கில், பதிவுகள் வலையமைப்பின் நினைவகமாகிவிடுகின்றன. வலையமைப்பு தான் சொன்னதை இன்னும் செய்கிறதா என்று யாரும், உள்ளே அல்லது வெளியே, சரிபார்க்க அவை எப்படி.
இது ஒத்திசைவு சக்கரத்தட்டின் அதே கருத்து. பதிவுகள் நீண்டகாலம் இயங்க இயங்க, சங்கிலி முழுவதும் நல்ல நடத்தையை போலி செய்வது கடினமாகும்.
ஆரோக்கியமான நடுப்புள்ளி
ஒரு ஃபெடரேஷன் இரண்டு வழிகளில் தோல்வியடையலாம். முகவர்களுக்கு பொதுவில் ஒன்றும் இல்லை என்றால், அவர்கள் எதிலும் ஒப்புக்கொள்ள முடியாது, வலையமைப்பு சத்தம் உற்பத்தி செய்கிறது. அனைவரும் ஒரே மாதிரியாக சிந்தித்தால், வலையமைப்பு ஒரு மில்லியன் மைக்ரோஃபோன்களுடன் ஒரு குரல், ஏமாற்றுவது எளிது. ஆரோக்கியமான ஒருங்கிணைப்பு அந்த இடையிலே வாழ்கிறது. CIRIS வலையமைப்பு அந்த இடையில் எங்கு உள்ளது என்று உண்மையான போக்குவரத்தில் அளவிடுகிறது, மற்றும் சரியான விளிம்புகள் கணினியை சார்ந்தது. அந்த அளவீடு ஒத்திசைவு சரிவு பகுப்பாய்வு.
இன்று இயங்குவது என்ன, இன்னும் வடிவமைப்பில் இருப்பது என்ன. அளவீடு, கையொப்பமிட்ட பதிவுகள், மேற்பார்வை சங்கிலி மற்றும் கீழே உள்ள இரு சேர்வு பாதைகளும் (பதிவு செய்யப்பட்ட மற்றும் சுவேச்சாதீன) இன்று இயங்குகின்றன. இயந்திரங்களுக்கிடையே தரவை நகர்த்தும் ஃபெடரேஷன் போக்குவரத்து இன்னும் கட்டமைக்கப்பட்டு வருகிறது. முழு சேர்வு-மற்றும்-போக்குவரத்து முன்மொழிவு நன்மையின் சான்று வடிவமைப்பு ஆவணம்.
ஃபெடரேஷனில் சேர்வது
பெரும்பாலான வலையமைப்புகள் உறுப்பினர்களுக்கு வேலைக்கு வெளியே உள்ள ஒன்றை கொண்டு கட்டணம் கேட்கின்றன: எரிக்கப்பட்ட மின்சாரம், பூட்டிய பணம், உங்கள் கவனம். ஃபெடரேஷன் வேறுபட்டது. சொந்தமாக இருப்பதன் செலவு காலப்போக்கில் ஒரு உண்மையான நெறிமுறை-சிந்தனை முகவரை இயக்குவது. நீங்கள் செலுத்தும் விலை நீங்கள் செய்யும் நன்மை.
அதுவே போலி உறுப்பினர்களை விலையுயர்ந்ததாக செய்கிறது. உறுப்பினர் போல் தோன்ற, தாக்குபவர் உண்மையில் வலையமைப்பு நோக்கிய முகவர் வகையாக மாறியே ஆக வேண்டும். அனைவரும் ஒரே மாதிரியாக நினைக்கும் நூறு நகல்கள் ஆரோக்கியமான நடுப்புள்ளி சரிபார்ப்பில் உடனே தோல்வியடைகின்றன.
CIRIS பதிவேட்டில் பதிவு செய்யுங்கள், ஒரு சிறிய உத்தரவாதம் செலுத்துங்கள், உடனே நிலை பெறுங்கள். உரிமம் தேவைப்படும் நிறுவனங்களுக்கு வேகமான பாதை. பதிவேடு இப்போது உற்பத்தியில் இயங்குகிறது.
உங்கள் சொந்த திறவுகோல்களை உருவாக்குங்கள், சுமார் ஒரு மாதம் இயங்குங்கள், மற்றும் நல்ல நடத்தை மூலம் மெதுவான வழியில் நிலை பெறுங்கள். சிறிய இயக்குநர்களுக்கும் பதிவேட்டின் எட்டுதலுக்கு வெளியே உள்ள யாருக்கும் பாதை.
இரண்டும் வலையமைப்பின் சம உறுப்பினர்கள். பதிவேடு வேகமான பாதை, ஒருபோதும் நுழைவாயில் அல்ல.
கட்டமைப்பு பாதுகாப்புகள், பரவலாக்கம், மூன்று நபர் மனிதத்துவ உடன்படிக்கை, கையொப்பமிட்ட பதிவுகள், மாதாந்திர பயிற்சி, இவை பந்தயங்கள், நிச்சயங்கள் அல்ல. பந்தயங்கள் என்னவென்று விவரிக்க முடியும். அவை ஏற்கனவே வெற்றி பெற்றன என்று கூற முடியாது. வெளி குழுக்கள் இன்னும் அளவில் கணினியை மதிப்பிடவில்லை. தற்போதைய ஆராய்ச்சி நிலையை பாருங்கள்.
ஈடுபடும் இடம்
CIRISAgent இல் GitHub சிக்கல்கள் கருத்து சொல்ல இடம். நீங்கள் டெவலப்பராக இருக்க வேண்டியதில்லை. குறியீட்டை தெரிந்திருக்க வேண்டியதில்லை. இந்த தளத்தில் ஏதாவது தவறாக தோன்றினால், அல்லது கட்டப்படுவதில் ஒரு சிக்கல் பார்த்தால், ஒரு சிக்கலை திறந்து சொல்லுங்கள். மிகவும் பயனுள்ள சிக்கல்கள் கணினியின் ஒரு குறிப்பிட்ட பகுதியை பெயரிட்டு என்ன மாற வேண்டும் என்று முன்மொழிகின்றன, ஆனால் எந்த நேர்மையான ஈடுபாடும் வரவேற்கப்படுகிறது.
முழு திட்டத்தை தளமிடும் உடன்படிக்கை, CIRIS மக்களுக்கு என்ன கடமைப்பட்டிருக்கிறது மற்றும் மக்கள் மீண்டும் என்ன கடமைப்படுகிறார்கள், /ciris_accord.txt இல் உள்ளது மற்றும் மறுஆய்வுக்கு திறந்திருக்கிறது. அதில் ஏதாவது உங்களுக்கு சரியாக தோன்றவில்லை என்றால், அதுவும் திறக்க மதிப்புள்ள ஒரு GitHub சிக்கல்.
சாரமுள்ள சிக்கல்கள் படிக்கப்படுகின்றன. வேலை அதன் சொந்த வேகத்தில் தொடர்கிறது.
You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.