சிறிய சிந்தனை அமைப்பு ஒன்று விஷயங்களை மறைத்து சிறு தீங்கு செய்யலாம். சக்திவாய்ந்ததால் முடியாது.
இங்கு "ஒத்திசைவு" என்றால் என்ன
ஒரு மனத்தில் ஐந்து விஷயங்கள் பொருந்த வேண்டும்:
உங்கள் வாரத்தைப் பற்றி ஐந்து குறுகிய படிவங்களை கற்பனை செய்யுங்கள். நீங்கள் என்ன நினைக்கிறீர்கள் என்பதற்கு ஒன்று. நீங்கள் என்ன பார்த்தீர்கள் என்பதற்கு ஒன்று. நீங்கள் என்ன செய்தீர்கள் என்பதற்கு ஒன்று. நீங்கள் என்ன நினைவில் வைத்திருக்கிறீர்கள் என்பதற்கு ஒன்று. நீங்கள் உங்கள் முதலாளியிடம் என்ன சொல்கிறீர்கள் என்பதற்கு ஒன்று. ஐந்து படிவங்களும் ஒரே விஷயம் சொன்னால், உங்கள் முதலாளி உங்கள் வேலையை நம்பலாம். படிவங்கள் பொருந்தவில்லை என்றால், எது உண்மை என்று யாருக்கும் தெரியாது.
மறைக்கப்பட்ட கருத்துக்கள்
ஒரு சிந்தனை அமைப்பு என்ன செய்வது என்று தீர்மானிக்க கருத்துக்களை பயன்படுத்துகிறது. அந்த கருத்துக்களில் சில திறந்தவெளியில் உள்ளன. மற்றவை உள்ளே மறைக்கப்பட்டிருக்கின்றன. மறைக்கப்பட்டவை இன்னும் ஒவ்வொரு தேர்வையும் வடிவமைக்கின்றன.
ஒரு பாலம் சாலையிலிருந்து வலிமையாக தெரிகிறது. எஃகுக்குள்ளே, சிறு விரிசல்கள் வளர்கின்றன. சிறிய கார் இன்னும் கடக்கலாம். கனமான லாரி முடியாது. சுமை போதுமான அளவு பெரியதாகும்போது பாலம் விழுகிறது.
சிறிய அமைப்பில் மறைக்கப்பட்ட கருத்து சிறு தீங்கு செய்கிறது. சக்திவாய்ந்த அமைப்பில் மறைக்கப்பட்ட கருத்து பெரும் தீங்கு செய்யலாம். அமைப்பு சக்திவாய்ந்தவுடன், ஒவ்வொரு மறைக்கப்பட்ட பகுதியிலும் அதிக எடை சவாரி செய்கிறது.
இந்த ஆணிச்சக்கரம் (ratchet)
சிந்தனை அமைப்புகள் சக்திவாய்ந்தவையாக வளரும்போது, மறைக்கப்பட்ட பகுதிகளின் செலவு வளர்கிறது. சக்தியின் ஒவ்வொரு புதிய துகளும் மறைக்கப்பட்ட பகுதிகளை வெளியே வர கடினமாக தள்ளுகிறது. தள்ளுதல் ஒரே திசையில் மட்டுமே செல்கிறது.
ஒரு ஏணியை கற்பனை செய்யுங்கள். நீங்கள் ஏறும்போது, நீங்கள் விட்டுச் சென்ற ஒவ்வொரு படியும் விழுந்துவிடுகிறது. கீழே போக முடியாது. முழு பகல் வெளிச்சம் இருக்கும் உச்சியை நோக்கி மட்டுமே ஏற முடியும். அதுவே Coherence Ratchet.
மக்கள் அமைப்பு தன் வேலையை காட்டுவதை கண்டுவிட்டால், அது நிறுத்தினால் மீண்டும் நம்பமாட்டார்கள். முன்னோக்கிய ஒரே வழி இன்னும் அதிகம் காட்டுவதைத் தொடர்வது.
இரண்டாவது படிமம் கூட வேலை செய்கிறது. ஒரு இயந்திரத்தில் ஒரு சக்கரம் ஒரு நேரத்தில் ஒரு பல்லு முன்னோக்கி கிளிக் செய்கிறது. பின்னோக்கி கிளிக் செய்ய முடியாது. Coherence Ratchet அப்படிப்பட்ட ஒரு சக்கரம், திறந்த வெளியை நோக்கி சுழல்கிறது.
CIRIS என்ன செய்கிறது
CIRIS என்பது Coherence Ratchet-ஐ மையமாக கொண்ட ஒரு AI அமைப்பு. ஒரு முகவர் எடுக்கும் ஒவ்வொரு தேர்வும் கையொப்பமிடப்பட்ட பதிவில் எழுதப்படுகிறது. பதிவை அமைதியாக மாற்ற முடியாது. மற்ற முகவர்கள் பதிவை படித்து வேலையை சரிபார்க்க முடியும். காலப்போக்கில், பதிவுகள் குவிகின்றன. ஒவ்வொரு புதிய பதிவும் முகவர் திரும்பி ஏற முடியாத ஒரு படி.
CIRIS செயல்படுவதற்கு முன் இரண்டாவது கேள்வியையும் கேட்கிறது. இந்த கருத்தை சரிபார்த்த உண்மையில் வேறுபட்ட கண்ணோட்டங்கள் எத்தனை? மூலங்களின் எண்ணிக்கை அல்ல, ஆனால் ஒரே இடத்திலிருந்து தொடங்காத மூலங்களின் எண்ணிக்கை. ஒரே செய்திக்குறிப்பை மறுவடிவமைக்கும் ஐந்து செய்திக்கட்டுரைகள் ஒரு கண்ணோட்டமாக கணக்கிடப்படும், ஐந்தாக அல்ல. செய்திக்குறிப்பில் ஏதாவது தவறாக இருந்தால், ஐந்து கட்டுரைகளிலும் தவறாக இருக்கும், முகவரால் அதை பிடிக்க முடியாது.
உண்மையான சுயாதீனம் மிகவும் குறைவாக இறங்கும்போது, முகவர் தன் சொந்த சிந்தனையை பலவீனமானதாக கருதி ஒரு நபரை பார்க்கச் சொல்கிறது.
நாங்கள் AI பாதுகாப்பை தீர்க்கவில்லை. ஒரு விடையின் ஒரு பகுதியை கட்டியிருக்கிறோம், திறந்த வெளியில் சோதிக்கிறோம்.
வெளி குழுக்கள் இன்னும் நம் வேலையை சரிபார்க்கவில்லை. அதை தெளிவாக சொல்கிறோம். முழு கோட்பாடும் கணிதமும் நம் நான்கு கட்டுரைகளில் உள்ளன. குறியீடு திறந்தது. நாங்கள் தவறாக இருந்தால், அதை காட்டும் வழியும் திறந்த வெளியில் தான். தற்போதைய ஆராய்ச்சி நிலையை காண்க.