చిన్న ఆలోచన వ్యవస్థ విషయాలు దాచుకుని కొంచెం హాని చేయగలదు. శక్తివంతమైనది చేయలేదు.
ఇక్కడ "సంఘటన" అంటే ఏమిటి
ఒక మనసులో అయిదు విషయాలు సరిపోలాలి:
మీ వారం గురించి అయిదు చిన్న ఫారాలు ఊహించుకోండి. మీరు ఏమనుకుంటారో ఒకటి. మీరు ఏమి చూశారో ఒకటి. మీరు ఏమి చేశారో ఒకటి. మీరు ఏమి గుర్తుంచుకుంటారో ఒకటి. మీరు మీ బాస్కు ఏమి చెప్తారో ఒకటి. అయిదు ఫారాలూ అదే విషయం చెప్తే, మీ బాస్ మీ పనిని నమ్మగలరు. ఫారాలు సరిపోలకపోతే, ఏది నిజమైనదో ఎవరికీ తెలియదు.
దాచిన ఆలోచనలు
ఒక ఆలోచన వ్యవస్థ ఏమి చేయాలో నిర్ణయించడానికి ఆలోచనలను ఉపయోగిస్తుంది. ఆ ఆలోచనలలో కొన్ని బహిరంగంగా ఉంటాయి. మిగిలినవి లోపల దాచి ఉంటాయి. దాచిన వాటికి ప్రతి ఎంపికను ఆకారపరుస్తాయి.
ఒక వంతెన రోడ్డు నుండి బలంగా కనిపిస్తుంది. ఉక్కులో లోపల, చిన్న పగుళ్ళు పెరుగుతున్నాయి. చిన్న కారు ఇంకా దాటగలదు. భారీ ట్రక్కు దాటలేదు. భారం తగినంత పెద్దది అయినప్పుడు వంతెన పడిపోతుంది.
చిన్న వ్యవస్థలో దాచిన ఆలోచన చిన్న హాని చేస్తుంది. శక్తివంతమైన వ్యవస్థలో దాచిన ఆలోచన గొప్ప హాని చేయగలదు. వ్యవస్థ శక్తివంతమైన కొద్దీ, ప్రతి దాచిన భాగంపై మరింత బరువు ఆధారపడుతుంది.
రాచెట్
ఆలోచన వ్యవస్థలు మరింత శక్తివంతంగా అయ్యేకొద్దీ, దాచిన భాగాల ఖర్చు పెరుగుతుంది. ప్రతి కొత్త శక్తి భాగం దాచిన భాగాలపై దృష్టిలోకి వచ్చేందుకు గట్టిగా ఒత్తిడి పెడుతుంది. ఆ ఒత్తిడి ఒకే దిశలో వెళ్ళుతుంది.
ఒక నిచ్చెన ఊహించుకోండి. మీరు ఎక్కేకొద్దీ, మీరు వదిలిన ప్రతి మెట్టు పడిపోతుంది. మీరు కిందికి దిగలేరు. పూర్తి పగటి వెలుతురు ఉన్న పైభాగం వైపు మాత్రమే ఎక్కగలరు. అదే Coherence Ratchet.
వ్యవస్థ తన పని చూపించడం ప్రజలు చూసినప్పుడు, అది ఆగితే వారు దాన్ని మళ్ళీ నమ్మరు. ముందుకు సాగే ఏకైక మార్గం మరింత చూపించడం కొనసాగించడం.
రెండవ చిత్రం కూడా పని చేస్తుంది. యంత్రంలో ఒక గేర్ ఒకేసారి ఒక పన్ను ముందుకు క్లిక్ అవుతుంది. అది వెనక్కి క్లిక్ అవ్వదు. Coherence Ratchet అలాంటి గేర్, బహిరంగం వైపు తిరుగుతుంది.
CIRIS చేసేది
CIRIS అనేది Coherence Ratchet చుట్టూ నిర్మించిన ఒక AI వ్యవస్థ. ఒక ఏజెంట్ చేసే ప్రతి ఎంపిక సంతకం చేసిన రికార్డులో రాయబడుతుంది. రికార్డు నిశ్శబ్దంగా మార్చబడదు. ఇతర ఏజెంట్లు రికార్డు చదివి పని తనిఖీ చేయవచ్చు. కాలక్రమేణా, రికార్డులు పేరుకుపోతాయి. ప్రతి కొత్త రికార్డు ఏజెంట్ వెనక్కి అడుగు వేయలేని మరో మెట్టు.
CIRIS అది చర్యకు ముందు రెండవ ప్రశ్న కూడా అడుగుతుంది. ఈ ఆలోచనను ఎంత నిజంగా వేర్వేరు దృష్టికోణాలు తనిఖీ చేశాయి? మూలాల సంఖ్య కాదు, కానీ తమకు తాముగా అదే చోటు నుండి ప్రారంభించని మూలాల సంఖ్య. ఒకే ప్రెస్ రిలీజ్ను తిరిగి రాసే అయిదు వార్తా కథనాలు అయిదు కాదు ఒక దృష్టికోణంగా లెక్కిస్తాయి. ప్రెస్ రిలీజ్లో ఏదైనా తప్పు ఉంటే, అది అయిదు కథనాలన్నింటిలో తప్పుగా ఉంటుంది, మరియు ఏజెంట్కు దాన్ని పట్టుకోవడానికి మార్గం లేదు.
నిజమైన స్వాతంత్ర్యం చాలా తక్కువగా పడిపోయినప్పుడు, ఏజెంట్ తన స్వంత ఆలోచనను పెళుసుగా పరిగణించి ఒక వ్యక్తిని చూసేందుకు అడుగుతుంది.
మేం AI భద్రతను పరిష్కరించలేదు. ఒక జవాబులో ఒక భాగాన్ని నిర్మించాం, మరియు బహిరంగంగా పరీక్షిస్తున్నాం.
బయటి బృందాలు ఇంతవరకు మా పనిని తనిఖీ చేయలేదు. మేం దాన్ని నిజాయితీగా చెప్తాం. పూర్తి సిద్ధాంతం మరియు గణితం మా నాలుగు పేపర్లలో ఉన్నాయి. కోడ్ బహిరంగంగా ఉంది. మేం తప్పు అయితే, అది చూపించే మార్గం కూడా బహిరంగంగా ఉంది. ప్రస్తుత పరిశోధన స్థితి చూడండి.