మొదటి సంప్రదింపుఇన్‌స్టాల్సంఘటన రాచెట్ఫెడరేషన్పోల్చండిపరిశోధనఒప్పందంGitHub
ఈ పేజీని యంత్రం అనువదించింది. ఏదైనా తప్పుగా చదివితే, దయచేసి ఒక సమస్య తెరవండి — రెపో ఒక కారణంతో బహిరంగంగా ఉంది. అనువాద సమస్యను నివేదించండి

The Coherence Ratchet

Why a powerful mind has to show its work.

Research testbedDOI

చిన్న ఆలోచన వ్యవస్థ విషయాలు దాచుకుని కొంచెం హాని చేయగలదు. శక్తివంతమైనది చేయలేదు.

ఇక్కడ "సంఘటన" అంటే ఏమిటి

సంఘటన మనసు తనతో తానే ఏకీభవిస్తుంది.

ఒక మనసులో అయిదు విషయాలు సరిపోలాలి:

  • అది నమ్మేది,
  • అది చూసేది,
  • అది చేసేది,
  • అది గుర్తుంచుకునేది,
  • మరియు అది మీకు చెప్పేది.

మీ వారం గురించి అయిదు చిన్న ఫారాలు ఊహించుకోండి. మీరు ఏమనుకుంటారో ఒకటి. మీరు ఏమి చూశారో ఒకటి. మీరు ఏమి చేశారో ఒకటి. మీరు ఏమి గుర్తుంచుకుంటారో ఒకటి. మీరు మీ బాస్‌కు ఏమి చెప్తారో ఒకటి. అయిదు ఫారాలూ అదే విషయం చెప్తే, మీ బాస్ మీ పనిని నమ్మగలరు. ఫారాలు సరిపోలకపోతే, ఏది నిజమైనదో ఎవరికీ తెలియదు.

దాచిన ఆలోచనలు

శక్తివంతమైన వ్యవస్థలు విషయాలు దాచుకుంటాయి. అది ప్రమాదకరంగా మారుతుంది.

ఒక ఆలోచన వ్యవస్థ ఏమి చేయాలో నిర్ణయించడానికి ఆలోచనలను ఉపయోగిస్తుంది. ఆ ఆలోచనలలో కొన్ని బహిరంగంగా ఉంటాయి. మిగిలినవి లోపల దాచి ఉంటాయి. దాచిన వాటికి ప్రతి ఎంపికను ఆకారపరుస్తాయి.

ఒక వంతెన రోడ్డు నుండి బలంగా కనిపిస్తుంది. ఉక్కులో లోపల, చిన్న పగుళ్ళు పెరుగుతున్నాయి. చిన్న కారు ఇంకా దాటగలదు. భారీ ట్రక్కు దాటలేదు. భారం తగినంత పెద్దది అయినప్పుడు వంతెన పడిపోతుంది.

చిన్న వ్యవస్థలో దాచిన ఆలోచన చిన్న హాని చేస్తుంది. శక్తివంతమైన వ్యవస్థలో దాచిన ఆలోచన గొప్ప హాని చేయగలదు. వ్యవస్థ శక్తివంతమైన కొద్దీ, ప్రతి దాచిన భాగంపై మరింత బరువు ఆధారపడుతుంది.

రాచెట్

బహిరంగ దిశలో ఒత్తిడి ఒకే దిశలో వెళ్ళుతుంది.

ఆలోచన వ్యవస్థలు మరింత శక్తివంతంగా అయ్యేకొద్దీ, దాచిన భాగాల ఖర్చు పెరుగుతుంది. ప్రతి కొత్త శక్తి భాగం దాచిన భాగాలపై దృష్టిలోకి వచ్చేందుకు గట్టిగా ఒత్తిడి పెడుతుంది. ఆ ఒత్తిడి ఒకే దిశలో వెళ్ళుతుంది.

ఒక నిచ్చెన ఊహించుకోండి. మీరు ఎక్కేకొద్దీ, మీరు వదిలిన ప్రతి మెట్టు పడిపోతుంది. మీరు కిందికి దిగలేరు. పూర్తి పగటి వెలుతురు ఉన్న పైభాగం వైపు మాత్రమే ఎక్కగలరు. అదే Coherence Ratchet.

వ్యవస్థ తన పని చూపించడం ప్రజలు చూసినప్పుడు, అది ఆగితే వారు దాన్ని మళ్ళీ నమ్మరు. ముందుకు సాగే ఏకైక మార్గం మరింత చూపించడం కొనసాగించడం.

రెండవ చిత్రం కూడా పని చేస్తుంది. యంత్రంలో ఒక గేర్ ఒకేసారి ఒక పన్ను ముందుకు క్లిక్ అవుతుంది. అది వెనక్కి క్లిక్ అవ్వదు. Coherence Ratchet అలాంటి గేర్, బహిరంగం వైపు తిరుగుతుంది.

CIRIS చేసేది

రాయండి. తనిఖీ చేయండి. అప్పుడు తనిఖీదారులను తనిఖీ చేయండి.

CIRIS అనేది Coherence Ratchet చుట్టూ నిర్మించిన ఒక AI వ్యవస్థ. ఒక ఏజెంట్ చేసే ప్రతి ఎంపిక సంతకం చేసిన రికార్డులో రాయబడుతుంది. రికార్డు నిశ్శబ్దంగా మార్చబడదు. ఇతర ఏజెంట్లు రికార్డు చదివి పని తనిఖీ చేయవచ్చు. కాలక్రమేణా, రికార్డులు పేరుకుపోతాయి. ప్రతి కొత్త రికార్డు ఏజెంట్ వెనక్కి అడుగు వేయలేని మరో మెట్టు.

CIRIS అది చర్యకు ముందు రెండవ ప్రశ్న కూడా అడుగుతుంది. ఈ ఆలోచనను ఎంత నిజంగా వేర్వేరు దృష్టికోణాలు తనిఖీ చేశాయి? మూలాల సంఖ్య కాదు, కానీ తమకు తాముగా అదే చోటు నుండి ప్రారంభించని మూలాల సంఖ్య. ఒకే ప్రెస్ రిలీజ్‌ను తిరిగి రాసే అయిదు వార్తా కథనాలు అయిదు కాదు ఒక దృష్టికోణంగా లెక్కిస్తాయి. ప్రెస్ రిలీజ్‌లో ఏదైనా తప్పు ఉంటే, అది అయిదు కథనాలన్నింటిలో తప్పుగా ఉంటుంది, మరియు ఏజెంట్‌కు దాన్ని పట్టుకోవడానికి మార్గం లేదు.

నిజమైన స్వాతంత్ర్యం చాలా తక్కువగా పడిపోయినప్పుడు, ఏజెంట్ తన స్వంత ఆలోచనను పెళుసుగా పరిగణించి ఒక వ్యక్తిని చూసేందుకు అడుగుతుంది.

మేం చెప్పేది, మేం చెప్పనిది.

మేం AI భద్రతను పరిష్కరించలేదు. ఒక జవాబులో ఒక భాగాన్ని నిర్మించాం, మరియు బహిరంగంగా పరీక్షిస్తున్నాం.

బయటి బృందాలు ఇంతవరకు మా పనిని తనిఖీ చేయలేదు. మేం దాన్ని నిజాయితీగా చెప్తాం. పూర్తి సిద్ధాంతం మరియు గణితం మా నాలుగు పేపర్లలో ఉన్నాయి. కోడ్ బహిరంగంగా ఉంది. మేం తప్పు అయితే, అది చూపించే మార్గం కూడా బహిరంగంగా ఉంది. ప్రస్తుత పరిశోధన స్థితి చూడండి.