
జవాబుదారీతనాన్ని తనిఖీ చేయలేకపోతే, అది మార్కెటింగ్ మాత్రమే. ఏమి వెతకాలో, మరియు ఇప్పటి పద్ధతులు ఎలా పోలిస్తాయో ఇక్కడ ఉంది.
మనస్సాక్షి అవసరం. కానీ అది సరిపోదు.
కొంత AI కి అసలు నియమాలే లేవు. కొంత నియమాలు పాటిస్తుంది కానీ దాని మూలాధారాలు ఒకదాన్నొకటి అనుకరిస్తున్నాయని గుర్తించలేవు. ఒక్క రకం మాత్రమే దాని సమాచారం నిజంగా వేర్వేరు చోట్ల నుండి వచ్చిందా అని తనిఖీ చేస్తుంది.
ప్రచురించిన సూత్రాలు లేవు. ఆడిట్ ట్రెయిల్ లేదు. సోర్స్ కోడ్ బంధించబడింది. ఇది ఏమి చేసిందో, ఎందుకు చేసిందో తనిఖీ చేయలేరు.
చాలా వినియోగదారు AI అసిస్టెంట్లు (ChatGPT, Gemini) పబ్లిక్ జవాబుదారీతనం దృష్టికోణం నుండి ఇక్కడే ఉంటాయి. బలమైన అంతర్గత పద్ధతులు ఉండవచ్చు; మీరు వాటిని ధృవీకరించలేరు.
బాహ్య నియంత్రణ అవసరం. స్వయంగా పాలించుకోలేదు.
నైతిక నియమాలు పాటిస్తుంది. కానీ దాని మూలాలన్నీ ఒకదాన్నొకటి నకలు చేస్తున్నాయని గుర్తించలేదు, కాబట్టి నమ్మకంగా తప్పు చేయవచ్చు.
పర్యవేక్షణలో సురక్షితం. స్వయంగా ఎకో చాంబర్లను గుర్తించలేదు.
నైతిక నియమాలు పాటిస్తుంది మరియు దాని సమాచారం నిజంగా వేర్వేరు చోట్ల నుండి వస్తుందా అని తనిఖీ చేస్తుంది. ఒప్పందం అనుమానాస్పదంగా కనిపించినప్పుడు, చర్య తీసుకోవడానికి ముందు దాన్ని గుర్తిస్తుంది.
CIRIS నిర్మించేది ఇదే.
ఒక AI ప్రతి నియమాన్ని పాటించవచ్చు, ప్రతి ఆడిట్ పాస్ చేయవచ్చు, అయినా దాని సమాచారమంతా ఒకే చోట నుండి వస్తే విఫలమవుతుంది. ఆ అంధ బిందువును పరిష్కరించడానికే CIRIS నిర్మించబడింది.
AI ని ఆడిట్ చేయగలిగేలా మరియు జవాబుదారీగా చేసే విషయాలు ఇవి. మొదటి ఆరు సరైన పని చేయడం గురించి. ఏడవది 'సరైన పని చేయడం' తప్పుడు సమాచారంపై ఆధారపడిన పరిస్థితులను గుర్తించడం గురించి.
ఏజెంట్ ఒక పబ్లిక్ నైతిక చట్రాన్ని అనుసరించాలి. దాచిన నియమాలు కాదు: ఎవరైనా చదివి జవాబుదారీ పట్టగలిగే ఒక పత్రం.
ఏజెంట్ దాన్ని చేయడానికి ముందు ప్రతి చర్య మనస్సాక్షి తనిఖీ గుండా వెళుతుంది. తర్వాత కాదు. ముందే.
అనిశ్చితంగా ఉన్నప్పుడు లేదా హాని కలిగించే అవకాశం ఉన్నప్పుడు, ఏజెంట్ అంచనా వేయడం కాకుండా ఒక వ్యక్తిని అడుగుతుంది. వర్క్ఫ్లోలో నిర్మించబడింది, ఐచ్ఛికం కాదు.
ప్రతి నిర్ణయం రికార్డ్ చేయబడి, సంతకం చేయబడుతుంది, తద్వారా ఏమి జరిగిందో, ఎందుకు జరిగిందో ఖచ్చితంగా ధృవీకరించవచ్చు. ప్రతి చర్యకు రసీదు.
అంగీకారం రెండు వైపులా వెళుతుంది. మీరు ఏజెంట్కి నో చెప్పవచ్చు. ఏజెంట్ మీకు నో చెప్పవచ్చు. ఏ వైపూ రాజీ పడేందుకు బలవంతం చేయబడదు.
చూడలేనిదాన్ని ఆడిట్ చేయలేరు. CIRIS AGPL-3.0 కింద పూర్తిగా ఓపెన్ సోర్స్. ఎవరైనా కోడ్ చదవగలరు, ధృవీకరించగలరు, మెరుగుపరచగలరు.
నియమాలు మాత్రమే పట్టుకోలేనిది.
చర్య తీసుకోవడానికి ముందు, ఏజెంట్ అడుగుతుంది: "నా మూలాధారాలు నిజంగా ఒకదానితో ఒకటి విభేదిస్తున్నాయా, లేదా అవన్నీ ఒకే చోట నుండి సమాచారం తీసుకుంటున్నాయా?" ఒకే మూలం నుండి నకలు చేసిన పది మూలాధారాలు నిజానికి ఒక్కటే. ఒప్పందం చాలా ఏకరీతిగా కనిపించినప్పుడు, ఏజెంట్ ఒక వ్యక్తి సమీక్షించేందుకు దాన్ని గుర్తిస్తుంది.
చాలా అల్లరిగా ఉంది
మూలాధారాలు ఒకదానికొకటి చాలా విభేదిస్తున్నాయి, ఏమీ ఉపయోగకరమైన నిర్ణయానికి రాలేరు.
ఆరోగ్యకరం
మూలాధారాలు నిజంగా భిన్నంగా ఉన్నాయి. నిజమైన ఒప్పందం అర్థవంతంగా ఉంది.
ఎకో చాంబర్
ఒప్పదంలా కనిపిస్తుంది, కానీ మూలాధారాలు ఒకదాన్నొకటి పునరావృతం చేస్తున్నాయి.
CIRIS ని ఇతర AI జవాబుదారీతన చట్రాల నుండి వేరు చేసేది ఇదే.
గణితం కావాలా? పూర్తి థీసిస్ చదవండి →ఫిబ్రవరి 2026 నాటి పబ్లిక్గా అందుబాటులో ఉన్న పత్రికల ఆధారంగా. మేము ఏదైనా మిస్ చేసినా లేదా తప్పు చేసినా, మాకు తెలియజేయండి.
| ప్రాజెక్టు | ప్రతి నిర్ణయాన్ని తనిఖీ చేస్తుంది | ప్రచురించిన నియమాలు | మనస్సాక్షి నిర్మించబడింది | ఇది ఏమి చేసిందో రుజువు | ఓపెన్ సోర్స్ | ఎకో చాంబర్ గుర్తింపు |
|---|---|---|---|---|---|---|
| CIRIS | అవును | అవును | అవును | అవును | AGPL-3.0 | అవును |
| Constitutional AI | శిక్షణ మాత్రమే | అంతర్భావంగా | లేదు | లేదు | లేదు | లేదు |
| LlamaFirewall / NeMo Guardrails | అవును | లేదు | లేదు | లాగింగ్ | అవును | లేదు |
| HatCat | అవును | పాక్షికంగా | స్టీరింగ్ | పాక్షికంగా | CC0 | లేదు |
| నైతిక బోర్డులు / పాలన చట్రాలు | లేదు | అవును | లేదు | మాన్యువల్ | మారుతూ ఉంటుంది | లేదు |
అవుట్పుట్ ఫిల్టర్లు మరియు పాలన చట్రాలు ముఖ్యమైన కానీ వేర్వేరు సమస్యలను పరిష్కరిస్తాయి. ఫిల్టర్లు హానికరమైన అవుట్పుట్లను నిరోధిస్తాయి. మనస్సాక్షి విలువల గురించి తర్కిస్తుంది. CIRIS రెండూ చేయాలని, మరియు ఏదీ ఒంటరిగా పరిష్కరించని అంధ బిందువులను గుర్తించాలని లక్ష్యంగా పెట్టుకుంది.
ప్రమాదకరమైన అవుట్పుట్లను నిరోధించండి: ప్రాంప్ట్ ఇంజెక్షన్, హానికరమైన కంటెంట్, అడ్వర్సేరియల్ దాడులు. బయటకు వెళ్ళే దారిలో చెడు విషయాలను పట్టుకునే ఫిల్టర్ లాంటిది.
ఒక చర్య సురక్షితమేనా అని కాకుండా, అది సరైనదా అని తర్కిస్తుంది. నిర్ణయం తీసుకోవడానికి ముందు పరిస్థితిని తూచే న్యాయాధీశుడిలాంటిది.
ఒప్పందం నిజమైనదా లేదా కేవలం పునరావృతమా అని తనిఖీ చేస్తుంది. "మీరందరూ ఒకే వ్యాసం చదివారా?" అని అడిగే ఫాక్ట్-చెకర్ లాంటిది.
అనేక చిన్న ఏజెంట్లు, ప్రతి ఒక్కరూ ప్రచురించిన సూత్రాలకు కట్టుబడి, ప్రతి ఒక్కరూ ఆడిట్ చేయదగినవి, ప్రతి ఒక్కరూ మానవ అధికారానికి అప్పగిస్తున్నారు. ఒక్క కంపెనీ లేదా సంస్థ మొత్తం స్టాక్ను నియంత్రించదు. ఏజెంట్లు ఎంత స్వతంత్రంగా ఉంటే, ఏదైనా ఒక వైఫల్యం విస్తరించడం అంత కష్టమవుతుంది.
ఇది చురుకైన పరిశోధన. నిర్ధారించబడినది మరియు ఇంకా పరీక్షిస్తున్నది ఏమిటో మేము స్పష్టంగా చెప్తాం.
బాగా నిర్ధారించబడింది
ఇంకా పరీక్షిస్తున్నారు
దాన్ని ఆలోచించడం చూడండి
ఒక నిజమైన ఏజెంట్ తర్కాన్ని దశలవారీగా చూడండి. ఒక ట్రేస్ అన్వేషించండి →
దాని గుర్తింపును ధృవీకరించండి
AI కి DMV లాగా, ఏజెంట్లు తమ గుర్తింపు ఎలా నిరూపిస్తారో చూడండి. నమ్మకం & గుర్తింపు →
ప్రారంభించండి
మీ మొదటి ఏజెంట్ను విన్యాసించండి లేదా సాధారణ ఇంగ్లీషులో థీసిస్ చదవండి. మొదటి సంప్రదింపు →
ఈ పేజీలోని ప్రతి వాదన మీరు చదవగలిగిన కోడ్, ధృవీకరించగలిగిన ట్రేసులు, మరియు తనిఖీ చేయగలిగిన పరిశోధన ద్వారా మద్దతు పొందింది. అదే ముఖ్యమైన విషయం.