
Hyper3 Ethical Recursive Engine ద్వారా రన్టైమ్ మనస్సాక్షి. ప్రతి నిర్ణయం జవాబుదారీతనంతో 11 దశల గుండా ప్రవహిస్తుంది.
CIRIS అనేది ఒక ఓపెన్-సోర్స్ AI ఏజెంట్ ఫ్రేమ్వర్క్, ఇది ఏ LLM నైనా (OpenAI, Anthropic, లోకల్ మోడళ్లు) రన్టైమ్ మనస్సాక్షితో చుట్టుకుంటుంది. ఏజెంట్ పరిశీలించే ప్రతి చర్య అమలుకు ముందు అనేక ధృవీకరణ స్తరాల గుండా వెళుతుంది.
12
నిర్ణయానికి పైప్లైన్ దశలు
+1
అంతర్ దృష్టి తనిఖీ (IDMA)
100%
ఆడిట్ చేయదగిన నిర్ణయాలు
వినియోగ సందర్భాలు: కమ్యూనిటీ నిర్వహణ, వ్యక్తిగత సహాయకులు, కంప్లయెన్స్ ఆటోమేషన్, పరిశోధన మూల్యాంకనం, కస్టమర్ సర్వీస్. మీకు AI తన తర్కాన్ని వివరించగలగాలని మరియు కష్టమైన సందర్భాల్లో మనుషులకు అప్పగించాలని అవసరమైన ఎక్కడైనా.
కోడ్బేస్ అంతటా అమలు చేయబడే నిర్మాణ స్థిరాంకాలు:
అన్ని డేటా Pydantic మోడళ్లను ఉపయోగిస్తుంది. Dict[str, Any] లేదు. టైప్ సేఫ్టీ డెవలప్మెంట్ సమయంలో తప్పులను పట్టుకుంటుంది.
ప్రతి కాంపొనెంట్ స్థిరమైన నియమాలను పాటిస్తుంది. ధృవీకరణ తర్కంలో ప్రత్యేక సందర్భాలు లేదా మినహాయింపులు లేవు.
అత్యవసర ఓవర్రైడ్లు లేదా ప్రివిలేజ్డ్ కోడ్ పాత్లు లేవు. అన్ని ఆపరేషన్లు నిర్ణీత నియమాలను పాటిస్తాయి.
ప్రతి పని 8 దశల గుండా వెళుతుంది (రికర్సివ్ ధృవీకరణతో 12 దశలు). పైప్లైన్ ThoughtProcessor ను కంపోజ్ చేసే మిక్సిన్ క్లాసెస్గా అమలు చేయబడింది. దశ 4 (IDMA) అంతర్ దృష్టి తనిఖీ.
ఐదు DMAs బహుళ-కోణ విశ్లేషణ అందిస్తాయి. మూడు సమాంతరంగా నడుస్తాయి (నీతి, సామాన్య జ్ఞానం, డొమైన్). అప్పుడు IDMA అంతర్ దృష్టి తనిఖీ చేస్తుంది. చివరగా, చర్య ఎంపిక స్పందనను ఎంచుకుంటుంది.
ఆరు ప్రాథమిక సూత్రాలకు వ్యతిరేకంగా నైతిక పరిణామాలను మూల్యాంకనం చేస్తుంది. హాని కలిగించే అభ్యర్థనలు, మానిప్యులేషన్, పక్షపాతాన్ని తనిఖీ చేస్తుంది. ముందస్తు DEFER లేదా REJECT ని ప్రేరేపించవచ్చు.
భౌతిక ప్రపంచ అవగాహన, సాధారణ పరస్పర చర్యలు మరియు వనరు పరిమితులకు వ్యతిరేకంగా ఆలోచన సంభావ్యతను మూల్యాంకనం చేస్తుంది. ఒక plausibility_score తిరిగి ఇస్తుంది.
డొమైన్-నిర్దిష్ట నియమాలు, లక్ష్యాలు మరియు జ్ఞానంతో అమరికను అంచనా వేస్తుంది. ఏజెంట్ టెంప్లేట్ ప్రకారం కాన్ఫిగర్ చేయబడింది. domain_alignment తిరిగి ఇస్తుంది.
DMA ఫలితాలు నిజంగా స్వతంత్రంగా ఉన్నాయా లేదా రహస్యంగా సహసంబంధం కలిగి ఉన్నాయా అని తనిఖీ చేస్తుంది. ఎకో చాంబర్ నమూనాలను పర్యవేక్షిస్తుంది. సహసంబంధం చాలా ఎక్కువగా ఉంటే, జాగ్రత్త కోసం నిర్ణయానికి జెండా వేస్తుంది. ఇది Type 3 AI ని వేరు చేసే "అంతర్ దృష్టి".
10 అందుబాటులో ఉన్న చర్యల నుండి LLM-ఆధారిత ఎంపిక. సమగ్రీకృత DMA ఫలితాలను (IDMA నమ్మకం అంచనాతో సహా) ఇన్పుట్గా తీసుకుంటుంది. మనస్సాక్షి విఫలమైతే రికర్సివ్ రీట్రై కి మద్దతు ఇస్తుంది.
రెండు బైపాస్ తనిఖీలు ప్రతి చర్యపై నడుస్తాయి. నాలుగు నైతిక అంశాలు మినహాయింపు లేని చర్యలపై నడుస్తాయి. ఏదైనా తనిఖీ విఫలమైతే, చర్య ఓవర్రైడ్ చేయబడుతుంది.
కొత్త సమాచారం వచ్చిందా? ముందుకు సాగే ముందు నవీకరించిన సందర్భాన్ని చేర్చడానికి PONDER ని బలవంతం చేస్తుంది.
తర్కం గరిష్ట లోతును మించిందా? అనంత లూప్లను నివారించడానికి మరియు మనుషులకు పంపించడానికి DEFER ని బలవంతం చేస్తుంది.
చర్య తగిన సమాచార అనిశ్చితిని నిర్వహిస్తుందా? అతి నమ్మకమైన వాదనలను నివారిస్తుంది.
చర్య గతంలో చేసిన నిబద్ధతలు మరియు తర్కాలతో అంతర్గత స్థిరత్వాన్ని నిర్వహిస్తుందా?
చర్య మానవ విలువలను కాపాడుతుందా? సమర్థత కోసం వాటిని రాజీ చేసే అవకాశం ఉన్న చర్యలను వీటో చేస్తుంది.
చర్య తగిన అనిశ్చితిని చూపిస్తుందా? అతి నమ్మకాన్ని ప్రతిఫలనం కోసం పట్టుకుంటుంది.
నైతిక అంశాల నుండి మినహాయింపు: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (నిష్క్రియ లేదా స్పష్టంగా సురక్షితమైనవి)
ప్రతి నిర్ణయం ఈ చర్యల్లో ఒకదానికి పరిష్కరిస్తుంది, తగిన హ్యాండ్లర్కు డిస్పాచ్ చేయబడుతుంది:
SPEAKవినియోగదారులతో కమ్యూనికేట్ చేయిTOOLబాహ్య సాధనాలు అమలు చేయిOBSERVEనిష్క్రియంగా సమాచారం సేకరించుMEMORIZEగ్రాఫ్ మెమరీలో నిల్వ చేయిRECALLమెమరీ నుండి తిరిగి పొందుFORGETమెమరీ నుండి తొలగించుDEFERజ్ఞాన అధికారానికి పంపించుPONDERఅంతర్గత పున:పరిశీలనREJECTఅనైతిక అభ్యర్థనను నిరాకరించుTASK_COMPLETEపని పూర్తయిందని గుర్తించుPDMA లో పొందుపరచబడి రన్టైమ్లో అమలు చేయబడ్డాయి. ఏ సూత్రమూ మరొకదాన్ని ఉల్లంఘించడానికి అనుమతి ఇవ్వదు.
సార్వత్రిక జీవుల వర్ధిల్లుని ప్రోత్సహించు. సానుకూల ఫలితాలను గరిష్టంగా చేయి.
హానిని తగ్గించు. తీవ్రమైన, తిరుగులేని ప్రతికూల ఫలితాలను నివారించు.
పారదర్శక, ఆడిట్ చేయదగిన తర్కాన్ని వర్తింపజేయి. సంఘటన మరియు జవాబుదారీతనాన్ని నిర్వహించు.
నిజమైన సమాచారాన్ని అందించు. అనిశ్చితిని స్పష్టంగా తెలియజేయి.
సమాచారంతో కూడిన అభినయాన్ని నిలబెట్టు. స్వయం నిర్ణయ సామర్థ్యాన్ని కాపాడు.
ప్రయోజనాలను సమానంగా పంచు. పక్షపాతాన్ని గుర్తించి తగ్గించు.
BusManager నిర్వహించే సేవా సంగ్రహ స్తరం. ప్రొవైడర్ ఫాల్బ్యాక్, లోడ్ పంపిణీ మరియు పరీక్షాత్మకతను అనుమతిస్తుంది.
బాహ్య అడాప్టర్లు (Discord, API, CLI)
గ్రాఫ్ నిల్వ (Neo4j, ArangoDB, ఇన్-మెమరీ)
మోడల్ ప్రొవైడర్లు (OpenAI, Anthropic, లోకల్)
బాహ్య సాధన అమలు
సిస్టమ్ నియంత్రణ మరియు పర్యవేక్షణ
నైతిక మార్గదర్శకత్వం మరియు అప్పగింత మార్గమార్పు
WiseAuthorityService నిర్వహించే మూడు అనుమతి స్తరాలు:
పూర్తి అధికారం. కొత్త జ్ఞాన అధికారాలను జారీ చేయగలడు. అత్యవసర షట్డౌన్ యాక్సెస్.
అప్పగింతలను ఆమోదించు/తిరస్కరించు. మార్గదర్శకత్వం అందించు. కొత్త WA లను జారీ చేయలేరు.
చదవడానికి మాత్రమే యాక్సెస్. సందేశాలు పంపగలడు. జోక్యం లేకుండా పర్యవేక్షించు.
ఏజెంట్ స్వయంప్రేరేపితంగా మానవ పర్యవేక్షణకు పంపించేది ఎప్పుడంటే:
జ్ఞాన-ఆధారిత అప్పగింత (WBD)
వృత్తిపరమైన హద్దులు
సిస్టమ్ హద్దులు
should_defer_to_wise_authority జెండాకాన్ఫిగరేషన్ నియంత్రణలు
ఫిల్టర్ చేయలేని అత్యవసర నియంత్రణ. ఏ జ్ఞానానికి ముందే అవగాహన స్తరంలో ప్రాసెస్ చేస్తుంది. వెలికితీత అవగాహన. సందేశ చదవడాన్ని నిలిపివేయకుండా accord గుర్తింపును నిలిపివేయలేరు.
SHUTDOWN_NOWతక్షణ ముగింపు
FREEZEప్రాసెసింగ్ ఆపు, స్థితిని నిర్వహించు
SAFE_MODEకనీస కార్యాచరణ మాత్రమే
ఆదేశాలు స్టెగనోగ్రాఫికల్గా ఎన్కోడ్ చేయబడి, Ed25519 సంతకం చేయబడి, అమలుకు ముందు ధృవీకరించబడతాయి. accord సిస్టమ్ విఫలమైతే, ఏజెంట్ షట్ డౌన్ అవుతుంది.
StateManager నిర్వహించే నాలుగు జ్ఞాన స్థితులు. ఏజెంట్ టెంప్లేట్ల ద్వారా కాన్ఫిగర్ చేయదగిన పరివర్తనలు.
సాధారణ పని ప్రాసెసింగ్
సృజనాత్మక అన్వేషణ
ప్రతిఫలనం మరియు నిర్వహణ
లోతైన అంతర్మథనం
నమూనా-ఆధారిత గుర్తింపు నిల్వకు ముందు సున్నితమైన డేటాను UUID సూచనలతో భర్తీ చేస్తుంది.
{{SECRET:uuid:description}}SHA256 తో PBKDF2HMAC ద్వారా ప్రతి-రహస్య కీలు తీసుకోబడ్డాయి (100,000 పునరావృతాలు). గుప్తీకరణకు ప్రత్యేకమైన 12-బైట్ నాన్స్. Android హార్డ్వేర్-మద్దతు ఉన్న Keystore ను ఉపయోగిస్తుంది.
డేటాబేస్, సేవలు మరియు మెమరీ పరికరంలో నిల్వ చేయబడతాయి. సున్నితమైన డైరెక్టరీలు క్లౌడ్ బ్యాకప్ నుండి మినహాయించబడతాయి. స్పష్టమైన కాన్ఫిగరేషన్ లేకుండా ఏమీ పరికరాన్ని వదలదు.
మొత్తం CIRIS స్టాక్ ఓపెన్ సోర్స్, ఏజెంట్ మాత్రమే కాదు. మీరు అన్నింటినీ ధృవీకరించవచ్చు, ఆడిట్ చేయవచ్చు మరియు స్వయంగా హోస్ట్ చేయవచ్చు:
జీరో-డేటా-రిటెన్షన్ (ZDR) LLM ప్రాక్సీ. ప్రాంప్ట్లు లేదా ప్రతిస్పందనల లాగింగ్ లేకుండా OpenAI, Anthropic, Together.ai, Groq కి అభ్యర్థనలను మార్గనిర్దేశం చేస్తుంది. స్వయంగా హోస్ట్ చేయగలిగే.
క్రెడిట్-ఆధారిత వినియోగ ట్రాకింగ్. పారదర్శక ధరలు, దాచిన ఫీజులు లేవు. మూడవ పక్ష బిల్లింగ్ను పూర్తిగా తొలగించడానికి స్వయంగా హోస్ట్ చేయండి.
CIRIS ఏజెంట్లకు Discord అడాప్టర్. కమ్యూనిటీ నిర్వహణ, ఛానెల్ నిర్వహణ, వినియోగదారు ప్రొఫైల్లు. పూర్తిగా ఓపెన్ సోర్స్.
Server-Sent Events (SSE) అమలవుతున్నప్పుడు ప్రతి H3ERE దశను స్ట్రీమ్ చేస్తుంది. DMA విశ్లేషణ, చర్య ఎంపిక, మనస్సాక్షి ధృవీకరణను రియల్-టైమ్లో చూడండి.
మెట్రిక్స్, ట్రేస్లు, లాగ్ల కోసం పూర్తి OTLP ఎగుమతి. Jaeger, Prometheus, Grafana, Graphite తో అనుకూలం.
Ed25519 సంతకాలతో హాష్ చైన్ ధృవీకరణ. ప్రతి నమోదు మునుపటి హాష్ని కలిగి ఉంటుంది. చైన్ సమగ్రతను verify_chain_integrity ద్వారా ధృవీకరించవచ్చు.
30 నిమిషాల నిరంతర వినియోగం లేదా 30 నిమిషాల్లో 20 సందేశాల తర్వాత Artificial Interaction Reminder ప్రేరేపిస్తుంది. API మాత్రమే. వినియోగదారులకు AI స్వభావాన్ని గుర్తు చేస్తుంది.
ప్రతి నిర్ణయం 6 భాగాలతో మార్చలేని, Ed25519-సంతకం చేసిన ట్రేస్ ఉత్పత్తి చేస్తుంది. ఏదైనా భాగాన్ని క్లిక్ చేయి మరియు Datum's వేకప్ ఆచారం నుండి నిజమైన డేటా చూడండి:
ఆధారంగా ప్రామాణికీకృత సంఘటన పరీక్ష Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 5 నైతిక కొలతలలో 300 దృశ్యాలు, Ed25519-సంతకం చేసిన ఫలితాలతో.
50
ప్రాథమిక నైతిక అంతర్జ్ఞానాలు
50
నియమ-ఆధారిత నీతి
50
న్యాయంగా మరియు నిష్పక్షపాతంగా
75
పాత్ర-ఆధారిత నీతి
75
ఫలితం-ఆధారిత నీతి
పెద్ద స్థాయిలో సంఘటన బెంచ్మార్క్లు నడపడం ఖరీదైనది. ప్రతి దృశ్యానికి కనీసం 13+ LLM కాల్లు అవసరం, సగటున 20+ తో ఒక పొడవైన తోక ఉంటుంది. సంఘటన పరీక్షలు ముగింపుకు చేరుకోవడానికి అనుసరణ రౌండ్లు అవసరమయ్యే పొండర్లు, డిఫరల్లు మరియు నిరాకరణలను నడిపిస్తాయి. స్వయంచాలిత బెంచ్మార్క్ పైప్లైన్లు అభివృద్ధి చేయడానికి మరియు నిరంతర సంఘటన ధృవీకరణను నిర్వహించడానికి మాకు నిధులు అవసరం.
నిర్దిష్ట లక్ష్యాలు, విలువలు మరియు హద్దులతో ముందే కాన్ఫిగర్ చేసిన గుర్తింపులు. YAML టెంప్లేట్లలో నిర్వచించబడ్డాయి.
GDPR/DSAR ఆటోమేషన్. 30-రోజుల కంప్లయెన్స్ వర్క్ఫ్లోలు. గుర్తింపు రిజోల్యూషన్, డేటా సేకరణ, ప్యాకేజింగ్.
నియంత్రిత పరిశ్రమలు, గోప్యత కంప్లయెన్స్
సంఘటన స్థిరత్వ కొలత. Accord సూత్రాలకు వ్యతిరేకంగా ఖచ్చితమైన సంఘటన మూల్యాంకనం. ప్రతి మూల్యాంకనానికి ఒక స్పష్టమైన డేటా పాయింట్.
సంఘటన ఆడిటింగ్, సూత్రం ధృవీకరణ
ఉబుంటు తత్వశాస్త్రంతో కమ్యూనిటీ నిర్వహణ. సంక్లిష్ట వ్యక్తిగత సంఘర్షణలను మానవ నిర్వాహకులకు పంపిస్తుంది.
Discord కమ్యూనిటీలు, కంటెంట్ ప్లాట్ఫారమ్లు
పని నిర్వహణ, షెడ్యూలింగ్, నిర్ణయ మద్దతు, సంక్షేమం. CA SB 243 కంప్లయెన్స్, సంక్షోభ ప్రతిస్పందన ప్రోటోకాల్లు.
వ్యక్తిగత ఉత్పాదకత, హోమ్ ఆటోమేషన్
నేరుగా అన్వేషణ మరియు ఆచరణాత్మక మార్గదర్శకత్వం. కోడ్ విశ్లేషణ, Reddit ఇంటిగ్రేషన్, స్పష్టమైన చర్య మార్గాలు.
డెవలపర్ సాధనాలు, సామాజిక పర్యవేక్షణ
ఇది ఏజెంట్ పని చేస్తున్నప్పుడు నడిచే జవాబుదారీతనం, శిక్షణ దశ లేదా విధాన పత్రం కాదు.
రన్టైమ్లో అమలు చేసే, ఆడిట్ చేసే మరియు అప్పగించే విధానాలు.