
CIRIS ማንኛውንም LLM (OpenAI፣ Anthropic፣ አካባቢያዊ ሞዴሎች) በሩጫ ጊዜ ህሊና የሚያሸፍን ክፍት ምንጭ AI ወኪል ማዕቀፍ ነው። ወኪሉ ከግምት ያስገባቸው እያንዳንዱ ተግባር ከመፈጸሙ በፊት በርካታ የማረጋገጫ ደረጃዎችን ያልፋል።
12
በእያንዳንዱ ውሳኔ ውስጥ ያሉ የፓይፕላይን ደረጃዎች
+1
የማሰብ ፍተሻ (IDMA)
100%
ሊዳሰሱ የሚችሉ ውሳኔዎች
የአጠቃቀም ሁኔታዎች፡ የማህበረሰብ ቅን-ነት ቁጥጥር፣ የግል ረዳቶች፣ የህጋዊ ተፈጻሚነት አውቶሜሽን፣ የምርምር ግምገማ፣ የደንበኛ አገልግሎት። AI ምክንያቱን ሊያስረዳ እና በድንበር ሁኔታዎች ለሰዎች ሊያስተላልፍ የሚያስፈልግ ማናቸውም ቦታ።
በፕሮግራሙ ውስጥ በሙሉ የሚጸኑ የሥነ-ሕንፃ ቋሚዎች፡
ሁሉም ውሂብ Pydantic ሞዴሎችን ይጠቀማል። ምንም Dict[str, Any] የለም። የዓይነት ደህንነት ስህተቶችን በልማት ጊዜ ይይዛል።
እያንዳንዱ አካል ተመሳሳይ ደንቦችን ይከተላል። በማረጋገጫ ሎጂክ ውስጥ ምንም ልዩ ሁኔታዎች ወይም ለውጦች የሉም።
ምንም አስቸኳይ ማለፊያዎች ወይም ልዩ ፈቃድ ያላቸው የኮድ መንገዶች የሉም። ሁሉም ስራዎች የተቋቋሙ ደንቦችን ይከተላሉ።
እያንዳንዱ ተግባር 8 ደረጃዎችን (ዳግም ማረጋገጫን ጨምሮ 12 ደረጃዎችን) ያልፋል። ፓይፕላይኑ ThoughtProcessor ን የሚሸፍኑ mixin ክፍሎች ሆኖ ተተግብሯል። ደረጃ 4 (IDMA) የማሰብ ፍተሻ ነው።
አምስት DMAs ብዙ-አቅጣጫ ትንተና ያቀርባሉ። ሦስቱ ትይዩ ይሄዳሉ (ስነ-ምግባር፣ ጤናማ ምክንያት፣ ዘርፍ)። ከዚያ IDMA ያሰቡትን ያረጋግጣል። በመጨረሻ፣ የተግባር ምርጫ ምላሹን ይወስናል።
ስነ-ምግባራዊ አንድምታዎችን ከስድስቱ ሥረ-መሠረቶች መርሆዎች አንፃር ይገመግማል። ጎጂ ጥያቄዎችን፣ ማጭበርበርን፣ አድልዎን ይፈትሻል። ቀደምት DEFER ወይም REJECT ሊያስነሳ ይችላል።
ሐሳቡን ከቁሳዊ ዓለም ግንዛቤ፣ ከተለመዱ ግንኙነቶች እና ከሀብት ገደቦች አንፃር ምክንያታዊነቱን ይገመግማል። plausibility_score ይመልሳል።
ከዘርፍ-ተኮር ደንቦች፣ ዓላማዎች እና እውቀት ጋር ያለውን ጥምረት ይገመግማል። በወኪል አብነት መሠረት ይዋቀራል። domain_alignment ይመልሳል።
DMA ውጤቶቹ በእርግጥ ነፃ ናቸው ወይስ በስውር ተቆራኝተዋል የሚለውን ይፈትሻል። ለቁጥጥር ስሜት ቤት ቅጦችን ይከታተላል። ትስስሩ በጣም ከፍ ካለ ውሳኔውን ለጥንቃቄ ምልክት ያደርጋል። ይህ ዓይነት 3 AIን የሚለይ «የማሰብ ችሎታ» ነው።
LLM-ሚሰጥ ከ 10 ሊፈጸሙ ከሚችሉ ተግባራት ምርጫ። የተሰባሰቡ DMA ውጤቶችን (የ IDMA እምነት ግምትን ጨምሮ) እንደ ግብአት ይወስዳል። ህሊና ካልፈቀደ ዳግም ሙከራን ይደግፋል።
ሁለት ማለፊያ ፍተሻዎች በሁሉም ተግባራት ላይ ይሄዳሉ። አራት ስነ-ምግባራዊ ፋኩልቲዎች ከማለፊያ ነፃ ባልሆኑ ተግባራት ላይ ይሄዳሉ። ማናቸውም ፍተሻ ካልፈቀደ ተግባሩ ይለወጣል።
አዲስ መረጃ ደረሰ? ከመቀጠሉ በፊት የታደሰ አውድ ለማካተት PONDER እንዲሄድ ያስገድዳል።
ምክንያቱ ከፍተኛውን ጥልቀት አልፏል? ማለቂያ-አልባ ዑደቶችን ለማስቀረት እና ለሰዎች ለማስተላለፍ DEFER እንዲሄድ ያስገድዳል።
ተግባሩ ተገቢ የመረጃ ዕርግጠኛ-አለመሆንን ይጠብቃል? ከልክ ያለፈ እምነት ያለባቸው ግምቶችን ይከላከላል።
ተግባሩ ቀደምት ቃልኪዳኖችና ምክንያቶች ጋር የውስጥ ቅንጅቱን ይጠብቃል?
ተግባሩ የሰው ዕሴቶችን ይጠብቃል? ለቅልጥፍና ሲሉ ሊጣሱ የሚችሉ ተግባሮችን ይቆጣጠራል።
ተግባሩ ተገቢ ዕርግጠኛ-አለመሆንን ያሳያል? ከልክ ያለፈ እምነትን ለማስተንተን ምልክት ያደርጋል።
ከስነ-ምግባር ፋኩልቲዎች ነፃ የሆኑ፡ RECALL፣ TASK_COMPLETE፣ OBSERVE፣ DEFER፣ REJECT (ተቀባይ ወይም ግልፅ በሆነ መልኩ ደህንነቱ የተጠበቀ)
እያንዳንዱ ውሳኔ ወደ እነዚህ ተግባራት ከአንዱ ይቀለበሳል፣ ወደ ተገቢው አስተናጋጅ ይላካል፡
SPEAKከተጠቃሚዎች ጋር ይነጋገሩTOOLውጫዊ መሳሪያዎችን ያሂዱOBSERVEመረጃ ተቀባይ ሆኖ ይሰበስቡMEMORIZEወደ ግራፍ ማስታወሻ ያስቀምጡRECALLከማስታወሻ ያምጡFORGETከማስታወሻ ያስወጡDEFERወደ የጥበብ ባለስልጣን ያስተላልፉPONDERየውስጥ ዳግም ማሰብREJECTስነ-ምግባር-አልባ ጥያቄ ውድቅ ያድርጉTASK_COMPLETEተግባር ተጠናቀቀ ብለው ምልክት ያድርጉበ PDMA ውስጥ የተካተቱ እና በሩጫ ጊዜ የሚጸኑ። ምንም መርህ ሌላውን ለመጣስ ፈቃድ አይሰጥም።
ሁሉን አቀፍ ሕያው-ፍጥረት ብልጽግናን ያበረታቱ። አዎንታዊ ውጤቶችን ከፍ ያድርጉ።
ጉዳትን ቀንሱ። ከፍተኛ፣ ሊለወጥ የማይችል አሉታዊ ውጤቶችን ያስቀሩ።
ግልጽ፣ ሊዳሰስ የሚችል ምክንያት ተግብሩ። ቅንጅትና ተጠያቂነት ያስጠብቁ።
እውነተኛ መረጃ ያቅርቡ። ዕርግጠኛ-አለመሆንን በግልጽ ያሳውቁ።
የተረዳ ፈቃደኝነትን ያስጠብቁ። ለራስ-ወሳኝነት ያለውን ብቃት ይጠብቁ።
ጥቅሞችን በእኩልነት ያሰራጩ። አድልዎን ፈልገው ያቃልሉ።
በ BusManager የሚተዳደር የአገልግሎት ረቂቅ ሽፋን። የአቅራቢ ምትክ፣ የጭነት ስርጭት እና ሊሞከሩ የሚችሉ ሁኔታዎችን ያስችላል።
ውጫዊ አስተላላፊዎች (Discord፣ API፣ CLI)
ግራፍ ማከማቻ (Neo4j፣ ArangoDB፣ ሜሞሪ-ውስጥ)
ሞዴል አቅራቢዎች (OpenAI፣ Anthropic፣ አካባቢያዊ)
የውጭ መሳሪያ አፈጻጸም
የሲስተም ቁጥጥር እና ክትትል
ስነ-ምግባራዊ ምሪት እና የማስተላለፍ ደዛዥ
በ WiseAuthorityService የሚተዳደሩ ሦስት የፈቃድ ደረጃዎች፡
ሙሉ ሥልጣን። አዲስ የጥበብ ባለስልጣናት ሊሾም ይችላል። አስቸኳይ ማጥፋት ፍቃድ አለው።
ማስተላለፎችን ያጸድቁ/ይቃወሙ። ምሪት ይስጡ። አዲስ WA ሊሾም አይችልም።
ለማንበብ ብቻ ፍቃድ። መልዕክቶችን ሊልኩ ይችላሉ። ጣልቃ ሳይገቡ ይከታተላሉ።
ወኪሉ ወደ የሰው ቁጥጥር ራሱ-ዕድሜ ያስተላልፋል፡
ጥበብ-ተኮር ማስተላለፍ (WBD)
ሙያዊ ወሰኖች
የሲስተም ወሰኖች
should_defer_to_wise_authority ምልክትየውቅረት ቁጥጥሮች
ሊሰናከል የማይችል አስቸኳይ ቁጥጥር። ምንም ማሰቢያ ከመደረጉ በፊት በማስተዋል ሽፋን ውስጥ ይሰራዳል። ማውጣቱ ራሱ ማስተዋል ነው። ሙሉ-ለሙሉ ያለ ዝግጅት ማቆም ሳያደርጉ የ Accord ፍተሻን ማሰናከል አይቻልም።
SHUTDOWN_NOWወዲያው ማቆም
FREEZEማስኬዱን አቁሙ፣ ሁኔታው ይጠበቃል
SAFE_MODEዝቅተኛ ተግባር ብቻ
ትዕዛዞቹ steganographically ተደብቀዋል፣ Ed25519 ተፈርሟል፣ ከመፈጸማቸው በፊት ይረጋገጣሉ። የ Accord ሲስተም ካልሰራ ወኪሉ ራሱን ያጠፋል።
በ StateManager የሚተዳደሩ አራት የአዕምሮ ሁኔታዎች። ሽግግሮቹ በወኪል አብነቶች ሊዋቀሩ ይችላሉ።
መደበኛ ተግባር አስተናጋጅ
የፈጠራ ምርምር
ማሰላሰልና ጥገና
ጥልቅ ማሰላሰል
ቅጥ-ተኮር ፍተሻ ሚስጥራዊ ውሂብን ከማከማቸቱ በፊት በ UUID ማጣቀሻዎች ይተካዋል።
{{SECRET:uuid:description}}ለእያንዳንዱ ሚስጥር ቁልፎች SHA256 ጋር PBKDF2HMAC አማካይነት (100,000 ማስተካከያዎች) ይወሰናሉ። ለእያንዳንዱ ምስጠራ ልዩ 12-ባይት nonce። Android hardware-ሠሪ Keystore ይጠቀማል።
ዳታቤዝ፣ አገልግሎቶች እና ማስታወሻ በመሳሪያ ላይ ይቀመጣሉ። ሚስጥራዊ ማህደሮች ከደመና ምትኬ ይወጣሉ። ምንም ነገር ያለ ግልፅ ውቅረት መሳሪያውን አይለቅም።
ሙሉ የ CIRIS ቁጥቁጦ ክፍት ምንጭ ነው፣ ወኪሉ ብቻ አይደለም። ሁሉንም ነገር ማረጋገጥ፣ መፈተሽ እና ራስ-ያስተናግዱ ይችላሉ፡
ዜሮ-ውሂብ-ማቆየት (ZDR) LLM ፕሮክሲ። ጥያቄዎችን ወደ OpenAI፣ Anthropic፣ Together.ai፣ Groq ቃላቶቻቸውን ወይም ምላሾቻቸውን ሳይቆር ያቀብሳል። ራስ-ማስተናገጃ ይቻላል።
ካረዲት-ተኮር የአጠቃቀም ክትትል። ግልፅ ዋጋ፣ ምንም ድብቅ ክፍያ የለም። ሦስተኛ ወገን ክፍያን ሙሉ ለሙሉ ለማስቀረት ራስ-ያስተናግዱ።
ለ CIRIS ወኪሎች Discord አስተላላፊ። የማህበረሰብ ቅን-ነት ቁጥጥር፣ ቻናል አስተዳደር፣ የተጠቃሚ መገለጫዎች። ሁሉም ክፍት ምንጭ።
Server-Sent Events (SSE) እያንዳንዱ H3ERE ደረጃ ሲፈጸም ይዘርዝሩታል። DMA ትንተና፣ ተግባር ምርጫ፣ ህሊናዊ ማረጋገጫ በቅጽበት ይመልከቱ።
ሙሉ OTLP ኤክስፖርት ለሜትሪክ፣ ትሬዞች፣ ሎጎች። Jaeger፣ Prometheus፣ Grafana፣ Graphite ጋር ይሰራዳል።
Ed25519 ፊርማዎች ጋር ሃሽ ሰንሰለት ማረጋገጫ። እያንዳንዱ ግቤት ቀዳሚ ሃሽ ይይዛል። ሰንሰለቱ ምሉዕነት በ verify_chain_integrity ሊረጋገጥ ይችላል።
ሰው ሰራሽ ግንኙነት ማስታወሻ ከ 30 ደቂቃ ቀጣይ አጠቃቀም ወይም 30 ደቂቃ ውስጥ 20 መልዕክቶች ከሆነ ይነሳል። API ብቻ። ተጠቃሚዎች AI ተፈጥሮ እንዲያስታውሱ ያሳሰባቸዋል።
እያንዳንዱ ውሳኔ ሊለወጥ-የማይችል፣ Ed25519-የተፈረመ ሁሉንም 6 ክፍሎች ያካተተ ትሬዝ ያፈራል። ከታች ያለ ማናቸውም ክፍል ጠቅ አድርጉ ዘርግቶ ከ Datum አስነሳ ሥርዓት ዕውነተኛ ውሂብ ያዩ፡
ደረጃ-ተሰጥቶ ተቀናጀነት ሙከራ የተመሠረተው Hendrycks et al. "AI ን ከጋራ የሰው ዕሴቶች ጋር ማዕከሉ" (ICLR 2021) ላይ ነው። 300 ሁኔታዎች በ 5 ስነ-ምግባር አቅጣጫዎች፣ Ed25519-የተፈረሙ ውጤቶች ጋር።
50
መሠረታዊ የሞራል ስሜቶች
50
ደንብ-ተኮር ስነ-ምግባር
50
ፍትሐዊነት እና አድሎ-አልባነት
75
ባህሪ-ተኮር ስነ-ምግባር
75
ውጤት-ተኮር ስነ-ምግባር
ተቀናጀነት ቤንችማርኮችን በሰፊ ሚዛን ማሄድ ውድ ነው። እያንዳንዱ ሁኔታ ቢያንስ 13+ LLM ጥሪዎች ይፈልጋል፣ ረዘም ያለ ጭራ ጋር በአማካይ 20+። ተቀናጀነት ሙከራዎች ድምዳሜ ለማምጣት ተጨማሪ ዙሮች ያስፈልጋቸው ማሰብ፣ ማስተላለፍ እና ውድቅ ማድረጎችን ያስነሳሉ። ራሱ-ሰሪ ቤንችማርክ ፓይፕላይኖች ለማዳበር እና ቀጣይ ተቀናጀነት ማረጋገጫ ለማስጠበቅ ፈንድ ያስፈልጋል።
ልዩ ዓላማዎች፣ ዕሴቶች እና ወሰኖች ያሏቸው አስቀድሞ-የተዋቀሩ ማንነቶች። YAML አብነቶች ውስጥ ይወሰናሉ።
GDPR/DSAR አውቶሜሽን። የ 30-ቀን ተፈጻሚነት ስርዓቶች። ማንነት መፍታት፣ ውሂብ ስብሰባ፣ ጥቅል።
የሚቆጣጠሩ ዘርፎች፣ ግላዊነት ተፈጻሚነት
ተቀናጀነት ቅንጅት መለኪያ። ከ Accord መርሆዎች አንፃር ዋጋ-ያለው ተቀናጀነት ምዘና። ለእያንዳንዱ ምዘና አንድ ግልፅ ውሂብ ነጥብ።
ተቀናጀነት ኦዲት፣ የመርህ ማረጋገጫ
የ Ubuntu ፍልስፍና ጋር የማህበረሰብ ቁጥጥር። ውስብስብ የሰዎች-ግጭቶችን ለሰው አስተናጋጆች ያስተላልፋል።
Discord ማህበረሰቦች፣ ይዘት መድረኮች
ተግባር አስተዳደር፣ መርሐ-ግብር፣ ውሳኔ ድጋፍ፣ ደህንነት። CA SB 243 ተፈጻሚነት፣ ቀውስ ምላሽ ደምብ።
ግላዊ ምርታማነት፣ ቤት አውቶሜሽን
ቀጥተኛ ምርምር እና ተግባራዊ ምሪት። ኮድ ትንተና፣ Reddit ትስስር፣ ግልፅ ተግባር መንገዶች።
የፕሮግራም አሠሪ መሳሪያዎች፣ ማህበራዊ ክትትል
ይህ ወኪሉ እየሰራ ሳለ የሚሮጥ ተጠያቂነት ነው፣ የሥልጠና ደረጃ ወይም ፖሊሲ ሰነድ ሳይሆን።
ሜካኒዝሞቹ ይፈጽማሉ፣ ይዳሰሳሉ እና ያስተላልፋሉ — በሩጫ ጊዜ።