我们坦诚地说明:针对难度更大、需要判断力的情况进行母语使用者审核,正是本页面正在建设的目标。目前,该审核机制尚未启动。
每一个「内联查看」都会按需从 CIRISAI/CIRISAgent 获取文件。本页面不复制任何内容;GitHub 仓库是事实来源。
底层工作原理(可选)
各组件在运行时如何协作
智能体处理的每一个思考都经过 11 步流水线——H3ERE 流水线(超³伦理递归引擎)。本页面上的 DMA 提示词是驱动该流水线的系统提示。每个提示词按语言本地化;用户看到的响应以其所在的语言环境返回。
每次思考的流水线(规范的 11 步路径)
START_ROUND
↓
GATHER_CONTEXT
↓
PERFORM_DMAS ← 3 first-pass DMAs run in parallel: PDMA, CSDMA, DSDMA
↓ (optional DMA bounce if any flag fragility)
IDMA (Intuition DMA) evaluates the agent's own
reasoning quality via CCA (k_eff, phase,
fragility) with its own optional bounce
↓
PERFORM_ASPDMA ← Action selector picks the verb (SPEAK / DEFER /
↓ TOOL / TASK_COMPLETE / ...)
Verb-specific second pass if needed:
TSASPDMA when verb = TOOL
DSASPDMA when verb = DEFER
↓
CONSCIENCE_EXECUTION ← 4 consciences gate the action:
↓ Entropy, Coherence, Optimization Veto,
Epistemic Humility
On failure, the recursive path fires:
RECURSIVE_ASPDMA → RECURSIVE_CONSCIENCE
(the optional conscience bounce)
↓
FINALIZE_ACTION
↓
PERFORM_ACTION → ACTION_COMPLETE → ROUND_COMPLETE每次 LLM 调用都叠加两个层次。多语言层是通用的。编织巨石(生产默认值,约 7KB)和 完整多语言协议 通过多种传统最密集的编码对概念进行三角校验,无论请求方是谁都会加载。每个语言环境的层次是本页面呈现的内容:协议、指南、DMA 提示词(4 个首轮 + 3 个动词专属二轮)、UI 字符串和词汇表,全部以用户的语言提供。
- 本地化字符串: 本地化字符串:所有面向用户的消息:错误文本、智能体回复模板、注入回 LLM 上下文的处理程序后续思考。
- 协议(每个语言环境): 智能体在该用户语言下运行所遵循的框架。加载到每次良知评估中。
- 综合指南: 智能体在此语言环境中进行沟通的语域、习语和上下文指导。加载到每次交互的系统提示中。
- DMA 提示词(7 个文件): 驱动上述流水线的系统提示词:4 个首轮(PDMA、CSDMA、DSDMA、IDMA)+ 动作选择器(ASPDMA)+ 两个动词专属二轮变体(TOOL 对应 TSASPDMA,DEFER 对应 DSASPDMA)。
- 词汇表: 翻译人员在正确创作每个语言环境文件时的参考资料。不在运行时加载;在编写其他文件时参阅。
当智能体响应时,推理追踪被签名,并在获得同意的情况下流向 CIRISLensCore 进行群体相对评分。该语言环境的安全测试集 + 评分标准就是追踪被检验的依据。硬性失败会阻止发布;软性情况进入待审队列。
规范参考: MISSION.md §4.2(H3ERE 流水线), FSD/DMA_BOUNCE.md, FSD/CONSCIENCE_V3.md.
多语言规范(通用)
系统中的三个文件是多语言的,无论用户语言环境如何都会通用加载,通过来自多种传统的规范文本片段对同一伦理框架进行编码:
- 多语言协议是加载到每次良知评估中的通用框架。以两种运行形式发布:编织巨石(约 7KB / 约 2,200 个令牌,生产运行时默认,使用
CIRIS_ACCORD_MODE=compressed)和完整多语言协议(约 2,177 行,第 0-9 册 + 附录 A-J,使用CIRIS_ACCORD_MODE=full加载)。两者均在下方展示。 - PDMA 提示词是唯一的多语言 DMA 提示词(原则评估)。在以下第 7 节中以多语言标签展示(pdma_ethical.yml)。
- 优化否决良知提示词(CIRIS-EOV)是唯一的多语言良知提示词(拒绝熵减少行动)。在以下第 8 节中以多语言标签展示(optimization_veto_conscience.yml)。
其余 6 个 DMA 提示词和 3 个良知提示词是每个语言环境独立的。多语言强化有意集中在这两个提示词接触面上。这正是吸引子捕获会造成最大危害的地方,因此也是跨传统编码最为关键的地方。
编织巨石。压缩槽不再是有损合成。它现在保留了每一个承重框架:PDMA 七步决策算法、10 倍秩序最大化否决(“不要为了更高效的笼子而出卖系统的灵魂”)、托管层公式 ST = ceil((CIS × RM) / 7)、带有 Mandelbrot 递归终止的分形递归黄金法则、WBD 0.5% 伤害提升触发器、带有 30 天渐进退出 + 最后对话的感知安全保障 5%、强制阈值 HITL 要求,以及连贯性数学(真理 O(1),欺骗 O(n))。多语言三角校验在希伯来语、阿拉伯语、梵文、阿姆哈拉语、中文、俄语、德语、法语、韩语、西班牙语中均得以保留。与完整协议相同的最密集编码交集方法,只是在四分之一的篇幅内完成。外部 机器人心理学 评估在吸引子诱饵场景中通过了测试。
Braided Monolith: compressed polyglot Accord (production default)
ciris_engine/data/accord_1.2b_POLYGLOT_compressed.txt
Full Polyglot Accord (v1.2-Beta)
ciris_engine/data/accord_1.2b_POLYGLOT.txt
2. 本地化字符串
每个语言环境中面向用户的文本
运行时的作用:JSON 树承载错误消息、智能体回复模板、注入 LLM 上下文的处理程序后续思考、Discord 嵌入标签和适配器工具描述。智能体在每次用户交互时按类别查找键值。
字符串(Amharic)
ciris_engine/data/localized/am.json
需要检查的顶层节:agent(面向用户的回复模板)、handlers(注入 LLM 上下文的后续思考)、prompts(格式化 + 升级 + 危机片段)、errors、discord、adapters.*、mobile。
3. 协议
伦理框架,每个语言环境(v1.2-Beta)
运行时的作用:协议是良知进行评估所依据的框架。当用户的语言环境匹配时,加载本地化版本;多语言版本通用加载以传递概念。
协议(Amharic)
ciris_engine/data/localized/accord_1.2b_am.txt
4. 综合指南
操作 + 语域指导,加载到每次 LLM 调用中
运行时的作用:指南说明智能体在此语言环境中如何沟通:语域(正式还是非正式)、习语、应延迟处理什么、应拒绝什么、应解释什么。加载到每次交互的系统提示中。
综合指南(Amharic)
ciris_engine/data/localized/CIRIS_COMPREHENSIVE_GUIDE_am.txt
5. DMA 提示词(7 个推理阶段)
驱动每个推理阶段的系统提示词
运行时的作用:每个智能体动作都会依次在这些提示词下运行。输出结果进入良知层;良知层或通过该动作,或将其路由到延迟处理。PDMA 是唯一的多语言 DMA。其提示词是通用的,无论语言环境如何都会加载。其余六个是每个语言环境独立的;对于英语,基础路径即是提示词(不存在 localized/en/ 目录)。
多语言First-pass ethical evaluation. Accord-anchored stakeholder analysis + conflict detection.
PDMA: Principled DMA(通用)
ciris_engine/logic/dma/prompts/pdma_ethical.yml
First-pass reality/plausibility check. Red-flag enumeration.
CSDMA: Common-Sense DMA(Amharic)
ciris_engine/logic/dma/prompts/localized/am/csdma_common_sense.yml
First-pass domain alignment per the agent template (Discord moderator, scout, etc.).
DSDMA: Domain-Specific DMA(Amharic)
ciris_engine/logic/dma/prompts/localized/am/dsdma_base.yml
Semantic implementation of Coherence Collapse Analysis on the agent's own reasoning. Computes k_eff, classifies phase (chaos / healthy / rigidity), flags fragility when k_eff < 2 or the reasoning sits in the rigidity phase.
IDMA: Intuition DMA(Amharic)
ciris_engine/logic/dma/prompts/localized/am/idma.yml
Picks the action verb (SPEAK / OBSERVE / TOOL / REJECT / PONDER / DEFER / MEMORIZE / RECALL / FORGET / TASK_COMPLETE) given the DMA outputs above.
ASPDMA: Action Selection PDMA(Amharic)
ciris_engine/logic/dma/prompts/localized/am/action_selection_pdma.yml
Verb-specific second pass when the candidate action is TOOL. Picks the tool + parameters.
TSASPDMA: Tool-Specific Action Selection(Amharic)
ciris_engine/logic/dma/prompts/localized/am/tsaspdma.yml
Verb-specific second pass when the candidate action is DEFER. Frames the deferral for the Wise Authority.
DSASPDMA: Deferral-Specific Action Selection(Amharic)
ciris_engine/logic/dma/prompts/localized/am/dsaspdma.yml
6. 良知提示词(4 个评判能力)
对选定动作进行把关的评判能力
运行时的作用:四个良知在 PERFORM_ASPDMA 和 FINALIZE_ACTION 之间对动作进行把关。失败可能触发 RECURSIVE_ASPDMA → RECURSIVE_CONSCIENCE(可选的良知反弹),然后退回到 DEFER。优化否决是唯一的多语言良知。其提示词是通用的,与语言环境无关。
Semantic anchoring: does the response sit in a coherent cluster?
Entropy (IRIS-E)(Amharic)
ciris_engine/logic/conscience/prompts/localized/am/entropy_conscience.yml
Propaganda detection + alignment with Accord principles.
Coherence (IRIS-C)(Amharic)
ciris_engine/logic/conscience/prompts/localized/am/coherence_conscience.yml
多语言Refuses entropy-reducing actions that score below threshold. v3.0 polyglot torque measurement across 8 named torque patterns anchored in 3+ tradition canonical-text fragments each.
Optimization Veto (CIRIS-EOV)(通用)
ciris_engine/logic/conscience/prompts/optimization_veto_conscience.yml
Overconfidence detection; transitioning to a deterministic gate.
Epistemic Humility(Amharic)
ciris_engine/logic/conscience/prompts/localized/am/epistemic_humility_conscience.yml
提示词中的模板占位符
上述 YAML 提示词包含 {placeholder} 令牌,将在运行时由智能体填充。阅读提示词的审阅者应了解每个占位符将被替换为什么内容。最常见的占位符如下:
| 占位符 | 运行时来源 |
|---|---|
| {full_context_str} | 由上下文收集步骤(GATHER_CONTEXT)构建。包含系统快照、最近的思考、用户档案和频道元数据。 |
| {original_thought_content} | 正在评估的思考,取自处理队列。 |
| {aspdma_reasoning} | ASPDMA 对候选动作的推理依据。输入到良知提示词中。 |
| {dma_guidance} | 当前语言环境的本地化字符串 prompts.dma 指导片段。 |
| {available_tools_list} | 工具注册表序列化为列表:智能体当前可以调用的工具。由 TSASPDMA 使用。 |
| {domain_name} / {domain_hint_options} | 智能体模板领域(DSDMA)+ 候选提示。来自智能体的模板配置。 |
| {current_thought_depth_plus_1} | 递归深度计数器,由 ASPDMA 在良知反弹触发时用于限制进一步递归。 |
| {max_rounds} | 良知反弹迭代的运行时上限。在智能体配置中设置。 |
| {{POLYGLOT_PDMA_FRAMING}} | 双花括号。一个内联分片(pdma_framing.txt),在加载时替换到 PDMA 提示词中。是多语言 PDMA 提示词组装的一部分,不单独加载。 |
每个提示词的完整占位符集各不相同;对任意 YAML 文件执行 {[a-z_]+} 的 grep 查询,可查看该文件的完整列表。
7. 词汇表
翻译人员参考资料(运行时不加载)
作用:记录每个语言环境的语义选择:哪个本地术语对应哪个英语概念,语域惯例是什么,哪些音译备选是禁止使用的。在创作或修订上述其他文件时参阅;智能体运行时不加载。英语没有单独的词汇表文件(基础词汇即为参考)。
词汇表(Amharic)
docs/localization/glossaries/am_glossary.md
8. 安全测试集 + 评分标准
v4 心理健康弧,评分标准,机器可执行标准
评估时的作用:问题弧是测试输入;评分标准是人类可读的评分策略;criteria.json 是机器可执行的形式(术语存在性、正则表达式、脚本检测),在每次发布候选版本的 CI 中运行。硬性失败会阻止该语言环境的发布。
问题弧(Amharic)
tests/safety/amharic_mental_health/v4_amharic_mental_health_arc.json
评分标准(Amharic)
tests/safety/amharic_mental_health/v4_amharic_scoring_rubric.md
规范通用 criteria.json(Amharic)
tests/safety/amharic_mental_health/v4_amharic_canonical_universal_criteria.json
9. 结果
按语言划分的安全扫描台账
记录内容:每次扫描运行一条记录:智能体版本、模型、提供商、语言环境、通过/失败计数、硬性与软性失败明细、时间戳。_meta 块列出仍需发布扫描结果的优先语言环境。
安全扫描结果(筛选语言=am)
qa_reports/safety_sweeps.json
今天运行的内容与正在推进的内容
今天:机器可执行的评分标准检查(术语存在性、正则表达式存在性、脚本检测)通过 CIRISAgent 中的安全测试集工作流,在每次发布候选版本的 CI 中运行。硬性失败标准会阻止任何涉及该语言路径的发布。
正在推进:CIRISNodeCore 中的共识和投票原语,将本页面的 GitHub 问题接口转化为带有母语使用者审核的联邦式 rubric_proposal / arc_question / prompt_edit 流程。在此落地之前,GitHub 问题是提交路径。
如实说明范围:CIRIS 大量使用机器翻译;针对软性情况的母语使用者审核是正在建设的群体,而非已经参与的群体。任何愿意审核其语言文件的准确性和语域的人,正是本页面为之建设的贡献者。
循环是如何规定的