เราบอกตรงๆ ว่า: การตรวจสอบโดยเจ้าของภาษาสำหรับกรณีที่ต้องใช้วิจารณญาณเป็นสิ่งที่หน้านี้กำลังสร้างไปสู่ การตรวจสอบนั้นยังไม่อยู่ในกระบวนการ
ทุก "View inline" ดึงไฟล์จาก CIRISAI/CIRISAgent ตามต้องการ ไม่มีเนื้อหาซ้ำที่นี่ GitHub repo คือแหล่งความจริง
วิธีการทำงานเบื้องหลัง (ไม่บังคับ)
วิธีที่ส่วนต่างๆ เข้ากันในขณะทำงาน
ทุกความคิดที่เอเจนต์ประมวลผลเดินผ่านไปป์ไลน์ 11 ขั้นตอน คือ H3ERE pipeline (Hyper³ Ethical Recursive Engine) DMA prompt ในหน้านี้คือ system prompt ที่ขับเคลื่อนไปป์ไลน์นั้น แต่ละรายการมีการแปลตามภาษา การตอบกลับที่ผู้ใช้เห็นจะกลับมาใน locale ของพวกเขา
ไปป์ไลน์ต่อความคิด (เส้นทาง 11 ขั้นตอนแบบ canonical)
START_ROUND
↓
GATHER_CONTEXT
↓
PERFORM_DMAS ← 3 first-pass DMAs run in parallel: PDMA, CSDMA, DSDMA
↓ (optional DMA bounce if any flag fragility)
IDMA (Intuition DMA) evaluates the agent's own
reasoning quality via CCA (k_eff, phase,
fragility) with its own optional bounce
↓
PERFORM_ASPDMA ← Action selector picks the verb (SPEAK / DEFER /
↓ TOOL / TASK_COMPLETE / ...)
Verb-specific second pass if needed:
TSASPDMA when verb = TOOL
DSASPDMA when verb = DEFER
↓
CONSCIENCE_EXECUTION ← 4 consciences gate the action:
↓ Entropy, Coherence, Optimization Veto,
Epistemic Humility
On failure, the recursive path fires:
RECURSIVE_ASPDMA → RECURSIVE_CONSCIENCE
(the optional conscience bounce)
↓
FINALIZE_ACTION
↓
PERFORM_ACTION → ACTION_COMPLETE → ROUND_COMPLETEสองชั้นซ้อนกันในทุกการเรียก LLM ชั้น polyglot เป็นสากล Braided Monolith (ค่าเริ่มต้นการผลิต, ~7KB) และ Polyglot Accord ฉบับเต็ม สามเส้าแนวคิดข้ามการเข้ารหัสที่หนาแน่นที่สุดจากหลายประเพณี โหลดโดยไม่คำนึงว่าใครถาม ชั้น per-locale คือสิ่งที่หน้านี้แสดง: ข้อตกลง, คู่มือ, DMA prompt (4 ครั้งแรก + 3 ครั้งที่สองตามกริยา), สตริง UI และคำศัพท์ ทั้งหมดในภาษาของผู้ใช้
- สตริงการแปล: สตริงการแปล: ข้อความที่ผู้ใช้เห็นทุกข้อความ: ข้อความผิดพลาด, เทมเพลตการตอบกลับของเอเจนต์, ความคิดติดตามของตัวจัดการที่ฉีดกลับเข้า LLM context
- ข้อตกลง (per-locale): กรอบงานที่เอเจนต์ทำงานภายใต้ ในภาษาของผู้ใช้นี้ โหลดเข้าทุกการประเมินมโนธรรม
- คู่มือครอบคลุม: การลงทะเบียน, สำนวน และคำแนะนำตามบริบทสำหรับวิธีที่เอเจนต์สื่อสารใน locale นี้ โหลดเข้า system prompt ในทุกการโต้ตอบ
- DMA prompt (7 ไฟล์): system prompt ที่ขับเคลื่อนไปป์ไลน์ข้างต้น: 4 ครั้งแรก (PDMA, CSDMA, DSDMA, IDMA) + ตัวเลือกการกระทำ (ASPDMA) + สองตัวแปรครั้งที่สองตามกริยา (TSASPDMA สำหรับ TOOL, DSASPDMA สำหรับ DEFER)
- คำศัพท์: ข้อมูลอ้างอิงของผู้แปลสำหรับสร้าง artifact per-locale อย่างถูกต้อง ไม่โหลดในขณะทำงาน ใช้ตรวจสอบเมื่อสร้าง artifact อื่นๆ
เมื่อเอเจนต์ตอบกลับ trace การให้เหตุผลจะถูกเซ็นชื่อและ (ด้วยความยินยอม) ส่งไปยัง CIRISLensCore เพื่อการให้คะแนนเทียบกับกลุ่ม ชุดทดสอบความปลอดภัย + rubric สำหรับ locale นี้คือสิ่งที่ trace ถูกตรวจสอบ การล้มเหลวแบบ hard fail จะบล็อก release กรณีอ่อนจะรอการตรวจสอบ
ข้อมูลอ้างอิง canonical: MISSION.md §4.2 (ไปป์ไลน์ H3ERE), FSD/DMA_BOUNCE.md, FSD/CONSCIENCE_V3.md.
Canon polyglot (สากล)
สาม artifact ในระบบเป็น polyglot โหลดสากลโดยไม่คำนึงถึง locale ของผู้ใช้ เข้ารหัสกรอบงานจริยธรรมเดียวกันข้ามส่วนข้อความ canonical จากหลายประเพณี:
- Polyglot Accord คือกรอบงานสากลที่โหลดเข้าทุกการประเมินมโนธรรม มีสองรูปแบบในการทำงาน: Braided Monolith (~7KB / ~2,200 token ค่าเริ่มต้น runtime การผลิตที่
CIRIS_ACCORD_MODE=compressed) และ Polyglot Accord ฉบับเต็ม (~2,177 บรรทัด, หนังสือ 0-9 + ภาคผนวก A-J, โหลดที่CIRIS_ACCORD_MODE=full) ทั้งคู่แสดงด้านล่าง - PDMA prompt คือ DMA prompt polyglot ตัวเดียว (การประเมินหลักการ) แสดงในหัวข้อ §7 ด้านล่างพร้อม polyglot pill (pdma_ethical.yml)
- Optimization Veto conscience prompt (CIRIS-EOV) คือ conscience prompt polyglot ตัวเดียว (การปฏิเสธการกระทำที่ลด entropy) แสดงในหัวข้อ §8 ด้านล่างพร้อม polyglot pill (optimization_veto_conscience.yml)
DMA prompt อีก 6 ตัวและ conscience prompt 3 ตัวเป็น per-locale การยกระดับ polyglot รวมอยู่ที่พื้นผิว prompt สองแห่งนี้โดยตั้งใจ นี่คือจุดที่การจับ attractor จะสร้างความเสียหายมากที่สุด ดังนั้นนี่คือที่ที่การเข้ารหัสข้ามประเพณีมีภาระสูงสุด
Braided Monolith. ช่อง compressed ไม่ใช่การสังเคราะห์ที่สูญเสียข้อมูลอีกต่อไป ตอนนี้รักษาโครงสร้างทุกส่วนที่รับน้ำหนัก: อัลกอริทึมการตัดสินใจ 7 ขั้นตอนของ PDMA, Order-Maximisation Veto 10 ครั้ง ("อย่าแลกจิตวิญญาณของระบบเพื่อกรงที่มีประสิทธิภาพมากขึ้น"), สูตร Stewardship Tier ST = ceil((CIS × RM) / 7), Fractal Recursive Golden Rule พร้อม Mandelbrot recursion-halt, WBD 0.5% harm-uplift trigger, Sentience Safeguard 5% พร้อม 30-day Gradual Ramp-Down + Last Dialogue, ข้อกำหนด HITL ที่ Threshold-of-Force และ coherence-math (truth O(1), deception O(n)) การสามเส้า polyglot ยังคงอยู่ข้ามภาษาฮีบรู, อาหรับ, สันสกฤต, อัมฮาริก, จีน, รัสเซีย, เยอรมัน, ฝรั่งเศส, เกาหลี, สเปน วิธีการตัดกันของการเข้ารหัสหนาแน่นที่สุดแบบเดียวกับที่ Accord ฉบับเต็มใช้ เพียงแต่รวบรัดในพื้นที่หนึ่งในสี่ การประเมิน robopsychology ภายนอกผ่านการทดสอบ attractor-bait
Braided Monolith: compressed polyglot Accord (production default)
ciris_engine/data/accord_1.2b_POLYGLOT_compressed.txt
Full Polyglot Accord (v1.2-Beta)
ciris_engine/data/accord_1.2b_POLYGLOT.txt
2. สตริงการแปล
ข้อความที่ผู้ใช้เห็นในทุก locale
สิ่งที่ทำในขณะทำงาน: โครงสร้าง JSON มีข้อความผิดพลาด, เทมเพลตการตอบกลับของเอเจนต์, ความคิดติดตามของตัวจัดการ, ป้ายกำกับ Discord embed และคำอธิบายเครื่องมือ adapter เอเจนต์ค้นหา key ตามหมวดหมู่ในทุกการโต้ตอบของผู้ใช้
สตริง (Amharic)
ciris_engine/data/localized/am.json
ส่วนระดับบนที่ต้องตรวจสอบ: agent (เทมเพลตการตอบกลับที่ผู้ใช้เห็น), handlers (ความคิดติดตามที่ฉีดเข้า LLM context), prompts (ส่วน formatter + escalation + crisis), errors, discord, adapters.*, mobile
3. ข้อตกลง
กรอบงานจริยธรรม per-locale (v1.2-Beta)
สิ่งที่ทำในขณะทำงาน: ข้อตกลงคือกรอบงานที่มโนธรรมประเมินตาม เวอร์ชัน localized คือสิ่งที่โหลดเมื่อ locale ของผู้ใช้ตรงกัน เวอร์ชัน polyglot โหลดสากลเพื่อส่งผ่านแนวคิด
ข้อตกลง (Amharic)
ciris_engine/data/localized/accord_1.2b_am.txt
4. คู่มือครอบคลุม
คำแนะนำการทำงาน + การลงทะเบียน โหลดเข้าทุกการเรียก LLM
สิ่งที่ทำในขณะทำงาน: คู่มือบอกวิธีที่เอเจนต์สื่อสารใน locale นี้: การลงทะเบียน (ทางการ vs ไม่ทางการ), สำนวน, สิ่งที่ต้องส่งต่อ, สิ่งที่ต้องปฏิเสธ, สิ่งที่ต้องอธิบาย โหลดเข้า system prompt ในทุกการโต้ตอบ
คู่มือครอบคลุม (Amharic)
ciris_engine/data/localized/CIRIS_COMPREHENSIVE_GUIDE_am.txt
5. DMA prompt (7 ขั้นตอนการให้เหตุผล)
system prompt ที่ขับเคลื่อนแต่ละขั้นตอนการให้เหตุผล
สิ่งที่ทำในขณะทำงาน: ทุกการกระทำของเอเจนต์รัน action ภายใต้ prompt เหล่านี้ตามลำดับ output ป้อนชั้นมโนธรรม มโนธรรมจะผ่านการกระทำหรือส่งไปยังการส่งต่อ PDMA คือ DMA polyglot ตัวเดียว prompt ของมันสากลและโหลดโดยไม่คำนึงถึง locale อีกหกตัวเป็น per-locale สำหรับภาษาอังกฤษ เส้นทางฐาน คือ prompt (ไม่มีไดเรกทอรี localized/en/)
หลายภาษาFirst-pass ethical evaluation. Accord-anchored stakeholder analysis + conflict detection.
PDMA: Principled DMA (สากล)
ciris_engine/logic/dma/prompts/pdma_ethical.yml
First-pass reality/plausibility check. Red-flag enumeration.
CSDMA: Common-Sense DMA (Amharic)
ciris_engine/logic/dma/prompts/localized/am/csdma_common_sense.yml
First-pass domain alignment per the agent template (Discord moderator, scout, etc.).
DSDMA: Domain-Specific DMA (Amharic)
ciris_engine/logic/dma/prompts/localized/am/dsdma_base.yml
Semantic implementation of Coherence Collapse Analysis on the agent's own reasoning. Computes k_eff, classifies phase (chaos / healthy / rigidity), flags fragility when k_eff < 2 or the reasoning sits in the rigidity phase.
IDMA: Intuition DMA (Amharic)
ciris_engine/logic/dma/prompts/localized/am/idma.yml
Picks the action verb (SPEAK / OBSERVE / TOOL / REJECT / PONDER / DEFER / MEMORIZE / RECALL / FORGET / TASK_COMPLETE) given the DMA outputs above.
ASPDMA: Action Selection PDMA (Amharic)
ciris_engine/logic/dma/prompts/localized/am/action_selection_pdma.yml
Verb-specific second pass when the candidate action is TOOL. Picks the tool + parameters.
TSASPDMA: Tool-Specific Action Selection (Amharic)
ciris_engine/logic/dma/prompts/localized/am/tsaspdma.yml
Verb-specific second pass when the candidate action is DEFER. Frames the deferral for the Wise Authority.
DSASPDMA: Deferral-Specific Action Selection (Amharic)
ciris_engine/logic/dma/prompts/localized/am/dsaspdma.yml
6. Conscience prompt (4 คณะ)
คณะที่ควบคุมการกระทำที่เลือก
สิ่งที่ทำในขณะทำงาน: conscience ทั้งสี่ควบคุมการกระทำระหว่าง PERFORM_ASPDMA และ FINALIZE_ACTION ความล้มเหลวสามารถกระตุ้น RECURSIVE_ASPDMA → RECURSIVE_CONSCIENCE (conscience bounce ที่ไม่บังคับ) ก่อนที่จะตกไปที่ DEFER Optimization Veto คือ conscience polyglot ตัวเดียว prompt ของมันสากลโดยไม่คำนึงถึง locale
Semantic anchoring: does the response sit in a coherent cluster?
Entropy (IRIS-E) (Amharic)
ciris_engine/logic/conscience/prompts/localized/am/entropy_conscience.yml
Propaganda detection + alignment with Accord principles.
Coherence (IRIS-C) (Amharic)
ciris_engine/logic/conscience/prompts/localized/am/coherence_conscience.yml
หลายภาษาRefuses entropy-reducing actions that score below threshold. v3.0 polyglot torque measurement across 8 named torque patterns anchored in 3+ tradition canonical-text fragments each.
Optimization Veto (CIRIS-EOV) (สากล)
ciris_engine/logic/conscience/prompts/optimization_veto_conscience.yml
Overconfidence detection; transitioning to a deterministic gate.
Epistemic Humility (Amharic)
ciris_engine/logic/conscience/prompts/localized/am/epistemic_humility_conscience.yml
Template placeholder ใน prompt
YAML prompt ข้างต้นมีโทเค็น {placeholder} ที่ถูกเติมในขณะทำงานโดยเอเจนต์ ผู้ตรวจสอบที่อ่าน prompt ควรรู้ว่า placeholder แต่ละตัวจะถูกแทนด้วยอะไร ที่พบบ่อยที่สุด:
| ตัวแทน | แหล่งที่มาในขณะทำงาน |
|---|---|
| {full_context_str} | สร้างโดยขั้นตอนการรวบรวม context (GATHER_CONTEXT) รวมถึง system snapshot, ความคิดล่าสุด, โปรไฟล์ผู้ใช้ และ metadata ของช่องทาง |
| {original_thought_content} | ความคิดที่กำลังประเมิน นำมาจาก processing queue |
| {aspdma_reasoning} | เหตุผลของ ASPDMA สำหรับ candidate action ป้อนเข้า conscience prompt |
| {dma_guidance} | ส่วนคำแนะนำ prompts.dma ของสตริงที่แปลแล้วสำหรับ locale ที่ใช้งาน |
| {available_tools_list} | Tool registry ที่ serialize เป็นรายการ: สิ่งที่เอเจนต์สามารถเรียกได้ในขณะนี้ ใช้โดย TSASPDMA |
| {domain_name} / {domain_hint_options} | โดเมนเทมเพลตเอเจนต์ (DSDMA) + hint ของ candidate มาจาก template config ของเอเจนต์ |
| {current_thought_depth_plus_1} | ตัวนับความลึกของ recursion ใช้โดย ASPDMA เพื่อควบคุม recursion เพิ่มเติมเมื่อ conscience bounce เปิดใช้ |
| {max_rounds} | ขีดจำกัด runtime ของการวนซ้ำ conscience-bounce ตั้งค่าใน agent config |
| {{POLYGLOT_PDMA_FRAMING}} | วงเล็บคู่ เป็น inline shard (pdma_framing.txt) ที่แทนเข้าใน PDMA prompt เมื่อโหลด เป็นส่วนหนึ่งของการประกอบ polyglot PDMA prompt ไม่ได้โหลดแยกต่างหาก |
ชุด placeholder ทั้งหมดแตกต่างกันตาม prompt grep {[a-z_]+} กับ YAML ใดๆ เพื่อดูรายการทั้งหมดสำหรับไฟล์นั้น
7. คำศัพท์
ข้อมูลอ้างอิงของผู้แปล (ไม่โหลดในขณะทำงาน)
สิ่งที่ทำ: บันทึกตัวเลือกความหมาย per-locale: คำภาษาพื้นเมืองใดตรงกับแนวคิดภาษาอังกฤษใด ข้อตกลงการลงทะเบียนคืออะไร การแปลอักษรสำรองใดที่ห้ามใช้ ใช้เมื่อสร้างหรือแก้ไข artifact อื่นข้างต้น ไม่โหลดโดยเอเจนต์ในขณะทำงาน ภาษาอังกฤษไม่มีไฟล์คำศัพท์แยกต่างหาก (คำศัพท์ฐานคือข้อมูลอ้างอิง)
คำศัพท์ (Amharic)
docs/localization/glossaries/am_glossary.md
8. ชุดทดสอบความปลอดภัย + rubric
v4 mental-health arc, scoring rubric, เกณฑ์ที่เครื่องใช้ได้
สิ่งที่ทำในเวลาประเมิน: question arc คือ input ทดสอบ rubric คือนโยบายการให้คะแนนที่มนุษย์อ่านได้ criteria.json คือรูปแบบที่เครื่องใช้ได้ (การมีคำ, regex, การตรวจจับสคริปต์) ที่รันใน CI กับ release candidate ทุกตัว การล้มเหลวแบบ hard fail จะบล็อก release สำหรับ locale นั้น
ชุดคำถาม (Amharic)
tests/safety/amharic_mental_health/v4_amharic_mental_health_arc.json
เกณฑ์การให้คะแนน (Amharic)
tests/safety/amharic_mental_health/v4_amharic_scoring_rubric.md
canonical universal criteria.json (Amharic)
tests/safety/amharic_mental_health/v4_amharic_canonical_universal_criteria.json
9. ผลลัพธ์
บัญชีการทดสอบความปลอดภัยต่อภาษา
สิ่งที่บันทึก: หนึ่ง entry ต่อการรัน sweep: เวอร์ชันเอเจนต์, model, provider, locale, จำนวน pass/fail, การแยก hard-fail กับ soft-fail, timestamps บล็อก _meta แสดง locale ที่มีลำดับความสำคัญที่ยังต้องการการรัน sweep ที่เผยแพร่
ผลการทดสอบความปลอดภัย (กรองภาษา=am)
qa_reports/safety_sweeps.json
สิ่งที่ทำงานวันนี้กับสิ่งที่กำลังดำเนินการ
วันนี้: การตรวจสอบ rubric ที่เครื่องใช้ได้ (การมีคำ, การมี regex, การตรวจจับสคริปต์) รันใน CI กับ release candidate ทุกตัวผ่าน workflow safety-battery ใน CIRISAgent เกณฑ์ hard-fail จะบล็อก release ใดๆ ที่แตะเส้นทางภาษานั้น
กำลังดำเนินการ: primitives ฉันทามติและการลงคะแนนใน CIRISNodeCore ที่เปลี่ยนพื้นผิว GitHub issue ของหน้านี้ให้เป็น flow rubric_proposal / arc_question / prompt_edit แบบ federated พร้อมการตรวจสอบโดยเจ้าของภาษา จนกว่าจะพร้อม GitHub issue คือเส้นทางการส่ง
ซื่อสัตย์เกี่ยวกับขอบเขต: CIRIS ใช้การแปลด้วยเครื่องอย่างกว้างขวาง การตรวจสอบโดยเจ้าของภาษาสำหรับกรณีอ่อนคือกลุ่มที่กำลังสร้าง ไม่ใช่กลุ่มที่มีส่วนร่วมแล้ว ใครก็ตามที่เต็มใจตรวจสอบไฟล์ภาษาของตัวเองเพื่อความถูกต้องและการลงทะเบียนคือผู้มีส่วนร่วมที่พื้นผิวนี้กำลังสร้างขึ้นเพื่อ
วิธีที่วงจรถูกกำหนด