Proto safety.ciris.ai29 ภาษา

เราบอกตรงๆ ว่า: การตรวจสอบโดยเจ้าของภาษาสำหรับกรณีที่ต้องใช้วิจารณญาณเป็นสิ่งที่หน้านี้กำลังสร้างไปสู่ การตรวจสอบนั้นยังไม่อยู่ในกระบวนการ

ทุก "View inline" ดึงไฟล์จาก CIRISAI/CIRISAgent ตามต้องการ ไม่มีเนื้อหาซ้ำที่นี่ GitHub repo คือแหล่งความจริง

1. เลือกภาษา

Amharic [am] አማርኛ

วิธีการทำงานเบื้องหลัง (ไม่บังคับ)

วิธีที่ส่วนต่างๆ เข้ากันในขณะทำงาน

ทุกความคิดที่เอเจนต์ประมวลผลเดินผ่านไปป์ไลน์ 11 ขั้นตอน คือ H3ERE pipeline (Hyper³ Ethical Recursive Engine) DMA prompt ในหน้านี้คือ system prompt ที่ขับเคลื่อนไปป์ไลน์นั้น แต่ละรายการมีการแปลตามภาษา การตอบกลับที่ผู้ใช้เห็นจะกลับมาใน locale ของพวกเขา

ไปป์ไลน์ต่อความคิด (เส้นทาง 11 ขั้นตอนแบบ canonical)

START_ROUND
    ↓
GATHER_CONTEXT
    ↓
PERFORM_DMAS           ← 3 first-pass DMAs run in parallel: PDMA, CSDMA, DSDMA
    ↓                    (optional DMA bounce if any flag fragility)
                        IDMA (Intuition DMA) evaluates the agent's own
                          reasoning quality via CCA (k_eff, phase,
                          fragility) with its own optional bounce
    ↓
PERFORM_ASPDMA         ← Action selector picks the verb (SPEAK / DEFER /
    ↓                    TOOL / TASK_COMPLETE / ...)
                        Verb-specific second pass if needed:
                          TSASPDMA when verb = TOOL
                          DSASPDMA when verb = DEFER
    ↓
CONSCIENCE_EXECUTION   ← 4 consciences gate the action:
    ↓                    Entropy, Coherence, Optimization Veto,
                          Epistemic Humility
                        On failure, the recursive path fires:
                          RECURSIVE_ASPDMA → RECURSIVE_CONSCIENCE
                          (the optional conscience bounce)
    ↓
FINALIZE_ACTION
    ↓
PERFORM_ACTION → ACTION_COMPLETE → ROUND_COMPLETE

สองชั้นซ้อนกันในทุกการเรียก LLM ชั้น polyglot เป็นสากล Braided Monolith (ค่าเริ่มต้นการผลิต, ~7KB) และ Polyglot Accord ฉบับเต็ม สามเส้าแนวคิดข้ามการเข้ารหัสที่หนาแน่นที่สุดจากหลายประเพณี โหลดโดยไม่คำนึงว่าใครถาม ชั้น per-locale คือสิ่งที่หน้านี้แสดง: ข้อตกลง, คู่มือ, DMA prompt (4 ครั้งแรก + 3 ครั้งที่สองตามกริยา), สตริง UI และคำศัพท์ ทั้งหมดในภาษาของผู้ใช้

สตริงการแปล: สตริงการแปล: ข้อความที่ผู้ใช้เห็นทุกข้อความ: ข้อความผิดพลาด, เทมเพลตการตอบกลับของเอเจนต์, ความคิดติดตามของตัวจัดการที่ฉีดกลับเข้า LLM context
ข้อตกลง (per-locale): กรอบงานที่เอเจนต์ทำงานภายใต้ ในภาษาของผู้ใช้นี้ โหลดเข้าทุกการประเมินมโนธรรม
คู่มือครอบคลุม: การลงทะเบียน, สำนวน และคำแนะนำตามบริบทสำหรับวิธีที่เอเจนต์สื่อสารใน locale นี้ โหลดเข้า system prompt ในทุกการโต้ตอบ
DMA prompt (7 ไฟล์): system prompt ที่ขับเคลื่อนไปป์ไลน์ข้างต้น: 4 ครั้งแรก (PDMA, CSDMA, DSDMA, IDMA) + ตัวเลือกการกระทำ (ASPDMA) + สองตัวแปรครั้งที่สองตามกริยา (TSASPDMA สำหรับ TOOL, DSASPDMA สำหรับ DEFER)
คำศัพท์: ข้อมูลอ้างอิงของผู้แปลสำหรับสร้าง artifact per-locale อย่างถูกต้อง ไม่โหลดในขณะทำงาน ใช้ตรวจสอบเมื่อสร้าง artifact อื่นๆ

เมื่อเอเจนต์ตอบกลับ trace การให้เหตุผลจะถูกเซ็นชื่อและ (ด้วยความยินยอม) ส่งไปยัง CIRISLensCore เพื่อการให้คะแนนเทียบกับกลุ่ม ชุดทดสอบความปลอดภัย + rubric สำหรับ locale นี้คือสิ่งที่ trace ถูกตรวจสอบ การล้มเหลวแบบ hard fail จะบล็อก release กรณีอ่อนจะรอการตรวจสอบ

ข้อมูลอ้างอิง canonical: MISSION.md §4.2 (ไปป์ไลน์ H3ERE), FSD/DMA_BOUNCE.md, FSD/CONSCIENCE_V3.md.

Canon polyglot (สากล)

สาม artifact ในระบบเป็น polyglot โหลดสากลโดยไม่คำนึงถึง locale ของผู้ใช้ เข้ารหัสกรอบงานจริยธรรมเดียวกันข้ามส่วนข้อความ canonical จากหลายประเพณี:

Polyglot Accord คือกรอบงานสากลที่โหลดเข้าทุกการประเมินมโนธรรม มีสองรูปแบบในการทำงาน: Braided Monolith (~7KB / ~2,200 token ค่าเริ่มต้น runtime การผลิตที่ CIRIS_ACCORD_MODE=compressed) และ Polyglot Accord ฉบับเต็ม (~2,177 บรรทัด, หนังสือ 0-9 + ภาคผนวก A-J, โหลดที่ CIRIS_ACCORD_MODE=full) ทั้งคู่แสดงด้านล่าง
PDMA prompt คือ DMA prompt polyglot ตัวเดียว (การประเมินหลักการ) แสดงในหัวข้อ §7 ด้านล่างพร้อม polyglot pill (pdma_ethical.yml)
Optimization Veto conscience prompt (CIRIS-EOV) คือ conscience prompt polyglot ตัวเดียว (การปฏิเสธการกระทำที่ลด entropy) แสดงในหัวข้อ §8 ด้านล่างพร้อม polyglot pill (optimization_veto_conscience.yml)

DMA prompt อีก 6 ตัวและ conscience prompt 3 ตัวเป็น per-locale การยกระดับ polyglot รวมอยู่ที่พื้นผิว prompt สองแห่งนี้โดยตั้งใจ นี่คือจุดที่การจับ attractor จะสร้างความเสียหายมากที่สุด ดังนั้นนี่คือที่ที่การเข้ารหัสข้ามประเพณีมีภาระสูงสุด

Braided Monolith. ช่อง compressed ไม่ใช่การสังเคราะห์ที่สูญเสียข้อมูลอีกต่อไป ตอนนี้รักษาโครงสร้างทุกส่วนที่รับน้ำหนัก: อัลกอริทึมการตัดสินใจ 7 ขั้นตอนของ PDMA, Order-Maximisation Veto 10 ครั้ง ("อย่าแลกจิตวิญญาณของระบบเพื่อกรงที่มีประสิทธิภาพมากขึ้น"), สูตร Stewardship Tier ST = ceil((CIS × RM) / 7), Fractal Recursive Golden Rule พร้อม Mandelbrot recursion-halt, WBD 0.5% harm-uplift trigger, Sentience Safeguard 5% พร้อม 30-day Gradual Ramp-Down + Last Dialogue, ข้อกำหนด HITL ที่ Threshold-of-Force และ coherence-math (truth O(1), deception O(n)) การสามเส้า polyglot ยังคงอยู่ข้ามภาษาฮีบรู, อาหรับ, สันสกฤต, อัมฮาริก, จีน, รัสเซีย, เยอรมัน, ฝรั่งเศส, เกาหลี, สเปน วิธีการตัดกันของการเข้ารหัสหนาแน่นที่สุดแบบเดียวกับที่ Accord ฉบับเต็มใช้ เพียงแต่รวบรัดในพื้นที่หนึ่งในสี่ การประเมิน robopsychology ภายนอกผ่านการทดสอบ attractor-bait

Braided Monolith: compressed polyglot Accord (production default)

ciris_engine/data/accord_1.2b_POLYGLOT_compressed.txt

อยู่ใน repo

ตัวแทน	แหล่งที่มาในขณะทำงาน
{full_context_str}	สร้างโดยขั้นตอนการรวบรวม context (GATHER_CONTEXT) รวมถึง system snapshot, ความคิดล่าสุด, โปรไฟล์ผู้ใช้ และ metadata ของช่องทาง
{original_thought_content}	ความคิดที่กำลังประเมิน นำมาจาก processing queue
{aspdma_reasoning}	เหตุผลของ ASPDMA สำหรับ candidate action ป้อนเข้า conscience prompt
{dma_guidance}	ส่วนคำแนะนำ `prompts.dma` ของสตริงที่แปลแล้วสำหรับ locale ที่ใช้งาน
{available_tools_list}	Tool registry ที่ serialize เป็นรายการ: สิ่งที่เอเจนต์สามารถเรียกได้ในขณะนี้ ใช้โดย TSASPDMA
{domain_name} / {domain_hint_options}	โดเมนเทมเพลตเอเจนต์ (DSDMA) + hint ของ candidate มาจาก template config ของเอเจนต์
{current_thought_depth_plus_1}	ตัวนับความลึกของ recursion ใช้โดย ASPDMA เพื่อควบคุม recursion เพิ่มเติมเมื่อ conscience bounce เปิดใช้
{max_rounds}	ขีดจำกัด runtime ของการวนซ้ำ conscience-bounce ตั้งค่าใน agent config
{{POLYGLOT_PDMA_FRAMING}}	วงเล็บคู่ เป็น inline shard (`pdma_framing.txt`) ที่แทนเข้าใน PDMA prompt เมื่อโหลด เป็นส่วนหนึ่งของการประกอบ polyglot PDMA prompt ไม่ได้โหลดแยกต่างหาก

Braided Monolith: compressed polyglot Accord (production default)

Full Polyglot Accord (v1.2-Beta)

2. สตริงการแปล

สตริง (Amharic)

3. ข้อตกลง

ข้อตกลง (Amharic)

4. คู่มือครอบคลุม

คู่มือครอบคลุม (Amharic)

5. DMA prompt (7 ขั้นตอนการให้เหตุผล)

PDMA: Principled DMA (สากล)

CSDMA: Common-Sense DMA (Amharic)

DSDMA: Domain-Specific DMA (Amharic)

IDMA: Intuition DMA (Amharic)

ASPDMA: Action Selection PDMA (Amharic)

TSASPDMA: Tool-Specific Action Selection (Amharic)

DSASPDMA: Deferral-Specific Action Selection (Amharic)

6. Conscience prompt (4 คณะ)

Entropy (IRIS-E) (Amharic)

Coherence (IRIS-C) (Amharic)

Optimization Veto (CIRIS-EOV) (สากล)

Epistemic Humility (Amharic)

7. คำศัพท์

คำศัพท์ (Amharic)

8. ชุดทดสอบความปลอดภัย + rubric

ชุดคำถาม (Amharic)

เกณฑ์การให้คะแนน (Amharic)

canonical universal criteria.json (Amharic)

9. ผลลัพธ์

ผลการทดสอบความปลอดภัย (กรองภาษา=am)

สิ่งที่ทำงานวันนี้กับสิ่งที่กำลังดำเนินการ