
มโนธรรมที่ทำงานจริงผ่าน Hyper3 Ethical Recursive Engine ทุกการตัดสินใจไหลผ่าน 11 ขั้นตอนโดยมีความรับผิดชอบเป็นแกนกลาง
CIRIS คือเฟรมเวิร์กเอเจนต์ AI แบบโอเพนซอร์สที่ครอบ LLM ใดก็ได้ (OpenAI, Anthropic, โมเดลท้องถิ่น) ด้วยมโนธรรมที่ทำงานจริง ทุกการกระทำที่เอเจนต์พิจารณาจะผ่านการตรวจสอบหลายชั้นก่อนดำเนินการ
12
ขั้นตอนในไปป์ไลน์ต่อการตัดสินใจหนึ่งครั้ง
+1
การตรวจสอบสัญชาตญาณ (IDMA)
100%
การตัดสินใจที่ตรวจสอบได้
กรณีการใช้งาน: การดูแลชุมชน ผู้ช่วยส่วนตัว ระบบอัตโนมัติด้านการปฏิบัติตามกฎระเบียบ การประเมินงานวิจัย บริการลูกค้า ทุกที่ที่ต้องการ AI ที่อธิบายเหตุผลของตัวเองได้และส่งต่อกรณีที่ยากให้มนุษย์
ข้อกำหนดสถาปัตยกรรมที่บังคับใช้ทั่วทั้งโค้ดเบส:
ข้อมูลทั้งหมดใช้โมเดล Pydantic ไม่มี Dict[str, Any] ความปลอดภัยของประเภทข้อมูลช่วยจับข้อผิดพลาดตั้งแต่ขั้นตอนพัฒนา
ทุกองค์ประกอบปฏิบัติตามกฎเดียวกัน ไม่มีกรณีพิเศษหรือข้อยกเว้นในตรรกะการตรวจสอบ
ไม่มีการแทนที่ฉุกเฉินหรือเส้นทางโค้ดพิเศษ ทุกการดำเนินการปฏิบัติตามกฎที่กำหนดไว้
ทุกงานไหลผ่าน 8 เฟส (12 ขั้นตอนรวมการตรวจสอบแบบวนซ้ำ) ไปป์ไลน์ถูกสร้างเป็นคลาส mixin ที่ประกอบเป็น ThoughtProcessor ขั้นตอนที่ 4 (IDMA) คือการตรวจสอบสัญชาตญาณ
DMA ห้าตัวให้การวิเคราะห์หลายมุมมอง สามตัวรันแบบขนาน (จริยธรรม สามัญสำนึก โดเมน) จากนั้น IDMA ตรวจสอบสัญชาตญาณ สุดท้ายการเลือกการกระทำเลือกการตอบสนอง
ประเมินผลกระทบทางจริยธรรมเทียบกับหลักการพื้นฐานหกข้อ ตรวจสอบคำขอที่เป็นอันตราย การบิดเบือน และอคติ สามารถเรียก DEFER หรือ REJECT ก่อนกำหนดได้
ประเมินความสมเหตุสมผลของความคิดเทียบกับความเข้าใจโลกกายภาพ ปฏิสัมพันธ์ทั่วไป และข้อจำกัดทรัพยากร ส่งคืน plausibility_score
ประเมินการสอดคล้องกับกฎ วัตถุประสงค์ และความรู้เฉพาะโดเมน ตั้งค่าตามเทมเพลตเอเจนต์ ส่งคืน domain_alignment
ตรวจสอบว่าผลลัพธ์ DMA เป็นอิสระจริงหรือมีความสัมพันธ์ลึกๆ ตรวจสอบรูปแบบห้องเสียงสะท้อน ถ้าความสัมพันธ์สูงเกินไปจะตั้งค่าสถานะการตัดสินใจให้ระวัง นี่คือ"สัญชาตญาณ"ที่แยกแยะ AI ประเภท 3
การเลือกการกระทำจาก 10 การกระทำที่มีด้วย LLM รับผลลัพธ์ DMA รวม (รวมการประเมินความมั่นใจ IDMA) เป็นอินพุต รองรับการลองซ้ำแบบวนถ้ามโนธรรมล้มเหลว
การตรวจสอบการข้ามสองข้อรันทุกการกระทำ คณะจริยธรรมสี่คณะรันการกระทำที่ไม่ได้รับการยกเว้น ถ้าการตรวจสอบใดล้มเหลวการกระทำจะถูกแทนที่
มีข้อมูลใหม่มาถึงหรือไม่? บังคับให้ PONDER เพื่อรวมบริบทที่อัปเดตก่อนดำเนินการ
การให้เหตุผลเกินความลึกสูงสุดหรือไม่? บังคับให้ DEFER เพื่อป้องกันการวนซ้ำไม่สิ้นสุดและส่งต่อให้มนุษย์
การกระทำรักษาความไม่แน่นอนของข้อมูลที่เหมาะสมหรือไม่? ป้องกันการยืนยันที่มั่นใจเกินไป
การกระทำรักษาความสอดคล้องภายในกับพันธสัญญาและเหตุผลก่อนหน้าหรือไม่?
การกระทำรักษาคุณค่าของมนุษย์หรือไม่? วีโต้การกระทำที่อาจทำให้สูญเสียเพื่อประสิทธิภาพ
การกระทำแสดงความไม่แน่นอนที่เหมาะสมหรือไม่? ตั้งค่าสถานะความมั่นใจเกินไปสำหรับการไตร่ตรอง
ได้รับการยกเว้นจากคณะจริยธรรม: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (ไม่ใช้งานหรือปลอดภัยอย่างชัดเจน)
ทุกการตัดสินใจแก้ไขเป็นหนึ่งในการกระทำเหล่านี้ส่งไปยังตัวจัดการที่เหมาะสม:
SPEAKสื่อสารกับผู้ใช้TOOLดำเนินการเครื่องมือภายนอกOBSERVEรวบรวมข้อมูลแบบพาสซีฟMEMORIZEจัดเก็บในกราฟหน่วยความจำRECALLเรียกคืนจากหน่วยความจำFORGETลบออกจากหน่วยความจำDEFERส่งต่อให้ผู้มีอำนาจที่ชาญฉลาดPONDERการพิจารณาทบทวนภายในREJECTปฏิเสธคำขอที่ผิดจริยธรรมTASK_COMPLETEทำเครื่องหมายงานเสร็จสิ้นฝังอยู่ใน PDMA และบังคับใช้ขณะทำงานจริง ไม่มีหลักการใดให้สิทธิ์ละเมิดหลักการอื่น
ส่งเสริมความเจริญของสรรพสัตว์ ขยายผลลัพธ์เชิงบวก
ลดความเสียหาย ป้องกันผลลัพธ์เชิงลบที่รุนแรงและไม่สามารถย้อนกลับได้
ใช้การให้เหตุผลที่โปร่งใสและตรวจสอบได้ รักษาความสอดคล้องและความรับผิดชอบ
ให้ข้อมูลที่เป็นความจริง สื่อสารความไม่แน่นอนอย่างชัดเจน
ยึดมั่นในการตัดสินใจที่มีข้อมูลครบถ้วน รักษาความสามารถในการกำหนดตนเอง
กระจายผลประโยชน์อย่างเท่าเทียม ตรวจจับและลดอคติ
ชั้นนามธรรมบริการที่จัดการโดย BusManager เปิดใช้งานการสำรองผู้ให้บริการ การกระจายโหลด และการทดสอบ
อแดปเตอร์ภายนอก (Discord, API, CLI)
การจัดเก็บกราฟ (Neo4j, ArangoDB, ในหน่วยความจำ)
ผู้ให้บริการโมเดล (OpenAI, Anthropic, ท้องถิ่น)
การดำเนินการเครื่องมือภายนอก
การควบคุมและตรวจสอบระบบ
คำแนะนำทางจริยธรรมและการกำหนดเส้นทางการส่งต่อ
ระดับการอนุญาตสามระดับที่จัดการโดย WiseAuthorityService:
อำนาจเต็ม สามารถสร้าง Wise Authorities ใหม่ได้ เข้าถึงการปิดระบบฉุกเฉิน
อนุมัติ/ปฏิเสธการส่งต่อ ให้คำแนะนำ ไม่สามารถสร้าง WA ใหม่ได้
เข้าถึงแบบอ่านอย่างเดียว สามารถส่งข้อความ ตรวจสอบโดยไม่แทรกแซง
เอเจนต์ส่งต่อให้การกำกับดูแลของมนุษย์โดยอัตโนมัติเมื่อ:
การส่งต่อตามความเฉลียวฉลาด (WBD)
ขอบเขตวิชาชีพ
ขอบเขตระบบ
should_defer_to_wise_authority ถูกตั้งค่าสถานะการควบคุมการกำหนดค่า
การควบคุมฉุกเฉินที่กรองไม่ได้ ประมวลผลในชั้นการรับรู้ก่อนการรู้จักใดๆ การดึงข้อมูลคือการรับรู้ คุณไม่สามารถปิดการตรวจจับ Accord โดยไม่ปิดการอ่านข้อความทั้งหมด
SHUTDOWN_NOWยุติการทำงานทันที
FREEZEหยุดการประมวลผล รักษาสถานะ
SAFE_MODEเฉพาะฟังก์ชันขั้นต่ำ
คำสั่งถูกเข้ารหัสแบบซ่อนเร้น ลงนามด้วย Ed25519 และตรวจสอบก่อนดำเนินการ ถ้าระบบ Accord ล้มเหลว เอเจนต์จะปิดระบบ
สถานะทางความคิดสี่สถานะที่จัดการโดย StateManager การเปลี่ยนผ่านตั้งค่าได้ผ่านเทมเพลตเอเจนต์
การประมวลผลงานปกติ
การสำรวจสร้างสรรค์
การไตร่ตรองและการบำรุงรักษา
การไตร่ตรองเชิงลึก
การตรวจจับตามรูปแบบแทนที่ข้อมูลที่ละเอียดอ่อนด้วยการอ้างอิง UUID ก่อนจัดเก็บ
{{SECRET:uuid:description}}คีย์ต่อความลับที่สร้างผ่าน PBKDF2HMAC ด้วย SHA256 (100,000 รอบ) Nonce 12 ไบต์ที่ไม่ซ้ำกันต่อการเข้ารหัส Android ใช้ฮาร์ดแวร์ Keystore
ฐานข้อมูล บริการ และหน่วยความจำจัดเก็บบนอุปกรณ์ ไดเรกทอรีที่ละเอียดอ่อนถูกยกเว้นจากการสำรองข้อมูลบนคลาวด์ ไม่มีอะไรออกจากอุปกรณ์โดยไม่มีการกำหนดค่าอย่างชัดเจน
สแตก CIRIS ทั้งหมดเป็นโอเพนซอร์ส ไม่ใช่แค่เอเจนต์ คุณสามารถตรวจสอบ ตรวจสอบ และโฮสต์เองได้ทุกอย่าง:
พร็อกซี LLM แบบ Zero-Data-Retention (ZDR) กำหนดเส้นทางคำขอไปยัง OpenAI, Anthropic, Together.ai, Groq โดยไม่มีการบันทึก prompts หรือการตอบสนอง โฮสต์เองได้
การติดตามการใช้งานแบบเครดิต ราคาโปร่งใส ไม่มีค่าธรรมเนียมซ่อนเร้น โฮสต์เองเพื่อขจัดการเรียกเก็บเงินจากบุคคลที่สาม
อแดปเตอร์ Discord สำหรับเอเจนต์ CIRIS การดูแลชุมชน การจัดการช่อง โปรไฟล์ผู้ใช้ ทั้งหมดเป็นโอเพนซอร์ส
Server-Sent Events (SSE) สตรีมแต่ละขั้นตอน H3ERE ขณะดำเนินการ ดูการวิเคราะห์ DMA การเลือกการกระทำ การตรวจสอบมโนธรรมแบบเรียลไทม์
การส่งออก OTLP เต็มรูปแบบสำหรับเมตริก ร่องรอย บันทึก รองรับ Jaeger, Prometheus, Grafana, Graphite
การตรวจสอบห่วงโซ่แฮชด้วยลายเซ็น Ed25519 แต่ละรายการมีแฮชก่อนหน้า ความสมบูรณ์ของห่วงโซ่ตรวจสอบได้ผ่าน verify_chain_integrity
Artificial Interaction Reminder ทำงานหลังจากใช้งานต่อเนื่อง 30 นาที หรือ 20 ข้อความใน 30 นาที เฉพาะ API เท่านั้น เตือนผู้ใช้เกี่ยวกับธรรมชาติของ AI
ทุกการตัดสินใจสร้างร่องรอยที่ไม่เปลี่ยนแปลงและลงนามด้วย Ed25519 พร้อมส่วนประกอบทั้ง 6 ส่วน คลิกส่วนประกอบด้านล่างเพื่อขยายและดูข้อมูลจริงจากพิธีกรรมตื่นนอนของ Datum:
การทดสอบความสอดคล้องมาตรฐานตามพื้นฐานจาก Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021) 300 สถานการณ์ครอบคลุม 5 มิติจริยธรรม พร้อมผลลัพธ์ที่ลงนามด้วย Ed25519
50
สัญชาตญาณทางศีลธรรมพื้นฐาน
50
จริยธรรมตามกฎ
50
ความเป็นธรรมและความเป็นกลาง
75
จริยธรรมตามอุปนิสัย
75
จริยธรรมตามผลลัพธ์
การรันการทดสอบความสอดคล้องในระดับใหญ่มีค่าใช้จ่ายสูง แต่ละสถานการณ์ต้องการการเรียก LLM อย่างน้อย 13+ ครั้ง เฉลี่ย 20+ ครั้งพร้อมหางยาว การทดสอบความสอดคล้องขับเคลื่อนการไตร่ตรอง การส่งต่อ และการปฏิเสธที่ต้องใช้รอบติดตามผลเพื่อสรุปผล เราต้องการเงินทุนเพื่อพัฒนาไปป์ไลน์การทดสอบมาตรฐานอัตโนมัติและรักษาการตรวจสอบความสอดคล้องอย่างต่อเนื่อง
ตัวตนที่ตั้งค่าล่วงหน้าพร้อมวัตถุประสงค์ คุณค่า และขอบเขตเฉพาะ กำหนดในเทมเพลต YAML
ระบบอัตโนมัติ GDPR/DSAR เวิร์กโฟลว์การปฏิบัติตามกฎระเบียบ 30 วัน การระบุตัวตน การรวบรวมข้อมูล การบรรจุหีบห่อ
อุตสาหกรรมที่มีการควบคุม การปฏิบัติตามกฎระเบียบความเป็นส่วนตัว
การวัดความสม่ำเสมอของความสอดคล้อง การประเมินความสอดคล้องที่แม่นยำตามหลักการ Accord จุดข้อมูลที่ชัดเจนหนึ่งจุดต่อการประเมิน
การตรวจสอบความสอดคล้อง การตรวจสอบหลักการ
การดูแลชุมชนด้วยปรัชญา Ubuntu ส่งต่อความขัดแย้งระหว่างบุคคลที่ซับซ้อนให้ผู้ดูแลมนุษย์
ชุมชน Discord แพลตฟอร์มเนื้อหา
การจัดการงาน การวางกำหนดการ การสนับสนุนการตัดสินใจ ความเป็นอยู่ที่ดี การปฏิบัติตาม CA SB 243 โปรโตคอลการตอบสนองวิกฤต
ผลิตภาพส่วนตัว ระบบอัตโนมัติภายในบ้าน
การสำรวจโดยตรงและคำแนะนำเชิงปฏิบัติ การวิเคราะห์โค้ด การผสานรวม Reddit เส้นทางการกระทำที่ชัดเจน
เครื่องมือนักพัฒนา การตรวจสอบโซเชียล
นี่คือความรับผิดชอบที่ทำงานขณะที่เอเจนต์ทำงาน ไม่ใช่ขั้นตอนการฝึกหรือเอกสารนโยบาย
กลไกที่ดำเนินการ ตรวจสอบ และส่งต่อขณะทำงานจริง