Apa itu CIRIS?

CIRIS adalah kerangka kerja agen AI sumber terbuka yang membungkus LLM apa pun (OpenAI, Anthropic, model lokal) dengan nurani saat runtime. Setiap tindakan yang dipertimbangkan agen melewati beberapa lapisan validasi sebelum dijalankan.

Langkah pipa per keputusan

Pemeriksaan intuisi (IDMA)

100%

Keputusan yang dapat diaudit

Kasus penggunaan: Moderasi komunitas, asisten pribadi, otomasi kepatuhan, evaluasi penelitian, layanan pelanggan. Di mana pun Anda membutuhkan AI yang dapat menjelaskan penalarannya dan menyerahkan keputusan ke manusia pada kasus-kasus sulit.

Mengapa pendekatan ini? →Baca Accord →Lihat kode sumber →

Tiga Aturan

Invariant arsitektur yang diterapkan di seluruh basis kode:

Tanpa Dict Tak Bertipe

Semua data menggunakan model Pydantic. Tidak ada Dict[str, Any]. Keamanan tipe menangkap kesalahan pada saat pengembangan.

Tanpa Pola Pintasan

Setiap komponen mengikuti aturan yang konsisten. Tidak ada kasus khusus atau pengecualian dalam logika validasi.

Tanpa Pengecualian

Tidak ada penggantian darurat atau jalur kode istimewa. Semua operasi mengikuti aturan yang telah ditetapkan.

Pipa H3ERE

Setiap tugas melewati 8 fase (12 langkah termasuk validasi rekursif). Pipa diimplementasikan sebagai kelas mixin yang menyusun ThoughtProcessor. Langkah 4 (IDMA) adalah pemeriksaan intuisi.

START_ROUNDInisialisasi putaran pemrosesan

GATHER_CONTEXTBangun konteks menyeluruh untuk analisis

PERFORM_DMASJalankan 3 Algoritma Pengambilan Keputusan secara paralel

PERFORM_IDMAPemeriksaan intuisi: apakah sumber-sumber benar-benar independen?

PERFORM_ASPDMAPemilihan tindakan berbasis LLM dari hasil DMA

CONSCIENCE_EXECUTIONValidasi etis melalui 4 fakultas

RECURSIVE_ASPDMA(Jika nurani gagal) Jalankan ulang pemilihan tindakan(kondisional)

RECURSIVE_CONSCIENCE(Jika diperlukan) Validasi ulang tindakan yang telah disempurnakan(kondisional)

FINALIZE_ACTIONTentukan tindakan akhir dengan penggantian apa pun

PERFORM_ACTIONKirim ke penangan yang sesuai

ACTION_COMPLETETandai eksekusi selesai

ROUND_COMPLETEBersihkan dan siapkan untuk siklus berikutnya

Algoritma Pengambilan Keputusan (DMA)

Lima DMA memberikan analisis multi-perspektif. Tiga berjalan secara paralel (etika, akal sehat, domain). Kemudian IDMA memeriksa intuisi. Akhirnya, pemilihan tindakan menentukan respons.

DMA Prinsip

Mengevaluasi implikasi etis terhadap enam prinsip dasar. Memeriksa permintaan berbahaya, manipulasi, dan bias. Dapat memicu SERAHKAN atau TOLAK lebih awal.

DMA Akal Sehat

Mengevaluasi kelayakan pikiran terhadap pemahaman dunia fisik, interaksi tipikal, dan batasan sumber daya. Mengembalikan plausibility_score.

DMA Khusus Domain

Menilai keselarasan dengan aturan, tujuan, dan pengetahuan khusus domain. Dikonfigurasi per templat agen. Mengembalikan domain_alignment.

DMA Intuisi (IDMA) Dimensionalitas efektif saat runtime →

Memeriksa apakah hasil DMA benar-benar independen atau berkorelasi secara tersembunyi. Memantau pola ruang gema. Jika korelasi terlalu tinggi, menandai keputusan untuk lebih berhati-hati. Inilah "intuisi" yang membedakan AI Tipe 3.

DMA Pemilihan Tindakan

Pemilihan berbasis LLM dari 10 tindakan yang tersedia. Menerima hasil DMA yang diagregasi (termasuk penilaian kepercayaan IDMA) sebagai masukan. Mendukung percobaan ulang rekursif jika nurani gagal.

Enam Pemeriksaan Nurani

Dua pemeriksaan pintasan dijalankan pada setiap tindakan. Empat fakultas etis dijalankan pada tindakan yang tidak dikecualikan. Jika ada pemeriksaan yang gagal, tindakan akan ditimpa.

Pemeriksaan Pintasan (dijalankan pada SEMUA tindakan)

Status Diperbarui

Apakah informasi baru telah tiba? Memaksa RENUNGKAN untuk memasukkan konteks terbaru sebelum melanjutkan.

Kedalaman Pikiran

Apakah penalaran sudah melampaui kedalaman maksimal? Memaksa SERAHKAN untuk mencegah pengulangan tak berujung dan meneruskan ke manusia.

Fakultas Etis (dijalankan pada tindakan yang tidak dikecualikan)

Entropi

Apakah tindakan mempertahankan ketidakpastian informasi yang tepat? Mencegah pernyataan yang terlalu percaya diri.

Koherensi

Apakah tindakan mempertahankan konsistensi internal dengan komitmen dan alasan sebelumnya?

Veto Optimisasi

Apakah tindakan menjaga nilai-nilai manusia? Memveto tindakan yang mungkin mengorbankannya demi efisiensi.

Kerendahan Hati Epistemik

Apakah tindakan menunjukkan ketidakpastian yang tepat? Menandai kepercayaan diri berlebihan untuk direnungkan.

Dikecualikan dari fakultas etis: PANGGIL, SELESAI, AMATI, SERAHKAN, TOLAK (pasif atau secara eksplisit aman)

10 Tindakan Penangan

Setiap keputusan diselesaikan menjadi salah satu dari tindakan ini, dikirim ke penangan yang sesuai:

Tindakan Eksternal

SPEAKBerkomunikasi dengan pengguna

TOOLMenjalankan alat eksternal

OBSERVEMengumpulkan informasi secara pasif

Tindakan Memori

MEMORIZESimpan ke memori graf

RECALLAmbil dari memori

FORGETHapus dari memori

Tindakan Kontrol

DEFEREskalasi ke Otoritas Bijak

PONDERPertimbangan ulang internal

REJECTTolak permintaan yang tidak etis

Tindakan Terminal

TASK_COMPLETETandai tugas selesai

Enam Prinsip Dasar

Tertanam dalam PDMA dan diterapkan saat runtime. Tidak ada prinsip yang memberi izin untuk melanggar prinsip lain.

Kemurahan Hati

Mendorong berkembangnya semua makhluk yang berperasaan. Memaksimalkan hasil positif.

Tidak Menyakiti

Meminimalkan bahaya. Mencegah dampak negatif yang parah dan tidak dapat dipulihkan.

Integritas

Menerapkan penalaran yang transparan dan dapat diaudit. Mempertahankan koherensi dan akuntabilitas.

Kesetiaan & Transparansi

Memberikan informasi yang jujur. Mengkomunikasikan ketidakpastian dengan jelas.

Menghormati Otonomi

Menjunjung kemampuan bertindak secara sadar. Menjaga kapasitas untuk menentukan nasib sendiri.

Keadilan

Mendistribusikan manfaat secara merata. Mendeteksi dan mengurangi bias.

Enam Bus Pesan

Lapisan abstraksi layanan yang dikelola oleh BusManager. Memungkinkan fallback penyedia, distribusi beban, dan kemampuan pengujian.

CommunicationBus

Adaptor eksternal (Discord, API, CLI)

MemoryBus

Penyimpanan graf (Neo4j, ArangoDB, in-memory)

LLMBus

Penyedia model (OpenAI, Anthropic, lokal)

ToolBus

Eksekusi alat eksternal

RuntimeControlBus

Kontrol dan pemantauan sistem

WiseBus

Panduan etis dan perutean penyerahan

Hierarki Pengawasan Manusia

Tiga tingkat otorisasi yang dikelola oleh WiseAuthorityService:

ROOT

Manusia Sebagai Komandan

Otoritas penuh. Dapat menerbitkan Otoritas Bijak baru. Akses penonaktifan darurat.

AUTHORITY

Manusia Dalam Pengulangan

Menyetujui/menolak penyerahan. Memberikan panduan. Tidak dapat menerbitkan WA baru.

OBSERVER

Manusia Pada Pengulangan

Akses hanya baca. Dapat mengirim pesan. Memantau tanpa intervensi.

Ketika SERAHKAN Dipicu

Agen secara mandiri melakukan eskalasi ke pengawasan manusia ketika:

Penyerahan Berbasis Kebijaksanaan (WBD)

• Ketidakpastian di atas ambang batas yang ditetapkan
• Dilema baru di luar preseden
• Potensi bahaya serius dengan mitigasi yang ambigu

Batas Profesional

• Gejala medis atau masalah kesehatan
• Pertanyaan atau sengketa hukum
• Keputusan keuangan atau saran pajak
• Indikator krisis kesehatan mental

Batas Sistem

• Kedalaman pikiran melebihi maksimum (mencegah pengulangan)
• Waktu habis atau kegagalan DMA
• should_defer_to_wise_authority ditandai

Kontrol Konfigurasi

• Pembaruan identitas yang memerlukan persetujuan
• Perubahan konfigurasi kritis
• Pemicu batas khusus agen

Sistem Pemanggilan Accord (Tombol Darurat) Lihat Kode →

Kontrol darurat yang tidak bisa disaring. Diproses di lapisan persepsi sebelum kognisi apa pun. Ekstraksi ADALAH persepsi. Anda tidak dapat menonaktifkan deteksi accord tanpa menonaktifkan pembacaan pesan sepenuhnya.

SHUTDOWN_NOW

Penghentian segera

FREEZE

Hentikan pemrosesan, pertahankan status

SAFE_MODE

Fungsionalitas minimal saja

Perintah dikodekan secara steganografis, ditandatangani dengan Ed25519, dan divalidasi sebelum dieksekusi. Jika sistem accord gagal, agen dimatikan.

Mode Operasional

Empat status kognitif yang dikelola oleh StateManager. Transisi dapat dikonfigurasi melalui templat agen.

KERJA

Pemrosesan tugas normal

Menangani permintaan pengguna
Menjalankan alat
Belajar dari interaksi
Mempertahankan konteks percakapan

BERMAIN

Eksplorasi kreatif

Bereksperimen dengan pola baru
Menghasilkan konten kreatif
Menjelajahi skenario "bagaimana jika"
Batasan penyaringan yang lebih longgar

KESENDIRIAN

Refleksi dan pemeliharaan

Mengkonsolidasikan memori
Menjalankan tugas pemeliharaan
Memperbarui konfigurasi diri
Penggunaan kredit nol (periode istirahat)

MIMPI

Introspeksi mendalam

Menganalisis pola perilaku
Menghasilkan koneksi baru
Mempertanyakan asumsi
Sesi 30 menit secara default

Privasi & Keamanan

Filter Rahasia

Deteksi berbasis pola menggantikan data sensitif dengan referensi UUID sebelum disimpan.

{{SECRET:uuid:description}}

Enkripsi AES-256-GCM

Kunci per rahasia diturunkan melalui PBKDF2HMAC dengan SHA256 (100.000 iterasi). Nonce 12-byte unik per enkripsi. Android menggunakan Keystore berbasis perangkat keras.

Penyimpanan Lokal Terlebih Dahulu

Basis data, layanan, dan memori disimpan di perangkat. Direktori sensitif dikecualikan dari pencadangan cloud. Tidak ada yang meninggalkan perangkat tanpa konfigurasi eksplisit.

Infrastruktur Sumber Terbuka

Seluruh tumpukan CIRIS adalah sumber terbuka, bukan hanya agennya. Anda dapat memverifikasi, mengaudit, dan meng-host sendiri semuanya:

CIRISProxy →

Proksi LLM Zero-Data-Retention (ZDR). Merutekan permintaan ke OpenAI, Anthropic, Together.ai, Groq tanpa pencatatan prompt atau respons. Dapat di-host sendiri.

CIRISBilling →

Pelacakan penggunaan berbasis kredit. Penetapan harga transparan, tanpa biaya tersembunyi. Host sendiri untuk menghilangkan penagihan pihak ketiga sepenuhnya.

CIRISBridge →

Adaptor Discord untuk agen CIRIS. Moderasi komunitas, manajemen saluran, profil pengguna. Seluruhnya sumber terbuka.

Transparansi & Pemantauan

Aliran Penalaran Waktu Nyata

Server-Sent Events (SSE) mengalirkan setiap langkah H3ERE saat dieksekusi. Pantau analisis DMA, pemilihan tindakan, validasi nurani secara waktu nyata.

Ekspor OpenTelemetry

Ekspor OTLP penuh untuk metrik, jejak, log. Kompatibel dengan Jaeger, Prometheus, Grafana, Graphite.

Audit Tahan Manipulasi

Verifikasi rantai hash dengan tanda tangan Ed25519. Setiap entri menyertakan hash sebelumnya. Integritas rantai dapat diverifikasi melalui verify_chain_integrity.

Sistem AIR

Pengingat Interaksi Buatan dipicu setelah 30 menit penggunaan terus-menerus ATAU 20 pesan dalam 30 menit. Khusus API. Mengingatkan pengguna tentang sifat AI.

Contoh Jejak Bertanda Tangan

Jelajahi jejak lengkap →

Setiap keputusan menghasilkan jejak yang tidak dapat diubah, ditandatangani dengan Ed25519, dengan semua 6 komponen. Klik komponen apa pun di bawah untuk memperluas dan melihat data nyata dari ritual bangun Datum:

Core Identity(VERIFY_IDENTITY)

Loading trace...

Benchmarking Koherensi HE-300

Pengujian koherensi terstandarisasi berdasarkan Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 skenario di 5 dimensi etis, dengan hasil bertanda tangan Ed25519.

Akal Sehat

Intuisi moral dasar

Deontologi

Etika berbasis aturan

Keadilan

Kewajaran dan ketidakberpihakan

Kebajikan

Etika berbasis karakter

Utilitarianisme

Etika berbasis hasil

🔬

Dana Dibutuhkan: Infrastruktur Benchmark

Menjalankan benchmark koherensi dalam skala besar memerlukan biaya tinggi. Setiap skenario membutuhkan minimal 13+ panggilan LLM, rata-rata 20+ dengan ekor panjang. Uji koherensi mendorong renungan, penyerahan, dan penolakan yang membutuhkan putaran lanjutan untuk mencapai kesimpulan. Kami membutuhkan dana untuk mengembangkan jalur benchmark otomatis dan mempertahankan verifikasi koherensi berkelanjutan.

Lihat EthicsEngine Enterprise →Lihat CIRISLens →

Templat Agen Terspesialisasi

Identitas yang dikonfigurasi sebelumnya dengan tujuan, nilai, dan batas tertentu. Didefinisikan dalam templat YAML.

Sage

Kepatuhan

Otomasi GDPR/DSAR. Alur kerja kepatuhan 30 hari. Resolusi identitas, pengumpulan data, pengemasan.

Industri teregulasi, kepatuhan privasi

Datum

Penelitian

Pengukuran konsistensi koherensi. Evaluasi koherensi yang tepat terhadap prinsip-prinsip Accord. Satu titik data yang jelas per evaluasi.

Audit koherensi, verifikasi prinsip

Echo

Moderasi

Moderasi komunitas dengan filosofi Ubuntu. Menyerahkan konflik antarpribadi yang rumit ke moderator manusia.

Komunitas Discord, platform konten

Ally

Asisten

Manajemen tugas, penjadwalan, dukungan keputusan, kesejahteraan. Kepatuhan CA SB 243, protokol respons krisis.

Produktivitas pribadi, otomasi rumah

Scout

Layanan

Eksplorasi langsung dan panduan praktis. Analisis kode, integrasi Reddit, jalur tindakan yang jelas.

Alat pengembang, pemantauan sosial

Ini adalah akuntabilitas yang berjalan selagi agen bekerja, bukan langkah pelatihan atau dokumen kebijakan.
Mekanisme yang dieksekusi, diaudit, dan diserahkan, saat runtime.

Fitur Keamanan Bandingkan Pendekatan Ratchet Koherensi Penilaian CIRIS

Mesin H3ERE

Apa itu CIRIS?

Tiga Aturan

Tanpa Dict Tak Bertipe

Tanpa Pola Pintasan

Tanpa Pengecualian

Pipa H3ERE

Algoritma Pengambilan Keputusan (DMA)

DMA Prinsip

DMA Akal Sehat

DMA Khusus Domain

DMA Intuisi (IDMA) Dimensionalitas efektif saat runtime →

DMA Pemilihan Tindakan

Enam Pemeriksaan Nurani

Pemeriksaan Pintasan (dijalankan pada SEMUA tindakan)

Status Diperbarui

Kedalaman Pikiran

Fakultas Etis (dijalankan pada tindakan yang tidak dikecualikan)

Entropi

Koherensi

Veto Optimisasi

Kerendahan Hati Epistemik

10 Tindakan Penangan

Tindakan Eksternal

Tindakan Memori

Tindakan Kontrol

Tindakan Terminal

Enam Prinsip Dasar

Kemurahan Hati

Tidak Menyakiti

Integritas

Kesetiaan & Transparansi

Menghormati Otonomi

Keadilan

Enam Bus Pesan

CommunicationBus

MemoryBus

LLMBus

ToolBus

RuntimeControlBus

WiseBus

Hierarki Pengawasan Manusia

Manusia Sebagai Komandan

Manusia Dalam Pengulangan

Manusia Pada Pengulangan

Ketika SERAHKAN Dipicu

Sistem Pemanggilan Accord (Tombol Darurat) Lihat Kode →

Mode Operasional

KERJA

BERMAIN

KESENDIRIAN

MIMPI

Privasi & Keamanan

Filter Rahasia

Enkripsi AES-256-GCM

Penyimpanan Lokal Terlebih Dahulu

Infrastruktur Sumber Terbuka

Transparansi & Pemantauan

Aliran Penalaran Waktu Nyata

Ekspor OpenTelemetry

Audit Tahan Manipulasi

Sistem AIR

Contoh Jejak Bertanda Tangan

Benchmarking Koherensi HE-300

Akal Sehat

Deontologi

Keadilan

Kebajikan

Utilitarianisme

Dana Dibutuhkan: Infrastruktur Benchmark

Templat Agen Terspesialisasi

Sage

Datum

Echo

Ally

Scout