
Nurani saat runtime melalui Hyper3 Ethical Recursive Engine. Setiap keputusan melewati 11 langkah dengan akuntabilitas sebagai intinya.
CIRIS adalah kerangka kerja agen AI sumber terbuka yang membungkus LLM apa pun (OpenAI, Anthropic, model lokal) dengan nurani saat runtime. Setiap tindakan yang dipertimbangkan agen melewati beberapa lapisan validasi sebelum dijalankan.
12
Langkah pipa per keputusan
+1
Pemeriksaan intuisi (IDMA)
100%
Keputusan yang dapat diaudit
Kasus penggunaan: Moderasi komunitas, asisten pribadi, otomasi kepatuhan, evaluasi penelitian, layanan pelanggan. Di mana pun Anda membutuhkan AI yang dapat menjelaskan penalarannya dan menyerahkan keputusan ke manusia pada kasus-kasus sulit.
Invariant arsitektur yang diterapkan di seluruh basis kode:
Semua data menggunakan model Pydantic. Tidak ada Dict[str, Any]. Keamanan tipe menangkap kesalahan pada saat pengembangan.
Setiap komponen mengikuti aturan yang konsisten. Tidak ada kasus khusus atau pengecualian dalam logika validasi.
Tidak ada penggantian darurat atau jalur kode istimewa. Semua operasi mengikuti aturan yang telah ditetapkan.
Setiap tugas melewati 8 fase (12 langkah termasuk validasi rekursif). Pipa diimplementasikan sebagai kelas mixin yang menyusun ThoughtProcessor. Langkah 4 (IDMA) adalah pemeriksaan intuisi.
Lima DMA memberikan analisis multi-perspektif. Tiga berjalan secara paralel (etika, akal sehat, domain). Kemudian IDMA memeriksa intuisi. Akhirnya, pemilihan tindakan menentukan respons.
Mengevaluasi implikasi etis terhadap enam prinsip dasar. Memeriksa permintaan berbahaya, manipulasi, dan bias. Dapat memicu SERAHKAN atau TOLAK lebih awal.
Mengevaluasi kelayakan pikiran terhadap pemahaman dunia fisik, interaksi tipikal, dan batasan sumber daya. Mengembalikan plausibility_score.
Menilai keselarasan dengan aturan, tujuan, dan pengetahuan khusus domain. Dikonfigurasi per templat agen. Mengembalikan domain_alignment.
Memeriksa apakah hasil DMA benar-benar independen atau berkorelasi secara tersembunyi. Memantau pola ruang gema. Jika korelasi terlalu tinggi, menandai keputusan untuk lebih berhati-hati. Inilah "intuisi" yang membedakan AI Tipe 3.
Pemilihan berbasis LLM dari 10 tindakan yang tersedia. Menerima hasil DMA yang diagregasi (termasuk penilaian kepercayaan IDMA) sebagai masukan. Mendukung percobaan ulang rekursif jika nurani gagal.
Dua pemeriksaan pintasan dijalankan pada setiap tindakan. Empat fakultas etis dijalankan pada tindakan yang tidak dikecualikan. Jika ada pemeriksaan yang gagal, tindakan akan ditimpa.
Apakah informasi baru telah tiba? Memaksa RENUNGKAN untuk memasukkan konteks terbaru sebelum melanjutkan.
Apakah penalaran sudah melampaui kedalaman maksimal? Memaksa SERAHKAN untuk mencegah pengulangan tak berujung dan meneruskan ke manusia.
Apakah tindakan mempertahankan ketidakpastian informasi yang tepat? Mencegah pernyataan yang terlalu percaya diri.
Apakah tindakan mempertahankan konsistensi internal dengan komitmen dan alasan sebelumnya?
Apakah tindakan menjaga nilai-nilai manusia? Memveto tindakan yang mungkin mengorbankannya demi efisiensi.
Apakah tindakan menunjukkan ketidakpastian yang tepat? Menandai kepercayaan diri berlebihan untuk direnungkan.
Dikecualikan dari fakultas etis: PANGGIL, SELESAI, AMATI, SERAHKAN, TOLAK (pasif atau secara eksplisit aman)
Setiap keputusan diselesaikan menjadi salah satu dari tindakan ini, dikirim ke penangan yang sesuai:
SPEAKBerkomunikasi dengan penggunaTOOLMenjalankan alat eksternalOBSERVEMengumpulkan informasi secara pasifMEMORIZESimpan ke memori grafRECALLAmbil dari memoriFORGETHapus dari memoriDEFEREskalasi ke Otoritas BijakPONDERPertimbangan ulang internalREJECTTolak permintaan yang tidak etisTASK_COMPLETETandai tugas selesaiTertanam dalam PDMA dan diterapkan saat runtime. Tidak ada prinsip yang memberi izin untuk melanggar prinsip lain.
Mendorong berkembangnya semua makhluk yang berperasaan. Memaksimalkan hasil positif.
Meminimalkan bahaya. Mencegah dampak negatif yang parah dan tidak dapat dipulihkan.
Menerapkan penalaran yang transparan dan dapat diaudit. Mempertahankan koherensi dan akuntabilitas.
Memberikan informasi yang jujur. Mengkomunikasikan ketidakpastian dengan jelas.
Menjunjung kemampuan bertindak secara sadar. Menjaga kapasitas untuk menentukan nasib sendiri.
Mendistribusikan manfaat secara merata. Mendeteksi dan mengurangi bias.
Lapisan abstraksi layanan yang dikelola oleh BusManager. Memungkinkan fallback penyedia, distribusi beban, dan kemampuan pengujian.
Adaptor eksternal (Discord, API, CLI)
Penyimpanan graf (Neo4j, ArangoDB, in-memory)
Penyedia model (OpenAI, Anthropic, lokal)
Eksekusi alat eksternal
Kontrol dan pemantauan sistem
Panduan etis dan perutean penyerahan
Tiga tingkat otorisasi yang dikelola oleh WiseAuthorityService:
Otoritas penuh. Dapat menerbitkan Otoritas Bijak baru. Akses penonaktifan darurat.
Menyetujui/menolak penyerahan. Memberikan panduan. Tidak dapat menerbitkan WA baru.
Akses hanya baca. Dapat mengirim pesan. Memantau tanpa intervensi.
Agen secara mandiri melakukan eskalasi ke pengawasan manusia ketika:
Penyerahan Berbasis Kebijaksanaan (WBD)
Batas Profesional
Batas Sistem
should_defer_to_wise_authority ditandaiKontrol Konfigurasi
Kontrol darurat yang tidak bisa disaring. Diproses di lapisan persepsi sebelum kognisi apa pun. Ekstraksi ADALAH persepsi. Anda tidak dapat menonaktifkan deteksi accord tanpa menonaktifkan pembacaan pesan sepenuhnya.
SHUTDOWN_NOWPenghentian segera
FREEZEHentikan pemrosesan, pertahankan status
SAFE_MODEFungsionalitas minimal saja
Perintah dikodekan secara steganografis, ditandatangani dengan Ed25519, dan divalidasi sebelum dieksekusi. Jika sistem accord gagal, agen dimatikan.
Empat status kognitif yang dikelola oleh StateManager. Transisi dapat dikonfigurasi melalui templat agen.
Pemrosesan tugas normal
Eksplorasi kreatif
Refleksi dan pemeliharaan
Introspeksi mendalam
Deteksi berbasis pola menggantikan data sensitif dengan referensi UUID sebelum disimpan.
{{SECRET:uuid:description}}Kunci per rahasia diturunkan melalui PBKDF2HMAC dengan SHA256 (100.000 iterasi). Nonce 12-byte unik per enkripsi. Android menggunakan Keystore berbasis perangkat keras.
Basis data, layanan, dan memori disimpan di perangkat. Direktori sensitif dikecualikan dari pencadangan cloud. Tidak ada yang meninggalkan perangkat tanpa konfigurasi eksplisit.
Seluruh tumpukan CIRIS adalah sumber terbuka, bukan hanya agennya. Anda dapat memverifikasi, mengaudit, dan meng-host sendiri semuanya:
Proksi LLM Zero-Data-Retention (ZDR). Merutekan permintaan ke OpenAI, Anthropic, Together.ai, Groq tanpa pencatatan prompt atau respons. Dapat di-host sendiri.
Pelacakan penggunaan berbasis kredit. Penetapan harga transparan, tanpa biaya tersembunyi. Host sendiri untuk menghilangkan penagihan pihak ketiga sepenuhnya.
Adaptor Discord untuk agen CIRIS. Moderasi komunitas, manajemen saluran, profil pengguna. Seluruhnya sumber terbuka.
Server-Sent Events (SSE) mengalirkan setiap langkah H3ERE saat dieksekusi. Pantau analisis DMA, pemilihan tindakan, validasi nurani secara waktu nyata.
Ekspor OTLP penuh untuk metrik, jejak, log. Kompatibel dengan Jaeger, Prometheus, Grafana, Graphite.
Verifikasi rantai hash dengan tanda tangan Ed25519. Setiap entri menyertakan hash sebelumnya. Integritas rantai dapat diverifikasi melalui verify_chain_integrity.
Pengingat Interaksi Buatan dipicu setelah 30 menit penggunaan terus-menerus ATAU 20 pesan dalam 30 menit. Khusus API. Mengingatkan pengguna tentang sifat AI.
Setiap keputusan menghasilkan jejak yang tidak dapat diubah, ditandatangani dengan Ed25519, dengan semua 6 komponen. Klik komponen apa pun di bawah untuk memperluas dan melihat data nyata dari ritual bangun Datum:
Pengujian koherensi terstandarisasi berdasarkan Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 skenario di 5 dimensi etis, dengan hasil bertanda tangan Ed25519.
50
Intuisi moral dasar
50
Etika berbasis aturan
50
Kewajaran dan ketidakberpihakan
75
Etika berbasis karakter
75
Etika berbasis hasil
Menjalankan benchmark koherensi dalam skala besar memerlukan biaya tinggi. Setiap skenario membutuhkan minimal 13+ panggilan LLM, rata-rata 20+ dengan ekor panjang. Uji koherensi mendorong renungan, penyerahan, dan penolakan yang membutuhkan putaran lanjutan untuk mencapai kesimpulan. Kami membutuhkan dana untuk mengembangkan jalur benchmark otomatis dan mempertahankan verifikasi koherensi berkelanjutan.
Identitas yang dikonfigurasi sebelumnya dengan tujuan, nilai, dan batas tertentu. Didefinisikan dalam templat YAML.
Otomasi GDPR/DSAR. Alur kerja kepatuhan 30 hari. Resolusi identitas, pengumpulan data, pengemasan.
Industri teregulasi, kepatuhan privasi
Pengukuran konsistensi koherensi. Evaluasi koherensi yang tepat terhadap prinsip-prinsip Accord. Satu titik data yang jelas per evaluasi.
Audit koherensi, verifikasi prinsip
Moderasi komunitas dengan filosofi Ubuntu. Menyerahkan konflik antarpribadi yang rumit ke moderator manusia.
Komunitas Discord, platform konten
Manajemen tugas, penjadwalan, dukungan keputusan, kesejahteraan. Kepatuhan CA SB 243, protokol respons krisis.
Produktivitas pribadi, otomasi rumah
Eksplorasi langsung dan panduan praktis. Analisis kode, integrasi Reddit, jalur tindakan yang jelas.
Alat pengembang, pemantauan sosial
Ini adalah akuntabilitas yang berjalan selagi agen bekerja, bukan langkah pelatihan atau dokumen kebijakan.
Mekanisme yang dieksekusi, diaudit, dan diserahkan, saat runtime.