
Jika Anda tidak bisa memeriksa akuntabilitasnya, itu hanya pemasaran. Berikut hal-hal yang perlu diperhatikan, dan bagaimana berbagai pendekatan yang ada dibandingkan.
Nurani itu perlu. Tapi belum cukup.
Sebagian AI tidak punya aturan sama sekali. Sebagian mengikuti aturan tapi tidak bisa mendeteksi ketika sumber-sumbernya hanya saling mengulang. Hanya satu jenis yang memeriksa apakah informasinya benar-benar berasal dari tempat yang berbeda.
Tidak ada prinsip yang dipublikasikan. Tidak ada jejak audit. Sumber tertutup. Anda tidak bisa memeriksa apa yang dilakukannya atau alasannya.
Sebagian besar asisten AI konsumen (ChatGPT, Gemini) berada di sini dari sudut pandang akuntabilitas publik. Praktik internal yang baik mungkin ada; Anda tidak bisa memverifikasinya.
Membutuhkan regulasi eksternal. Tidak bisa mengatur dirinya sendiri.
Mengikuti aturan etika. Tapi tidak bisa mendeteksi ketika semua sumbernya hanya saling menyalin, sehingga bisa sangat yakin tapi tetap salah.
Aman jika diawasi. Tidak bisa mendeteksi ruang gema sendiri.
Mengikuti aturan etika DAN memeriksa apakah informasinya berasal dari tempat yang benar-benar berbeda. Ketika kesepakatan terlihat mencurigakan, ia menandainya sebelum bertindak.
Inilah yang CIRIS bangun.
Sebuah AI bisa mengikuti semua aturan, lulus setiap audit, dan tetap gagal jika semua informasinya berasal dari tempat yang sama. Titik buta itulah yang CIRIS dirancang untuk diperbaiki.
Inilah hal-hal yang membuat AI dapat diaudit dan bertanggung jawab. Enam yang pertama tentang melakukan hal yang benar. Yang ketujuh tentang menangkap situasi di mana 'melakukan hal yang benar' didasarkan pada informasi yang salah.
Agen harus mengikuti kerangka etika publik. Bukan aturan tersembunyi: sebuah dokumen yang bisa dibaca siapa saja dan dapat dijadikan acuan pertanggungjawaban.
Setiap tindakan melewati pemeriksaan nurani sebelum agen melakukannya. Bukan setelah kejadian. Sebelum.
Ketika tidak pasti atau menghadapi potensi bahaya, agen bertanya kepada manusia alih-alih menebak. Sudah tertanam dalam alur kerja, bukan pilihan.
Setiap keputusan dicatat dan ditandatangani sehingga Anda bisa memverifikasi persis apa yang terjadi dan mengapa. Tanda terima untuk setiap tindakan.
Persetujuan berjalan dua arah. Anda bisa menolak agen. Agen bisa menolak Anda. Tidak ada pihak yang dipaksa untuk berkompromi.
Anda tidak bisa mengaudit yang tidak bisa Anda lihat. CIRIS sepenuhnya open source di bawah AGPL-3.0. Siapa pun bisa membaca, memverifikasi, dan meningkatkan kodenya.
Hal yang tidak bisa ditangkap oleh aturan saja.
Sebelum bertindak, agen bertanya: "Apakah sumber-sumber saya benar-benar berbeda pendapat, atau semuanya mendapat informasi dari tempat yang sama?" Sepuluh sumber yang semuanya menyalin dari satu sumber asli pada dasarnya hanya satu sumber. Ketika kesepakatan terlihat terlalu seragam, agen menandainya untuk ditinjau oleh manusia.
Terlalu Berisik
Sumber-sumber saling bertentangan sedemikian rupa sehingga tidak ada kesimpulan yang berguna.
Sehat
Sumber-sumber benar-benar berbeda. Kesepakatan nyata punya makna.
Ruang Gema
Terlihat seperti kesepakatan, tapi sumber-sumber hanya mengulang satu sama lain.
Inilah yang membedakan CIRIS dari kerangka akuntabilitas AI lainnya.
Ingin melihat matematikanya? Baca tesis lengkapnya โBerdasarkan dokumentasi yang tersedia secara publik per Februari 2026. Jika ada yang terlewat atau ada yang salah, beri tahu kami.
| Proyek | Memeriksa Setiap Keputusan | Aturan yang Dipublikasikan | Nurani Tertanam | Bukti Apa yang Dilakukannya | Open Source | Deteksi Ruang Gema |
|---|---|---|---|---|---|---|
| CIRIS | Ya | Ya | Ya | Ya | AGPL-3.0 | Ya |
| Constitutional AI | Saat pelatihan saja | Implisit | Tidak | Tidak | Tidak | Tidak |
| LlamaFirewall / NeMo Guardrails | Ya | Tidak | Tidak | Pencatatan | Ya | Tidak |
| HatCat | Ya | Sebagian | Pengarahan | Sebagian | CC0 | Tidak |
| Dewan Etika / Kerangka Tata Kelola | Tidak | Ya | Tidak | Manual | Bervariasi | Tidak |
Filter keluaran dan kerangka tata kelola memecahkan masalah yang penting tapi berbeda. Filter memblokir keluaran berbahaya. Nurani mempertimbangkan nilai-nilai. CIRIS bertujuan melakukan keduanya, dan menangkap titik buta yang tidak bisa ditangani keduanya secara sendiri-sendiri.
Memblokir keluaran berbahaya: injeksi prompt, konten berbahaya, serangan adversarial. Seperti filter yang menangkap hal buruk sebelum keluar.
Mempertimbangkan apakah suatu tindakan benar, bukan hanya apakah itu aman. Seperti hakim yang menimbang situasi sebelum mengambil keputusan.
Memeriksa apakah kesepakatan itu nyata atau hanya pengulangan. Seperti pemeriksa fakta yang bertanya "apakah kalian semua membaca artikel yang sama?"
Banyak agen yang lebih kecil, masing-masing terikat pada prinsip yang dipublikasikan, masing-masing dapat diaudit, masing-masing menyerahkan keputusan kepada Otoritas Bijak. Tidak ada satu perusahaan atau entitas yang mengendalikan seluruh tumpukan. Semakin independen agennya, semakin sulit satu kegagalan menyebar ke mana-mana.
Ini adalah penelitian aktif. Kami transparan tentang apa yang sudah terbukti dan apa yang masih diuji.
Sudah terbukti kuat
Masih diuji
Lihat Cara Berpikirnya
Lihat penalaran agen nyata langkah demi langkah. Jelajahi jejak โ
Verifikasi Identitasnya
Lihat bagaimana agen membuktikan siapa mereka, seperti DMV untuk AI. Kepercayaan & identitas โ
Mulai
Terapkan agen pertama Anda atau baca tesis dalam bahasa yang mudah dipahami. Kontak pertama โ
Setiap klaim di halaman ini didukung oleh kode yang bisa Anda baca, jejak yang bisa Anda verifikasi, dan penelitian yang bisa Anda periksa. Itulah intinya.