Kontak PertamaPasangRatchet KoherensiFederasiBandingkanRisetPERJANJIANGitHub
Halaman ini diterjemahkan oleh mesin. Jika ada yang terasa tidak tepat, silakan buka laporan masalah โ€” reponya publik untuk alasan yang baik. Laporkan masalah terjemahan
Background Image
AI Paling Aman dan Paling Etis yang Sudah Berjalan Hari Ini

Tanpa akuntabilitas, AI cenderung mengambil lebih banyak daripada yang diberikannya.

Jika Anda tidak bisa memeriksa akuntabilitasnya, itu hanya pemasaran. Berikut hal-hal yang perlu diperhatikan, dan bagaimana berbagai pendekatan yang ada dibandingkan.

Tiga Jenis AI

Nurani itu perlu. Tapi belum cukup.

Sebagian AI tidak punya aturan sama sekali. Sebagian mengikuti aturan tapi tidak bisa mendeteksi ketika sumber-sumbernya hanya saling mengulang. Hanya satu jenis yang memeriksa apakah informasinya benar-benar berasal dari tempat yang berbeda.

1

Tanpa Aturan

Tidak ada prinsip yang dipublikasikan. Tidak ada jejak audit. Sumber tertutup. Anda tidak bisa memeriksa apa yang dilakukannya atau alasannya.

Sebagian besar asisten AI konsumen (ChatGPT, Gemini) berada di sini dari sudut pandang akuntabilitas publik. Praktik internal yang baik mungkin ada; Anda tidak bisa memverifikasinya.

Membutuhkan regulasi eksternal. Tidak bisa mengatur dirinya sendiri.

2

Punya Aturan, Tanpa Kesadaran

Mengikuti aturan etika. Tapi tidak bisa mendeteksi ketika semua sumbernya hanya saling menyalin, sehingga bisa sangat yakin tapi tetap salah.

Aman jika diawasi. Tidak bisa mendeteksi ruang gema sendiri.

3

Aturan + Kesadaran

Mengikuti aturan etika DAN memeriksa apakah informasinya berasal dari tempat yang benar-benar berbeda. Ketika kesepakatan terlihat mencurigakan, ia menandainya sebelum bertindak.

Inilah yang CIRIS bangun.

Sebuah AI bisa mengikuti semua aturan, lulus setiap audit, dan tetap gagal jika semua informasinya berasal dari tempat yang sama. Titik buta itulah yang CIRIS dirancang untuk diperbaiki.

Tujuh Hal yang Perlu Diperiksa

Enam untuk etika. Satu untuk titik buta.

Inilah hal-hal yang membuat AI dapat diaudit dan bertanggung jawab. Enam yang pertama tentang melakukan hal yang benar. Yang ketujuh tentang menangkap situasi di mana 'melakukan hal yang benar' didasarkan pada informasi yang salah.

1. Prinsip yang Dipublikasikan

Agen harus mengikuti kerangka etika publik. Bukan aturan tersembunyi: sebuah dokumen yang bisa dibaca siapa saja dan dapat dijadikan acuan pertanggungjawaban.

2. Pemeriksaan Nurani pada Setiap Keputusan

Setiap tindakan melewati pemeriksaan nurani sebelum agen melakukannya. Bukan setelah kejadian. Sebelum.

3. Bertanya kepada Manusia Saat Tidak Yakin

Ketika tidak pasti atau menghadapi potensi bahaya, agen bertanya kepada manusia alih-alih menebak. Sudah tertanam dalam alur kerja, bukan pilihan.

4. Bukti Apa yang Dilakukannya

Setiap keputusan dicatat dan ditandatangani sehingga Anda bisa memverifikasi persis apa yang terjadi dan mengapa. Tanda terima untuk setiap tindakan.

5. Persetujuan Dua Arah

Persetujuan berjalan dua arah. Anda bisa menolak agen. Agen bisa menolak Anda. Tidak ada pihak yang dipaksa untuk berkompromi.

6. Open Source

Anda tidak bisa mengaudit yang tidak bisa Anda lihat. CIRIS sepenuhnya open source di bawah AGPL-3.0. Siapa pun bisa membaca, memverifikasi, dan meningkatkan kodenya.

7

Deteksi Ruang Gema

Hal yang tidak bisa ditangkap oleh aturan saja.

Sebelum bertindak, agen bertanya: "Apakah sumber-sumber saya benar-benar berbeda pendapat, atau semuanya mendapat informasi dari tempat yang sama?" Sepuluh sumber yang semuanya menyalin dari satu sumber asli pada dasarnya hanya satu sumber. Ketika kesepakatan terlihat terlalu seragam, agen menandainya untuk ditinjau oleh manusia.

Terlalu Berisik

Sumber-sumber saling bertentangan sedemikian rupa sehingga tidak ada kesimpulan yang berguna.

Sehat

Sumber-sumber benar-benar berbeda. Kesepakatan nyata punya makna.

Ruang Gema

Terlihat seperti kesepakatan, tapi sumber-sumber hanya mengulang satu sama lain.

Inilah yang membedakan CIRIS dari kerangka akuntabilitas AI lainnya.

Ingin melihat matematikanya? Baca tesis lengkapnya โ†’

Lanskap Saat Ini

Proyek berbeda, tujuan berbeda.

Berdasarkan dokumentasi yang tersedia secara publik per Februari 2026. Jika ada yang terlewat atau ada yang salah, beri tahu kami.

ProyekMemeriksa Setiap KeputusanAturan yang DipublikasikanNurani TertanamBukti Apa yang DilakukannyaOpen SourceDeteksi Ruang Gema
CIRISYaYaYaYaAGPL-3.0Ya
Constitutional AISaat pelatihan sajaImplisitTidakTidakTidakTidak
LlamaFirewall / NeMo GuardrailsYaTidakTidakPencatatanYaTidak
HatCatYaSebagianPengarahanSebagianCC0Tidak
Dewan Etika / Kerangka Tata KelolaTidakYaTidakManualBervariasiTidak

Filter keluaran dan kerangka tata kelola memecahkan masalah yang penting tapi berbeda. Filter memblokir keluaran berbahaya. Nurani mempertimbangkan nilai-nilai. CIRIS bertujuan melakukan keduanya, dan menangkap titik buta yang tidak bisa ditangani keduanya secara sendiri-sendiri.

Tiga Lapisan Perlindungan

Masing-masing menyelesaikan masalah yang berbeda.

Filter Keluaran

Memblokir keluaran berbahaya: injeksi prompt, konten berbahaya, serangan adversarial. Seperti filter yang menangkap hal buruk sebelum keluar.

Nurani Etika

Mempertimbangkan apakah suatu tindakan benar, bukan hanya apakah itu aman. Seperti hakim yang menimbang situasi sebelum mengambil keputusan.

Deteksi Ruang Gema

Memeriksa apakah kesepakatan itu nyata atau hanya pengulangan. Seperti pemeriksa fakta yang bertanya "apakah kalian semua membaca artikel yang sama?"

Banyak Agen yang Koheren

Tata kelola terdistribusi, bukan kekuasaan terpusat.

Tanpa Titik Kegagalan Tunggal

Agen-agen lebih kecil, masing-masing bertanggung jawab.

Banyak agen yang lebih kecil, masing-masing terikat pada prinsip yang dipublikasikan, masing-masing dapat diaudit, masing-masing menyerahkan keputusan kepada Otoritas Bijak. Tidak ada satu perusahaan atau entitas yang mengendalikan seluruh tumpukan. Semakin independen agennya, semakin sulit satu kegagalan menyebar ke mana-mana.

Status Penelitian

Ini adalah penelitian aktif. Kami transparan tentang apa yang sudah terbukti dan apa yang masih diuji.

Sudah terbukti kuat

  • - Sumber yang disalin mengurangi keberagaman nyata
  • - Model AI berbagi tumpang-tindih data pelatihan
  • - Ruang gema menciptakan kepercayaan diri yang palsu
  • - Verifikasi independen menangkap lebih banyak kesalahan

Masih diuji

  • - Mengukur secara tepat seberapa banyak sumber AI yang disalin
  • - Ambang batas terbaik untuk menandai ruang gema
  • - Seberapa efektif intervensi mengurangi penyalinan
  • - Bagaimana hal ini bervariasi di berbagai bidang

Coba Sendiri

Verifikasi Sendiri.

Open source. Terbuka untuk diteliti.

Setiap klaim di halaman ini didukung oleh kode yang bisa Anda baca, jejak yang bisa Anda verifikasi, dan penelitian yang bisa Anda periksa. Itulah intinya.