Halaman ini diterjemahkan oleh mesin. Jika ada yang terasa tidak tepat, silakan buka laporan masalah — reponya publik untuk alasan yang baik. Laporkan masalah terjemahan

kembali ke lobi

Coherence Collapse Analysis

Kapan pemeriksaan tambahan berhenti membantu?

Menumpuk pemeriksaan untuk menangkap kebohongan hanya berhasil jika pemeriksaan benar-benar independen. Jika pemeriksaan diam-diam meniru satu sama lain, menambahkan lebih banyak tidak ada gunanya. Coherence Collapse Analysis adalah potongan matematika sederhana yang mengukur perbedaan tersebut. Versi lengkapnya, dengan setiap bukti, ada dalam makalah.

Halaman matematika

Diperiksa oleh perangkat lunak bukti

Lima pemeriksaan yang semuanya meniru satu sama lain sebenarnya hanya satu pemeriksaan.

Misalkan lima orang memeriksa sebuah jawaban dan kelima orang itu setuju. Itu terasa aman. Tetapi jika kelimanya belajar dari tempat yang sama, persetujuan mereka bukan lima pendapat. Itu adalah satu pendapat yang diulang lima kali. Jumlah pemeriksaan terlihat seperti lima. Jumlah nyatanya adalah satu.

Ini penting untuk AI. Sebuah sistem AI dapat menjalankan banyak pemeriksaan pada penalarannya sendiri dan masih bisa tertipu, jika pemeriksaan tersebut berbagi titik buta yang sama. Coherence Collapse Analysis adalah cara CIRIS membedakan antara pemeriksaan nyata dan gema.

Menghitung pemeriksaan yang benar-benar Anda miliki.

Ada satu rumus singkat di inti semuanya. Rumus ini berasal dari statistik survei, di mana disebut efek desain Kish. CIRIS adalah yang pertama menggunakannya untuk keselarasan AI.

real checks = checks / (1 + copying × (checks − 1))

"Checks" adalah berapa banyak pemeriksaan yang Anda lakukan. "Copying" adalah seberapa banyak pemeriksaan tersebut tumpang tindih, dari 0 (semua independen) hingga 1 (semua sama). Hasilnya adalah berapa banyak pemeriksaan yang benar-benar Anda miliki.

Tanpa penyalinan: sepuluh pemeriksaan dihitung sebagai sepuluh. Setiap pemeriksaan mendapat tempatnya.

Penyalinan total: sepuluh pemeriksaan dihitung sebagai satu. Tidak masalah berapa banyak yang Anda tambahkan.

Tidak terlalu seragam, tidak terlalu berserakan.

Bentuk yang sama muncul di sini seperti yang muncul di mana pun CIRIS melihat. Jika pemeriksaan terlalu banyak meniru satu sama lain, sistemnya terlalu kaku: satu suara yang diulang, mudah ditipu. Jika pemeriksaan tidak memiliki kesamaan sama sekali, sistemnya terlalu berserakan: pemeriksaan tidak bisa sepakat tentang apa pun. Pemeriksaan yang sehat hidup di pita di antara keduanya, koridor yang sama yang dibangun CIRIS di sekelilingnya.

Tepian pita tersebut bergantung pada sistem yang diukur. Tidak ada angka ajaib tunggal yang berlaku di mana pun, dan penelitiannya jujur tentang hal itu. Gagasan koridor, secara lengkap, ada di halaman visi.

Ini diukur, bukan hanya diperdebatkan.

CIRIS mengukur jumlah pemeriksaan nyata pada lalu lintas agen langsungnya sendiri, di seluruh ribuan keputusan yang tercatat. Pada lalu lintas yang sehat, angkanya berkisar sekitar tujuh hingga sembilan pemeriksaan yang benar-benar independen. Pengukuran tersebut, dan bagaimana caranya dilakukan, adalah studi Constrained Reasoning Chains. Anda dapat memantau angka langsung di halaman penelitian.

Apa yang tidak bisa dilakukan matematika ini.

Makalah membuktikan batas keras pada dirinya sendiri. Beberapa jenis kerugian tidak berasal dari satu bagian yang tidak jujur. Kerugian tersebut berasal dari bagian-bagian yang jujur yang bersama-sama menghasilkan hasil yang buruk, dan sekitar empat puluh persen dari jenis kerugian itu tidak dapat ditangkap oleh pemeriksa mana pun, tidak peduli seberapa baik. CIRIS mengatakan hal ini dengan jelas daripada berpura-pura matematika menangkap segalanya.

Yang dikatakan matematika ini adalah tentang biaya dari waktu ke waktu: menjalankan penalaran yang nyata dan jujur selama berminggu-minggu lebih stabil dan lebih murah daripada menjaga konsistensi kebohongan di ribuan keputusan yang tercatat. Ini memiringkan dasar menuju kejujuran. Ini tidak berjanji untuk menangkap setiap kebohongan.

Matematika adalah satu bagian dari keseluruhan yang lebih besar.

Halaman ini adalah pengukurannya. Coherence Ratchet adalah cara pengukuran itu diterapkan. Federasi adalah cara pengukuran itu menjadi sesuatu yang dibagi banyak sistem. Dan bukti-bukti lengkap, ditulis sehingga komputer dapat memeriksanya baris demi baris, ada dalam makalah dan repositori RATCHET.

CIRISsafe by structure · open by principle · kind by design