Trang toán học
Được kiểm tra bởi phần mềm chứng minh
Ý tưởng
Năm lần kiểm tra đều sao chép nhau thực ra chỉ là một lần kiểm tra.
Giả sử năm người kiểm tra một câu trả lời và cả năm đều đồng ý. Điều đó có vẻ an toàn. Nhưng nếu cả năm người đều học từ cùng một nơi, sự đồng ý của họ không phải là năm ý kiến. Đó là một ý kiến được lặp lại năm lần. Số lần kiểm tra trông như là năm. Con số thực là một.
Điều này quan trọng với AI. Một hệ thống AI có thể chạy nhiều lần kiểm tra trên suy luận của chính nó mà vẫn bị đánh lừa, nếu những lần kiểm tra đó chia sẻ cùng một điểm mù. Coherence Collapse Analysis là cách CIRIS phân biệt giữa các lần kiểm tra thực và tiếng vang.
Một công thức duy nhất
Đếm số lần kiểm tra bạn thực sự có.
Có một công thức ngắn gọn duy nhất ở trung tâm của nó. Nó đến từ thống kê khảo sát, nơi nó được gọi là Kish design effect. CIRIS là đơn vị đầu tiên sử dụng nó cho sự đồng thuận AI.
real checks = checks / (1 + copying × (checks − 1))
"Checks" là số lần kiểm tra bạn đã chạy. "Copying" là mức độ chúng trùng lặp, từ 0 (tất cả độc lập) đến 1 (tất cả giống nhau). Kết quả là số lần kiểm tra bạn thực sự có.
Không sao chép: mười lần kiểm tra tính là mười. Mỗi lần kiểm tra đều có vị trí xứng đáng.
Sao chép hoàn toàn: mười lần kiểm tra tính là một. Không quan trọng bạn thêm bao nhiêu.
Dải khỏe mạnh
Không quá giống nhau, không quá phân tán.
Cùng một hình dạng xuất hiện ở đây như xuất hiện ở khắp nơi CIRIS nhìn vào. Nếu các lần kiểm tra sao chép nhau quá nhiều, hệ thống quá cứng nhắc: một giọng nói được lặp lại, dễ bị đánh lừa. Nếu chúng không có điểm chung nào, quá phân tán: chúng không thể đồng ý về bất cứ điều gì. Kiểm tra lành mạnh sống trong dải ở giữa, cùng một hành lang mà phần còn lại của CIRIS được xây dựng xung quanh.
Các cạnh chính xác của dải đó phụ thuộc vào hệ thống đang được đo. Không có một con số kỳ diệu nào duy nhất hoạt động ở khắp nơi, và nghiên cứu thành thật về điều đó. Ý tưởng hành lang, đầy đủ, nằm trên trang tầm nhìn.
Trên lưu lượng thực
Điều này đã được đo lường, không chỉ được lý luận.
CIRIS đã đo số lần kiểm tra thực trên lưu lượng tác nhân trực tiếp của chính nó, qua hàng nghìn quyết định được ghi lại. Trên lưu lượng khỏe mạnh, nó đã chạy trong khoảng bảy đến chín lần kiểm tra thực sự độc lập. Phép đo đó, và cách thực hiện, là nghiên cứu Constrained Reasoning Chains. Bạn có thể xem các con số trực tiếp trên trang nghiên cứu.
Giới hạn trần trung thực
Những gì toán học này không thể làm.
Bài báo chứng minh một giới hạn cứng trên chính nó. Một số loại tổn hại không đến từ một bộ phận không trung thực. Chúng đến từ các bộ phận trung thực cộng lại thành kết quả xấu, và khoảng bốn mươi phần trăm loại tổn hại đó không thể bị bắt bởi bất kỳ bộ kiểm tra nào, dù tốt đến đâu. CIRIS nói rõ điều đó thay vì giả vờ toán học bắt được mọi thứ.
Những gì toán học nói là về chi phí theo thời gian: chạy suy luận thực, trung thực trong nhiều tuần thì ổn định và rẻ hơn so với việc giữ một lời nói dối nhất quán qua hàng nghìn quyết định được ghi lại. Nó nghiêng mặt đất về phía trung thực. Nó không hứa hẹn bắt được từng lời nói dối riêng lẻ.
Cách tất cả kết hợp lại
Toán học là một phần của một tổng thể lớn hơn.
Trang này là phép đo. Coherence Ratchet là cách phép đo được đưa vào sử dụng. Federation là cách nó trở thành điều mà nhiều hệ thống cùng chia sẻ. Và các chứng minh đầy đủ, được viết để máy tính có thể kiểm tra từng dòng, nằm trong bài báo và kho lưu trữ RATCHET.