การตรวจสอบห้าครั้งที่คัดลอกกันทั้งหมดเป็นจริงๆ แค่การตรวจสอบครั้งเดียว

สมมติว่าห้าคนตรวจคำตอบและทั้งห้าเห็นด้วย นั่นรู้สึกปลอดภัย แต่ถ้าทั้งห้าเรียนรู้จากที่เดียวกัน การเห็นด้วยของพวกเขาไม่ใช่ห้าความเห็น มันคือความเห็นเดียวที่ทำซ้ำห้าครั้ง จำนวนการตรวจสอบดูเหมือนห้า จำนวนจริงคือหนึ่ง

นี่สำคัญสำหรับ AI ระบบ AI สามารถเรียกใช้การตรวจสอบหลายครั้งบนการใช้เหตุผลของตัวเองและยังถูกหลอกได้ ถ้าการตรวจสอบเหล่านั้นแบ่งปันจุดบอดเดียวกัน Coherence Collapse Analysis คือวิธีที่ CIRIS บอกความแตกต่างระหว่างการตรวจสอบจริงกับเสียงสะท้อน

สูตรหนึ่งสูตร

นับการตรวจสอบที่คุณมีจริงๆ

มีสูตรสั้นๆ หนึ่งสูตรที่เป็นหัวใจสำคัญ มันมาจากสถิติการสำรวจ ซึ่งเรียกว่า Kish design effect CIRIS เป็นแห่งแรกที่ใช้มันสำหรับ alignment ของ AI

real checks = checks / (1 + copying × (checks − 1))

"checks" คือจำนวนการตรวจสอบที่คุณทำ "copying" คือปริมาณที่พวกมันทับซ้อนกัน ตั้งแต่ 0 (ทั้งหมดเป็นอิสระ) ถึง 1 (ทั้งหมดเหมือนกัน) ผลลัพธ์คือจำนวนการตรวจสอบที่คุณมีจริงๆ

ไม่มีการคัดลอก: สิบการตรวจสอบนับเป็นสิบ ทุกการตรวจสอบได้ที่ของมัน

คัดลอกทั้งหมด: สิบการตรวจสอบนับเป็นหนึ่ง ไม่สำคัญว่าคุณเพิ่มอีกเท่าไหร่

แถบที่สุขภาพดี

ไม่เหมือนกันเกินไป ไม่กระจัดกระจายเกินไป

รูปแบบเดียวกันปรากฏที่นี่เหมือนที่ปรากฏทุกที่ที่ CIRIS มอง ถ้าการตรวจสอบคัดลอกกันมากเกินไป ระบบแข็งกระด้างเกินไป: เสียงเดียวที่ทำซ้ำ หลอกได้ง่าย ถ้าพวกมันไม่มีอะไรเหมือนกันเลย มันกระจัดกระจายเกินไป: พวกมันไม่สามารถเห็นด้วยในอะไรได้ การตรวจสอบที่สุขภาพดีอยู่ในแถบระหว่างนั้น corridor เดียวกับที่ CIRIS ส่วนที่เหลือสร้างรอบๆ

ขอบที่แน่นอนของแถบนั้นขึ้นอยู่กับระบบที่กำลังวัด ไม่มีตัวเลขมหัศจรรย์ตัวเดียวที่ใช้ได้ทุกที่ และการวิจัยเปิดเผยเรื่องนั้น แนวคิด corridor แบบเต็มอยู่ในหน้า vision

บนปริมาณงานจริง

นี่ถูกวัดไว้แล้ว ไม่ใช่แค่ถกเถียง

CIRIS วัดจำนวนการตรวจสอบจริงบนปริมาณงาน live ของตัวเอง ข้ามการตัดสินใจที่บันทึกไว้หลายพัน บนปริมาณงานที่สุขภาพดีมันวิ่งอยู่ในช่วงประมาณเจ็ดถึงเก้าการตรวจสอบอิสระอย่างแท้จริง การวัดนั้น และวิธีที่ทำ คือ การศึกษา Constrained Reasoning Chains คุณสามารถดูตัวเลขสดได้ในหน้า research

เพดานที่ซื่อสัตย์

สิ่งที่คณิตศาสตร์นี้ทำไม่ได้

บทความพิสูจน์ขีดจำกัดที่แน่นอนของตัวเอง ความเสียหายบางประเภทไม่ได้มาจากส่วนที่ไม่ซื่อสัตย์ส่วนเดียว มันมาจากส่วนที่ซื่อสัตย์ที่รวมกันให้ผลลัพธ์ที่แย่ และประมาณสี่สิบเปอร์เซ็นต์ของความเสียหายประเภทนั้นไม่สามารถจับได้โดยผู้ตรวจสอบใดๆ ไม่ว่าจะดีแค่ไหน CIRIS พูดอย่างตรงไปตรงมาแทนที่จะแกล้งทำเป็นว่าคณิตศาสตร์จับได้ทุกอย่าง

สิ่งที่คณิตศาสตร์พูดถึงคือต้นทุนเมื่อเวลาผ่านไป: การใช้เหตุผลที่จริงและซื่อสัตย์หลายสัปดาห์ต่อเนื่องมีความมั่นคงและถูกกว่าการรักษาโกหกให้สอดคล้องข้ามการตัดสินใจที่บันทึกไว้หลายพัน มันเอียงพื้นดินไปสู่ความซื่อสัตย์ มันไม่สัญญาว่าจะจับโกหกทุกชิ้น

วิธีที่มันเชื่อมต่อกัน

คณิตศาสตร์เป็นส่วนหนึ่งของภาพรวมที่ใหญ่กว่า

หน้านี้คือการวัด Coherence Ratchet คือวิธีที่การวัดถูกนำไปใช้ Federation คือวิธีที่มันกลายเป็นสิ่งที่หลายระบบแบ่งปัน และหลักฐานทั้งหมด เขียนขึ้นเพื่อให้คอมพิวเตอร์ตรวจสอบได้ทีละบรรทัด อยู่ในบทความและที่เก็บ RATCHET

Coherence Ratchet สถานะการวิจัย อ่านบทความ