หน้าคณิตศาสตร์
ตรวจสอบโดยซอฟต์แวร์หลักฐาน
แนวคิด
การตรวจสอบห้าครั้งที่คัดลอกกันทั้งหมดเป็นจริงๆ แค่การตรวจสอบครั้งเดียว
สมมติว่าห้าคนตรวจคำตอบและทั้งห้าเห็นด้วย นั่นรู้สึกปลอดภัย แต่ถ้าทั้งห้าเรียนรู้จากที่เดียวกัน การเห็นด้วยของพวกเขาไม่ใช่ห้าความเห็น มันคือความเห็นเดียวที่ทำซ้ำห้าครั้ง จำนวนการตรวจสอบดูเหมือนห้า จำนวนจริงคือหนึ่ง
นี่สำคัญสำหรับ AI ระบบ AI สามารถเรียกใช้การตรวจสอบหลายครั้งบนการใช้เหตุผลของตัวเองและยังถูกหลอกได้ ถ้าการตรวจสอบเหล่านั้นแบ่งปันจุดบอดเดียวกัน Coherence Collapse Analysis คือวิธีที่ CIRIS บอกความแตกต่างระหว่างการตรวจสอบจริงกับเสียงสะท้อน
สูตรหนึ่งสูตร
นับการตรวจสอบที่คุณมีจริงๆ
มีสูตรสั้นๆ หนึ่งสูตรที่เป็นหัวใจสำคัญ มันมาจากสถิติการสำรวจ ซึ่งเรียกว่า Kish design effect CIRIS เป็นแห่งแรกที่ใช้มันสำหรับ alignment ของ AI
real checks = checks / (1 + copying × (checks − 1))
"checks" คือจำนวนการตรวจสอบที่คุณทำ "copying" คือปริมาณที่พวกมันทับซ้อนกัน ตั้งแต่ 0 (ทั้งหมดเป็นอิสระ) ถึง 1 (ทั้งหมดเหมือนกัน) ผลลัพธ์คือจำนวนการตรวจสอบที่คุณมีจริงๆ
ไม่มีการคัดลอก: สิบการตรวจสอบนับเป็นสิบ ทุกการตรวจสอบได้ที่ของมัน
คัดลอกทั้งหมด: สิบการตรวจสอบนับเป็นหนึ่ง ไม่สำคัญว่าคุณเพิ่มอีกเท่าไหร่
แถบที่สุขภาพดี
ไม่เหมือนกันเกินไป ไม่กระจัดกระจายเกินไป
รูปแบบเดียวกันปรากฏที่นี่เหมือนที่ปรากฏทุกที่ที่ CIRIS มอง ถ้าการตรวจสอบคัดลอกกันมากเกินไป ระบบแข็งกระด้างเกินไป: เสียงเดียวที่ทำซ้ำ หลอกได้ง่าย ถ้าพวกมันไม่มีอะไรเหมือนกันเลย มันกระจัดกระจายเกินไป: พวกมันไม่สามารถเห็นด้วยในอะไรได้ การตรวจสอบที่สุขภาพดีอยู่ในแถบระหว่างนั้น corridor เดียวกับที่ CIRIS ส่วนที่เหลือสร้างรอบๆ
ขอบที่แน่นอนของแถบนั้นขึ้นอยู่กับระบบที่กำลังวัด ไม่มีตัวเลขมหัศจรรย์ตัวเดียวที่ใช้ได้ทุกที่ และการวิจัยเปิดเผยเรื่องนั้น แนวคิด corridor แบบเต็มอยู่ในหน้า vision
บนปริมาณงานจริง
นี่ถูกวัดไว้แล้ว ไม่ใช่แค่ถกเถียง
CIRIS วัดจำนวนการตรวจสอบจริงบนปริมาณงาน live ของตัวเอง ข้ามการตัดสินใจที่บันทึกไว้หลายพัน บนปริมาณงานที่สุขภาพดีมันวิ่งอยู่ในช่วงประมาณเจ็ดถึงเก้าการตรวจสอบอิสระอย่างแท้จริง การวัดนั้น และวิธีที่ทำ คือ การศึกษา Constrained Reasoning Chains คุณสามารถดูตัวเลขสดได้ในหน้า research
เพดานที่ซื่อสัตย์
สิ่งที่คณิตศาสตร์นี้ทำไม่ได้
บทความพิสูจน์ขีดจำกัดที่แน่นอนของตัวเอง ความเสียหายบางประเภทไม่ได้มาจากส่วนที่ไม่ซื่อสัตย์ส่วนเดียว มันมาจากส่วนที่ซื่อสัตย์ที่รวมกันให้ผลลัพธ์ที่แย่ และประมาณสี่สิบเปอร์เซ็นต์ของความเสียหายประเภทนั้นไม่สามารถจับได้โดยผู้ตรวจสอบใดๆ ไม่ว่าจะดีแค่ไหน CIRIS พูดอย่างตรงไปตรงมาแทนที่จะแกล้งทำเป็นว่าคณิตศาสตร์จับได้ทุกอย่าง
สิ่งที่คณิตศาสตร์พูดถึงคือต้นทุนเมื่อเวลาผ่านไป: การใช้เหตุผลที่จริงและซื่อสัตย์หลายสัปดาห์ต่อเนื่องมีความมั่นคงและถูกกว่าการรักษาโกหกให้สอดคล้องข้ามการตัดสินใจที่บันทึกไว้หลายพัน มันเอียงพื้นดินไปสู่ความซื่อสัตย์ มันไม่สัญญาว่าจะจับโกหกทุกชิ้น
วิธีที่มันเชื่อมต่อกัน
คณิตศาสตร์เป็นส่วนหนึ่งของภาพรวมที่ใหญ่กว่า
หน้านี้คือการวัด Coherence Ratchet คือวิธีที่การวัดถูกนำไปใช้ Federation คือวิธีที่มันกลายเป็นสิ่งที่หลายระบบแบ่งปัน และหลักฐานทั้งหมด เขียนขึ้นเพื่อให้คอมพิวเตอร์ตรวจสอบได้ทีละบรรทัด อยู่ในบทความและที่เก็บ RATCHET