หน้านี้แปลโดยเครื่อง หากอ่านแล้วไม่ถูกต้อง กรุณาเปิดประเด็น — รีโปเป็นสาธารณะด้วยเหตุผลนั้น รายงานปัญหาการแปล

กลับไปที่ล็อบบี้

Coherence Collapse Analysis

เมื่อไหร่การตรวจสอบเพิ่มเติมจะหยุดช่วย?

การกองตรวจสอบเพื่อจับโกหกได้ผลเฉพาะเมื่อการตรวจสอบเป็นอิสระอย่างแท้จริง ถ้าพวกมันแอบคัดลอกกัน การเพิ่มอีกก็ไม่มีประโยชน์ Coherence Collapse Analysis คือส่วนของคณิตศาสตร์ที่ง่ายที่วัดความแตกต่าง เวอร์ชันเต็มพร้อมหลักฐานทุกชิ้นอยู่ในบทความ

หน้าคณิตศาสตร์

ตรวจสอบโดยซอฟต์แวร์หลักฐาน

การตรวจสอบห้าครั้งที่คัดลอกกันทั้งหมดเป็นจริงๆ แค่การตรวจสอบครั้งเดียว

สมมติว่าห้าคนตรวจคำตอบและทั้งห้าเห็นด้วย นั่นรู้สึกปลอดภัย แต่ถ้าทั้งห้าเรียนรู้จากที่เดียวกัน การเห็นด้วยของพวกเขาไม่ใช่ห้าความเห็น มันคือความเห็นเดียวที่ทำซ้ำห้าครั้ง จำนวนการตรวจสอบดูเหมือนห้า จำนวนจริงคือหนึ่ง

นี่สำคัญสำหรับ AI ระบบ AI สามารถเรียกใช้การตรวจสอบหลายครั้งบนการใช้เหตุผลของตัวเองและยังถูกหลอกได้ ถ้าการตรวจสอบเหล่านั้นแบ่งปันจุดบอดเดียวกัน Coherence Collapse Analysis คือวิธีที่ CIRIS บอกความแตกต่างระหว่างการตรวจสอบจริงกับเสียงสะท้อน

นับการตรวจสอบที่คุณมีจริงๆ

มีสูตรสั้นๆ หนึ่งสูตรที่เป็นหัวใจสำคัญ มันมาจากสถิติการสำรวจ ซึ่งเรียกว่า Kish design effect CIRIS เป็นแห่งแรกที่ใช้มันสำหรับ alignment ของ AI

real checks = checks / (1 + copying × (checks − 1))

"checks" คือจำนวนการตรวจสอบที่คุณทำ "copying" คือปริมาณที่พวกมันทับซ้อนกัน ตั้งแต่ 0 (ทั้งหมดเป็นอิสระ) ถึง 1 (ทั้งหมดเหมือนกัน) ผลลัพธ์คือจำนวนการตรวจสอบที่คุณมีจริงๆ

ไม่มีการคัดลอก: สิบการตรวจสอบนับเป็นสิบ ทุกการตรวจสอบได้ที่ของมัน

คัดลอกทั้งหมด: สิบการตรวจสอบนับเป็นหนึ่ง ไม่สำคัญว่าคุณเพิ่มอีกเท่าไหร่

ไม่เหมือนกันเกินไป ไม่กระจัดกระจายเกินไป

รูปแบบเดียวกันปรากฏที่นี่เหมือนที่ปรากฏทุกที่ที่ CIRIS มอง ถ้าการตรวจสอบคัดลอกกันมากเกินไป ระบบแข็งกระด้างเกินไป: เสียงเดียวที่ทำซ้ำ หลอกได้ง่าย ถ้าพวกมันไม่มีอะไรเหมือนกันเลย มันกระจัดกระจายเกินไป: พวกมันไม่สามารถเห็นด้วยในอะไรได้ การตรวจสอบที่สุขภาพดีอยู่ในแถบระหว่างนั้น corridor เดียวกับที่ CIRIS ส่วนที่เหลือสร้างรอบๆ

ขอบที่แน่นอนของแถบนั้นขึ้นอยู่กับระบบที่กำลังวัด ไม่มีตัวเลขมหัศจรรย์ตัวเดียวที่ใช้ได้ทุกที่ และการวิจัยเปิดเผยเรื่องนั้น แนวคิด corridor แบบเต็มอยู่ในหน้า vision

นี่ถูกวัดไว้แล้ว ไม่ใช่แค่ถกเถียง

CIRIS วัดจำนวนการตรวจสอบจริงบนปริมาณงาน live ของตัวเอง ข้ามการตัดสินใจที่บันทึกไว้หลายพัน บนปริมาณงานที่สุขภาพดีมันวิ่งอยู่ในช่วงประมาณเจ็ดถึงเก้าการตรวจสอบอิสระอย่างแท้จริง การวัดนั้น และวิธีที่ทำ คือ การศึกษา Constrained Reasoning Chains คุณสามารถดูตัวเลขสดได้ในหน้า research

สิ่งที่คณิตศาสตร์นี้ทำไม่ได้

บทความพิสูจน์ขีดจำกัดที่แน่นอนของตัวเอง ความเสียหายบางประเภทไม่ได้มาจากส่วนที่ไม่ซื่อสัตย์ส่วนเดียว มันมาจากส่วนที่ซื่อสัตย์ที่รวมกันให้ผลลัพธ์ที่แย่ และประมาณสี่สิบเปอร์เซ็นต์ของความเสียหายประเภทนั้นไม่สามารถจับได้โดยผู้ตรวจสอบใดๆ ไม่ว่าจะดีแค่ไหน CIRIS พูดอย่างตรงไปตรงมาแทนที่จะแกล้งทำเป็นว่าคณิตศาสตร์จับได้ทุกอย่าง

สิ่งที่คณิตศาสตร์พูดถึงคือต้นทุนเมื่อเวลาผ่านไป: การใช้เหตุผลที่จริงและซื่อสัตย์หลายสัปดาห์ต่อเนื่องมีความมั่นคงและถูกกว่าการรักษาโกหกให้สอดคล้องข้ามการตัดสินใจที่บันทึกไว้หลายพัน มันเอียงพื้นดินไปสู่ความซื่อสัตย์ มันไม่สัญญาว่าจะจับโกหกทุกชิ้น

คณิตศาสตร์เป็นส่วนหนึ่งของภาพรวมที่ใหญ่กว่า

หน้านี้คือการวัด Coherence Ratchet คือวิธีที่การวัดถูกนำไปใช้ Federation คือวิธีที่มันกลายเป็นสิ่งที่หลายระบบแบ่งปัน และหลักฐานทั้งหมด เขียนขึ้นเพื่อให้คอมพิวเตอร์ตรวจสอบได้ทีละบรรทัด อยู่ในบทความและที่เก็บ RATCHET

CIRISsafe by structure · open by principle · kind by design