이 페이지는 기계 번역되었습니다. 내용이 어색하게 느껴지면 이슈를 열어 주세요. 저장소는 이유가 있어 공개되어 있습니다. 번역 문제 신고

로비로 돌아가기

Coherence Collapse Analysis

추가 검증이 도움이 되지 않는 시점은 언제인가?

거짓말을 잡기 위해 검증을 쌓는 것은 검증이 진정으로 독립적일 때만 효과가 있습니다. 서로 몰래 복사한다면, 더 추가해도 아무 소용이 없습니다. Coherence Collapse Analysis는 그 차이를 측정하는 간단한 방법입니다. 모든 증명이 포함된 전체 버전은 논문에 있습니다.

수학 페이지

증명 소프트웨어로 검증됨

서로를 모두 복사하는 다섯 가지 검증은 실제로 하나의 검증입니다.

다섯 사람이 답을 확인하고 모두 동의한다고 가정해 보겠습니다. 안전하게 느껴집니다. 하지만 다섯 모두 같은 곳에서 배웠다면, 그들의 동의는 다섯 가지 의견이 아닙니다. 다섯 번 반복된 하나의 의견입니다. 검증의 수는 다섯처럼 보이지만, 실제 수는 하나입니다.

이것은 AI에게도 중요합니다. AI 시스템은 자체 추론에 대해 많은 검증을 실행할 수 있으면서도 속을 수 있습니다. 그 검증들이 같은 맹점을 공유한다면 말이죠. Coherence Collapse Analysis는 CIRIS가 실제 검증과 반향을 구별하는 방법입니다.

실제로 가지고 있는 검증의 수 세기.

핵심에는 하나의 간단한 공식이 있습니다. 설문 통계에서 나온 것으로, Kish 디자인 효과라고 불립니다. CIRIS는 이를 AI 정렬에 처음 적용했습니다.

real checks = checks / (1 + copying × (checks − 1))

"Checks"는 실행한 검증의 수입니다. "Copying"은 그것들이 얼마나 겹치는지로, 0(모두 독립)에서 1(모두 동일)까지입니다. 결과는 실제로 가진 검증의 수입니다.

복사 없음: 열 개의 검증은 열 개로 계산됩니다. 모든 검증이 자기 자리를 차지합니다.

완전한 복사: 열 개의 검증은 하나로 계산됩니다. 얼마나 많이 추가해도 차이가 없습니다.

너무 비슷하지도, 너무 흩어지지도 않게.

CIRIS가 들여다보는 모든 곳에서 같은 형태가 나타납니다. 검증들이 서로를 너무 많이 복사하면 시스템은 너무 경직됩니다: 한 목소리가 반복되어 속이기 쉽습니다. 공통점이 전혀 없다면, 너무 흩어집니다: 아무것에도 합의할 수 없습니다. 건강한 검증은 그 사이 구간에 있으며, CIRIS의 나머지 부분이 구축된 코리도와 같습니다.

그 구간의 정확한 경계는 측정되는 시스템에 따라 다릅니다. 모든 곳에서 효과가 있는 단 하나의 마법 같은 숫자는 없으며, 연구는 그것에 대해 솔직합니다. 코리도 아이디어 전체는 비전 페이지에 있습니다.

이것은 논증만 한 것이 아니라 측정했습니다.

CIRIS는 자체 실시간 에이전트 트래픽에서 실제 검증 수를 측정했으며, 수천 개의 기록된 결정에 걸쳐 진행되었습니다. 건강한 트래픽에서 약 7에서 9개의 진정으로 독립적인 검증 범위를 유지했습니다. 그 측정과 수행 방법은 Constrained Reasoning Chains 연구입니다. 연구 페이지에서 실시간 수를 볼 수 있습니다.

이 수학이 할 수 없는 것.

논문은 스스로에 대한 엄격한 한계를 증명합니다. 어떤 종류의 피해는 하나의 불정직한 부분에서 오지 않습니다. 서로 더해져서 나쁜 결과를 만드는 정직한 부분들에서 옵니다. 그 종류의 피해 중 약 40%는 어떤 검증기로도 잡을 수 없습니다. CIRIS는 수학이 모든 것을 잡는 척하는 대신 이를 솔직하게 말합니다.

수학이 말하는 것은 시간에 걸친 비용에 관한 것입니다: 몇 주 동안 실제적이고 정직한 추론을 실행하는 것은 수천 개의 기록된 결정에 걸쳐 거짓말을 일관되게 유지하는 것보다 안정적이고 저렴합니다. 그것은 정직함을 향해 땅을 기울입니다. 모든 거짓말을 잡겠다고 약속하지는 않습니다.

수학은 더 큰 전체의 한 부분입니다.

이 페이지는 측정입니다. Coherence Ratchet은 측정을 실제로 활용하는 방법입니다. 페더레이션은 그것이 많은 시스템이 공유하는 것이 되는 방법입니다. 그리고 컴퓨터가 한 줄 한 줄 검사할 수 있도록 작성된 전체 증명은 논문과 RATCHET 저장소에 있습니다.

CIRISsafe by structure · open by principle · kind by design