Пять проверок, которые копируют друг друга, — это на самом деле одна проверка.

Допустим, пять человек проверяют ответ и все пятеро соглашаются. Кажется надёжно. Но если все пятеро узнали об этом из одного источника, их согласие — не пять мнений. Это одно мнение, повторённое пять раз. Количество проверок выглядит как пять. Реальное число — одна.

Это важно для AI. AI-система может многократно проверять собственные рассуждения и всё равно ошибиться, если эти проверки разделяют одно слепое пятно. Coherence Collapse Analysis — это то, как CIRIS отличает настоящие проверки от эха.

Единственная формула

Считаем проверки, которые у нас есть на самом деле.

В основе лежит одна короткая формула. Она пришла из опросной статистики, где называется дизайн-эффектом Киша. CIRIS первым применил её для выравнивания AI.

real checks = checks / (1 + copying × (checks − 1))

«Checks» — сколько проверок вы провели. «Copying» — насколько они пересекаются, от 0 (полная независимость) до 1 (полное совпадение). Результат — сколько проверок у вас есть на самом деле.

Нет копирования: десять проверок считаются как десять. Каждая проверка зарабатывает своё место.

Полное копирование: десять проверок считаются как одна. Не важно, сколько их добавлять.

Здоровая полоса

Не слишком одинаково, не слишком разрозненно.

Та же форма, что встречается везде, куда смотрит CIRIS. Если проверки копируют друг друга слишком сильно, система слишком жёсткая: один голос, повторённый снова и снова, легко обмануть. Если у них совсем ничего общего, система слишком разрозненная: они не могут ни на чём сойтись. Здоровая проверка живёт в полосе между ними — в том же коридоре, вокруг которого построен весь CIRIS.

Точные края этой полосы зависят от измеряемой системы. Единого магического числа, работающего везде, нет, и исследование честно это признаёт. Идея коридора в полном изложении — на странице vision.

На реальном трафике

Это было измерено, а не только выведено теоретически.

CIRIS измерил реальное число проверок на своём живом трафике агентов, на тысячах записанных решений. На здоровом трафике он работал в диапазоне примерно от семи до девяти по-настоящему независимых проверок. Это измерение и методология описаны в исследовании Constrained Reasoning Chains. Живые числа можно наблюдать на странице исследований.

Честный потолок

Что эта математика не может сделать.

Статья доказывает жёсткое ограничение самой формулы. Некоторые виды вреда возникают не от одной нечестной части. Они возникают от честных частей, которые в сумме дают плохой результат, и примерно сорок процентов такого вреда не может быть выявлено никаким проверяющим, как бы хорош он ни был. CIRIS говорит об этом прямо, вместо того чтобы делать вид, что математика улавливает всё.

То, что математика говорит, касается стоимости во времени: вести реальные честные рассуждения неделями подряд устойчивее и дешевле, чем поддерживать ложь последовательной на тысячах записанных решений. Это наклоняет почву в сторону честности. Но это не обещание поймать каждую ложь.

Как всё складывается

Математика — одна часть большего целого.

Эта страница — об измерении. Coherence Ratchet — о том, как измерение применяется на практике. Федерация — о том, как это становится тем, чем пользуются многие системы. А полные доказательства, написанные так, чтобы компьютер мог проверить каждую строку, — в статье и репозитории RATCHET.

Coherence Ratchet Статус исследований Читать статью