П'ять перевірок, що всі копіюють одна одну, — це насправді одна перевірка.

Уявіть, що п'ять людей перевіряють відповідь і всі п'ять погоджуються. Це відчувається безпечно. Але якщо всі п'ятеро дізналися це з одного й того самого місця, їхня згода — не п'ять думок. Це одна думка, повторена п'ять разів. Кількість перевірок виглядає як п'ять. Реальна кількість — одна.

Це важливо для AI. Система AI може виконувати багато перевірок власного міркування і все одно помилитись, якщо ці перевірки мають однакову сліпу пляму. Coherence Collapse Analysis — це те, як CIRIS відрізняє справжні перевірки від відлунь.

Єдина формула

Підраховуємо, скільки перевірок у вас є насправді.

В основі всього лежить одна коротка формула. Вона походить із опитувальної статистики, де її називають дизайн-ефектом Кіша. CIRIS першою застосувала її для вирівнювання AI.

real checks = checks / (1 + copying × (checks − 1))

«Checks» — кількість виконаних перевірок. «Copying» — ступінь їх збігу, від 0 (всі незалежні) до 1 (всі однакові). Результат — скільки перевірок у вас є насправді.

Без копіювання: десять перевірок рахуються як десять. Кожна перевірка виправдовує своє місце.

Повне копіювання: десять перевірок рахуються як одна. Не важливо, скільки ви додасте.

Здорова смуга

Не надто однакові, не надто розрізнені.

Та сама форма з'являється тут, що й скрізь, куди дивиться CIRIS. Якщо перевірки надто сильно копіюють одна одну, система занадто жорстка: один голос, повторений знову і знову, легко обдурити. Якщо у них немає нічого спільного, це занадто розрізнено: вони не можуть ні в чому домовитись. Здорова перевірка живе в смузі між ними — це той самий коридор, навколо якого побудований весь CIRIS.

Точні межі цієї смуги залежать від вимірюваної системи. Не існує єдиного магічного числа, що працює скрізь, і дослідження чесно про це говорить. Ідея коридору в повному обсязі — на сторінці про бачення.

На реальному трафіку

Це було виміряно, а не просто задекларовано.

CIRIS виміряла кількість реальних перевірок на власному живому трафіку агента, охоплюючи тисячі записаних рішень. На здоровому трафіку вона перебувала в діапазоні приблизно семи-дев'яти справді незалежних перевірок. Це вимірювання і те, як воно здійснювалось, є предметом дослідження Constrained Reasoning Chains. Живі числа можна відстежувати на дослідницькій сторінці.

Чесна стеля

Чого ця математика не може.

Стаття доводить жорстке обмеження на саму себе. Деякі види шкоди виникають не від однієї нечесної частини. Вони виникають від чесних частин, що в сумі дають поганий результат, і приблизно сорок відсотків такого роду шкоди жодна перевірка не може виявити, наскільки б хорошою вона не була. CIRIS говорить про це прямо, замість того щоб удавати, що математика вловлює все.

Що математика справді говорить — це про витрати з часом: вести реальні чесні міркування тижнями поспіль стабільніше і дешевше, ніж підтримувати послідовність брехні в тисячах записаних рішень. Вона нахиляє ґрунт у бік чесності. Але не обіцяє виловити кожну окрему брехню.

Як це все поєднується

Математика — це одна частина більшого цілого.

Ця сторінка — вимірювання. Coherence Ratchet — це те, як вимірювання застосовується на практиці. Федерація — це те, як воно стає спільним для багатьох систем. А повні доведення, написані так, щоб комп'ютер міг перевірити їх рядок за рядком, містяться в статті та репозиторії RATCHET.

Coherence Ratchet Стан досліджень Читати статтю