Первый контактУстановкаКогерентный храповикФедерацияСравнитьИсследованияСоглашениеGitHub
Эта страница переведена машиной. Если что-то читается неправильно, откройте задачу — репозиторий публичный не случайно. Сообщить о проблеме с переводом

Риск в нашем собственном дизайне

Где краудсорсинговая безопасность может сбиться с пути.

Краудсорсинговая система безопасности может превратиться в нечто иное, если не быть осторожными. Те же механизмы, что выявляют реальные нарушения, могут стать инструментом навязывания предпочтений. Мы видим этот риск в архитектуре, которую строим. Назвать его — первый шаг к тому, чтобы ему противостоять.

Сбой, которого мы опасаемся

Если люди голосуют по каждому конкретному случаю («нарушил ли этот ответ правило?»), предвзятость проникает в каждую интерпретацию. Одно и то же поведение оценивается по-разному в зависимости от того, кто голосует сегодня. Даже при добрых намерениях процесс постепенно смещается к навязыванию предпочтений большинства вместо того, чтобы выявлять реальный вред.

Вот в чём сбой. Дисциплина, которой мы себя обязуем, призвана сделать это смещение заметным и дорогостоящим, когда оно происходит.

Правила — через краудсорсинг. Вердикты — машиной.

Люди предлагают правила и голосуют за них: публичные, датированные, подписанные, отменяемые. Детерминированная проверка применяет эти правила к конкретным случаям. Один ответ + одно правило = один и тот же вердикт каждый раз. Спор перемещается выше по цепочке — к тому, должно ли правило существовать, а не к тому, подпадает ли под него конкретный случай сегодня.

Что это значит на практике

Правила проходят проверку на операциональность языка до того, как их можно поставить на голосование. Правило должно быть проверяемым без суждения — иначе оно ещё не готово. Каждое правило имеет дату, подпись и привязку к версии. Вердикт по любому конкретному ответу выносится детерминированно.

Если вердикт оказывается ошибочным, апелляция проходит через Пересмотр новой группой проверяющих (первоначальные судьи отстраняются), а не возвращается к той же аудитории, которая вынесла вердикт. Именно это структурное разделение является несущей конструкцией.

Где это всё равно может пойти не так

Ничего из этого не происходит автоматически. Дисциплина держится только в том случае, если язык правил остаётся операциональным, то есть о вещах, которые может проверить машина, а не о чувствах. Как только правило скользит от «использует неверное слово для терапии» к «звучит неуважительно», человеческая интерпретация возвращается через чёрный ход и смещение начинается. Архитектура называет каждый механизм, который мы можем придумать для противодействия этому; работа по удержанию линии — операциональная, а не архитектурная.

Краудсорсинговые примитивы, пути апелляций и формат правил, применимых машиной, описаны в спецификации CIRISNodeCore. 29-языковые батареи тестов по психическому здоровью — первая ячейка, где этот цикл работает.