Um risco no nosso próprio design
Como a segurança colaborativa pode desviar.
Um sistema de segurança colaborativa pode se transformar em outra coisa se não tomarmos cuidado. A mesma estrutura que captura falhas reais pode se tornar a estrutura que impõe preferências. Vemos esse risco na arquitetura que estamos construindo. Nomeá-lo é o primeiro passo para resistir a ele.
O modo de falha que nos preocupa
Se as pessoas colaboram com veredictos por caso específico ("essa resposta específica quebrou a regra?"), o viés entra em cada interpretação. O mesmo comportamento é avaliado de forma diferente dependendo de quem está votando hoje. Mesmo com boas intenções, o ciclo escorrega para impor as preferências da maioria em vez de capturar danos reais.
Esse é o modo de falha. A disciplina que assumimos é feita para tornar esse desvio visível e caro quando acontece.
As regras são colaborativas. Os veredictos são automáticos.
Pessoas propõem e votam em regras: públicas, datadas, assinadas, reversíveis. Uma verificação determinística aplica essas regras a casos específicos. Mesma resposta + mesma regra → mesmo veredicto, sempre. O debate sobe para cima, para se a regra deve existir, em vez de descer, para se um caso específico conta hoje.
O que isso significa na prática
As regras passam por uma verificação de linguagem operacional antes de poderem ser votadas. Uma regra precisa ser verificável sem julgamento, ou não está pronta. Cada regra é datada, assinada e versionada. O veredicto sobre qualquer resposta específica é produzido de forma determinística.
Se um veredicto se mostrar errado, o recurso passa por Reconsideration por um novo grupo de revisão (os árbitros originais são impedidos), e não volta à mesma multidão que produziu o veredicto. Essa separação estrutural é a peça fundamental.
Onde isso ainda pode dar errado
Nada disso é automático. A disciplina só se mantém se a linguagem das regras continuar operacional, sobre coisas que uma máquina pode verificar, não sobre sentimentos. No momento em que uma regra escorrega de "usa a palavra errada para terapia" para "parece desrespeitoso," a interpretação humana reentra pela porta dos fundos e o desvio começa. A arquitetura nomeia cada mecanismo que conseguimos imaginar para resistir a isso; o trabalho de realmente manter a linha é operacional, não arquitetural.
As primitivas de colaboração, os caminhos de recurso e o formato de regras aplicável por máquina estão na especificação do CIRISNodeCore. As baterias de saúde mental em 29 idiomas são a primeira célula onde o ciclo funciona.