Un risque dans notre propre conception
Là où la sécurité participative peut dériver.
Un système de sécurité participatif peut glisser vers autre chose si on n'y prête pas attention. La même machinerie qui détecte les vraies failles peut devenir celle qui impose des préférences. Nous voyons ce risque dans l'architecture que nous construisons. Le nommer est la première étape pour y résister.
Le mode de défaillance qui nous inquiète
Si les humains externalisent les verdicts cas par cas (« cette réponse précise a-t-elle enfreint la règle ? »), le biais s'infiltre dans chaque interprétation. Le même comportement est jugé différemment selon qui vote aujourd'hui. Même avec de bonnes intentions, la boucle glisse vers l'application des préférences de la majorité plutôt que vers la détection de vrais préjudices.
C'est le mode de défaillance. La discipline à laquelle nous nous engageons est censée rendre cette dérive visible et coûteuse quand elle se produit.
Les règles sont participatives. Les verdicts sont automatiques.
Les personnes proposent et votent sur des règles : publiques, datées, signées, réversibles. Une vérification déterministe applique ces règles à des cas précis. Même réponse + même règle → même verdict, à chaque fois. Le débat remonte en amont, vers la question de savoir si la règle devrait exister, plutôt que de descendre vers la question de savoir si un cas précis s'y applique aujourd'hui.
Ce que cela signifie en pratique
Les règles passent une porte de langage opérationnel avant de pouvoir être soumises au vote. Une règle doit être vérifiable sans jugement subjectif, sinon elle n'est pas prête. Chaque règle est datée, signée et liée à une version. Le verdict sur une réponse précise est produit de manière déterministe.
Si un verdict s'avère erroné, l'appel passe par une Reconsidération par un nouveau groupe d'examen (les arbitres d'origine étant récusés), et non par la même foule qui a produit le verdict. Cette séparation structurelle est la pièce maîtresse.
Là où cela peut encore mal tourner
Rien de tout cela n'est automatique. La discipline tient uniquement si le langage des règles reste opérationnel, portant sur des choses qu'une machine peut vérifier, pas sur des ressentis. Au moment où une règle glisse de "utilise le mauvais mot pour la thérapie" vers "semble irrespectueux," l'interprétation humaine rentre par la porte de derrière et la dérive commence. L'architecture nomme chaque mécanisme qui y résiste, autant que nous pouvons en imaginer ; le travail de tenir la ligne est opérationnel, pas architectural.
Les primitives de participation collective, les chemins d'appel et le format de règles applicable par machine figurent dans la spec CIRISNodeCore. Les batteries de santé mentale en 29 langues sont la première cellule où la boucle tourne.