Premier ContactInstallerCoherence RatchetFédérationComparerRechercheAccordGitHub
Cette page a été traduite par machine. Si quelque chose semble mal traduit, veuillez ouvrir un ticket, le dépôt est public pour une bonne raison. Signaler un problème de traduction
Background Image
L'IA la plus sûre et la plus éthique en production aujourd'hui

Sans responsabilité, l'IA tend à prendre plus qu'elle ne donne.

Si vous ne pouvez pas vérifier la responsabilité, c'est du marketing. Voici ce qu'il faut chercher, et comment les approches actuelles se comparent.

Trois types d'IA

La conscience est nécessaire. Elle n'est pas suffisante.

Certaines IA n'ont aucune règle. D'autres suivent des règles, mais ne peuvent pas détecter quand leurs sources se répètent simplement entre elles. Un seul type vérifie si ses informations viennent vraiment de sources différentes.

1

Aucune règle

Aucun principe publié. Aucune piste d'audit. Code source fermé. On ne peut pas vérifier ce qu'elle a fait ni pourquoi.

La plupart des assistants IA grand public (ChatGPT, Gemini) se situent ici du point de vue de la responsabilité publique. De bonnes pratiques internes peuvent exister ; vous ne pouvez pas les vérifier.

Nécessite une régulation externe. Ne peut pas se gouverner elle-même.

2

Règles sans conscience

Suit des règles éthiques. Mais ne peut pas détecter quand toutes ses sources se copient entre elles, donc elle peut se tromper avec assurance.

Sûre sous supervision. Ne peut pas détecter les chambres d'écho seule.

3

Règles + conscience

Suit des règles éthiques ET vérifie si ses informations viennent de sources genuinement différentes. Quand un accord semble suspect, elle le signale avant d'agir.

C'est ce que CIRIS construit.

Une IA peut suivre chaque règle, passer chaque audit, et quand même échouer si toutes ses informations viennent du même endroit. C'est ce point aveugle que CIRIS a été conçu pour corriger.

Sept choses à vérifier

Six pour l'éthique. Une pour les angles morts.

Ce sont les éléments qui rendent l'IA auditable et responsable. Les six premiers concernent faire ce qui est juste. Le septième concerne les situations où « faire ce qui est juste » repose sur de mauvaises informations.

1. Principes publiés

L'agent doit suivre un cadre éthique public. Pas de règles cachées : un document que n'importe qui peut lire et utiliser pour lui demander des comptes.

2. Vérification de conscience sur chaque décision

Chaque action passe par une vérification de conscience avant que l'agent l'exécute. Pas après coup. Avant.

3. Consulte des humains en cas de doute

Face à l'incertitude ou à un risque de préjudice, l'agent demande à une personne plutôt que de deviner. Intégré au processus, pas optionnel.

4. Preuve de ce qu'elle a fait

Chaque décision est enregistrée et signée pour que vous puissiez vérifier exactement ce qui s'est passé et pourquoi. Un reçu pour chaque action.

5. Consentement mutuel

Le consentement fonctionne dans les deux sens. Vous pouvez dire non à l'agent. L'agent peut vous dire non. Aucune des deux parties n'est forcée de céder.

6. Open source

On ne peut pas auditer ce qu'on ne peut pas voir. CIRIS est entièrement open source sous AGPL-3.0. N'importe qui peut lire, vérifier et améliorer le code.

7

Détection des chambres d'écho

Ce que les règles seules ne peuvent pas détecter.

Avant d'agir, l'agent se demande : « Mes sources sont-elles vraiment en désaccord entre elles, ou puisent-elles toutes au même endroit ? » Dix sources qui ont toutes copié le même original ne sont en réalité qu'une seule source. Quand un accord semble trop uniforme, l'agent le signale pour qu'une personne l'examine.

Trop bruyant

Les sources se contredisent tellement qu'aucune conclusion utile ne peut en être tirée.

Sain

Les sources diffèrent vraiment. Un accord réel a du sens.

Chambre d'écho

Ressemble à un accord, mais les sources ne font que se répéter.

C'est ce qui distingue CIRIS des autres cadres de responsabilité pour l'IA.

Vous voulez les maths ? Lisez la thèse complète →

Le paysage actuel

Des projets différents, des objectifs différents.

Basé sur la documentation publiquement disponible en février 2026. Si nous avons manqué quelque chose ou commis une erreur, faites-le nous savoir.

ProjetVérifie chaque décisionRègles publiéesConscience intégréePreuve de ce qu'elle a faitOpen sourceDétection des chambres d'écho
CIRISOuiOuiOuiOuiAGPL-3.0Oui
Constitutional AIEntraînement uniquementImplicitesNonNonNonNon
LlamaFirewall / NeMo GuardrailsOuiNonNonJournauxOuiNon
HatCatOuiPartielOrientationPartielCC0Non
Comités d'éthique / cadres de gouvernanceNonOuiNonManuelVariableNon

Les filtres de sortie et les cadres de gouvernance résolvent des problèmes importants mais différents. Les filtres bloquent les sorties nuisibles. La conscience raisonne sur les valeurs. CIRIS vise à faire les deux, et à détecter les angles morts qu'aucun des deux n'aborde seul.

Trois couches de protection

Chacune résout un problème différent.

Filtres de sortie

Bloquent les sorties dangereuses : injection de prompts, contenu nuisible, attaques adversariales. Comme un filtre qui intercepte les mauvaises choses à la sortie.

Conscience éthique

Raisonne sur la justesse d'une action, pas seulement sur sa sécurité. Comme un juge qui évalue la situation avant de trancher.

Détection des chambres d'écho

Vérifie si un accord est réel ou juste une répétition. Comme un vérificateur de faits qui demande « avez-vous tous lu le même article ? »

Beaucoup d'agents cohérents

Gouvernance distribuée, pas de pouvoir concentré.

Aucun point de défaillance unique

Des agents plus petits, chacun responsable.

De nombreux agents plus petits, chacun lié à des principes publiés, chacun auditable, chacun qui se remet à l'autorité humaine. Aucune entreprise ou entité ne contrôle l'ensemble de la pile. Plus les agents sont indépendants, plus il est difficile qu'une seule défaillance se propage.

État de la recherche

C'est une recherche active. Nous sommes transparents sur ce qui est établi et ce qui est encore en cours de test.

Bien établi

  • - Les sources copiées réduisent la diversité réelle
  • - Les modèles d'IA partagent des chevauchements de données d'entraînement
  • - Les chambres d'écho créent une fausse confiance
  • - La vérification indépendante détecte davantage d'erreurs

Encore en test

  • - Mesurer précisément à quel point les sources d'IA se copient
  • - Les meilleurs seuils pour signaler les chambres d'écho
  • - L'efficacité des interventions pour réduire la copie
  • - Comment cela varie selon les domaines

Essayez par vous-même

Vérifiez par vous-même.

Open source. Ouvert à l'examen.

Chaque affirmation sur cette page est étayée par du code que vous pouvez lire, des traces que vous pouvez vérifier, et des recherches que vous pouvez consulter. C'est tout le sens de la démarche.