
Si vous ne pouvez pas vérifier la responsabilité, c'est du marketing. Voici ce qu'il faut chercher, et comment les approches actuelles se comparent.
La conscience est nécessaire. Elle n'est pas suffisante.
Certaines IA n'ont aucune règle. D'autres suivent des règles, mais ne peuvent pas détecter quand leurs sources se répètent simplement entre elles. Un seul type vérifie si ses informations viennent vraiment de sources différentes.
Aucun principe publié. Aucune piste d'audit. Code source fermé. On ne peut pas vérifier ce qu'elle a fait ni pourquoi.
La plupart des assistants IA grand public (ChatGPT, Gemini) se situent ici du point de vue de la responsabilité publique. De bonnes pratiques internes peuvent exister ; vous ne pouvez pas les vérifier.
Nécessite une régulation externe. Ne peut pas se gouverner elle-même.
Suit des règles éthiques. Mais ne peut pas détecter quand toutes ses sources se copient entre elles, donc elle peut se tromper avec assurance.
Sûre sous supervision. Ne peut pas détecter les chambres d'écho seule.
Suit des règles éthiques ET vérifie si ses informations viennent de sources genuinement différentes. Quand un accord semble suspect, elle le signale avant d'agir.
C'est ce que CIRIS construit.
Une IA peut suivre chaque règle, passer chaque audit, et quand même échouer si toutes ses informations viennent du même endroit. C'est ce point aveugle que CIRIS a été conçu pour corriger.
Ce sont les éléments qui rendent l'IA auditable et responsable. Les six premiers concernent faire ce qui est juste. Le septième concerne les situations où « faire ce qui est juste » repose sur de mauvaises informations.
L'agent doit suivre un cadre éthique public. Pas de règles cachées : un document que n'importe qui peut lire et utiliser pour lui demander des comptes.
Chaque action passe par une vérification de conscience avant que l'agent l'exécute. Pas après coup. Avant.
Face à l'incertitude ou à un risque de préjudice, l'agent demande à une personne plutôt que de deviner. Intégré au processus, pas optionnel.
Chaque décision est enregistrée et signée pour que vous puissiez vérifier exactement ce qui s'est passé et pourquoi. Un reçu pour chaque action.
Le consentement fonctionne dans les deux sens. Vous pouvez dire non à l'agent. L'agent peut vous dire non. Aucune des deux parties n'est forcée de céder.
On ne peut pas auditer ce qu'on ne peut pas voir. CIRIS est entièrement open source sous AGPL-3.0. N'importe qui peut lire, vérifier et améliorer le code.
Ce que les règles seules ne peuvent pas détecter.
Avant d'agir, l'agent se demande : « Mes sources sont-elles vraiment en désaccord entre elles, ou puisent-elles toutes au même endroit ? » Dix sources qui ont toutes copié le même original ne sont en réalité qu'une seule source. Quand un accord semble trop uniforme, l'agent le signale pour qu'une personne l'examine.
Trop bruyant
Les sources se contredisent tellement qu'aucune conclusion utile ne peut en être tirée.
Sain
Les sources diffèrent vraiment. Un accord réel a du sens.
Chambre d'écho
Ressemble à un accord, mais les sources ne font que se répéter.
C'est ce qui distingue CIRIS des autres cadres de responsabilité pour l'IA.
Vous voulez les maths ? Lisez la thèse complète →Basé sur la documentation publiquement disponible en février 2026. Si nous avons manqué quelque chose ou commis une erreur, faites-le nous savoir.
| Projet | Vérifie chaque décision | Règles publiées | Conscience intégrée | Preuve de ce qu'elle a fait | Open source | Détection des chambres d'écho |
|---|---|---|---|---|---|---|
| CIRIS | Oui | Oui | Oui | Oui | AGPL-3.0 | Oui |
| Constitutional AI | Entraînement uniquement | Implicites | Non | Non | Non | Non |
| LlamaFirewall / NeMo Guardrails | Oui | Non | Non | Journaux | Oui | Non |
| HatCat | Oui | Partiel | Orientation | Partiel | CC0 | Non |
| Comités d'éthique / cadres de gouvernance | Non | Oui | Non | Manuel | Variable | Non |
Les filtres de sortie et les cadres de gouvernance résolvent des problèmes importants mais différents. Les filtres bloquent les sorties nuisibles. La conscience raisonne sur les valeurs. CIRIS vise à faire les deux, et à détecter les angles morts qu'aucun des deux n'aborde seul.
Bloquent les sorties dangereuses : injection de prompts, contenu nuisible, attaques adversariales. Comme un filtre qui intercepte les mauvaises choses à la sortie.
Raisonne sur la justesse d'une action, pas seulement sur sa sécurité. Comme un juge qui évalue la situation avant de trancher.
Vérifie si un accord est réel ou juste une répétition. Comme un vérificateur de faits qui demande « avez-vous tous lu le même article ? »
De nombreux agents plus petits, chacun lié à des principes publiés, chacun auditable, chacun qui se remet à l'autorité humaine. Aucune entreprise ou entité ne contrôle l'ensemble de la pile. Plus les agents sont indépendants, plus il est difficile qu'une seule défaillance se propage.
C'est une recherche active. Nous sommes transparents sur ce qui est établi et ce qui est encore en cours de test.
Bien établi
Encore en test
Observez-la raisonner
Voyez le raisonnement d'un vrai agent étape par étape. Explorer une trace →
Vérifiez son identité
Voyez comment les agents prouvent qui ils sont, comme un service d'immatriculation pour l'IA. Confiance et identité →
Démarrer
Déployez votre premier agent ou lisez la thèse en langage clair. Premier contact →
Chaque affirmation sur cette page est étayée par du code que vous pouvez lire, des traces que vous pouvez vérifier, et des recherches que vous pouvez consulter. C'est tout le sens de la démarche.