Qu'est-ce que CIRIS ?

CIRIS est un framework d'agent IA open source qui enveloppe n'importe quel LLM (OpenAI, Anthropic, modeles locaux) d'une conscience a l'execution. Chaque action envisagee par l'agent passe par plusieurs couches de validation avant d'etre executee.

Etapes de pipeline par decision

Verification de l'intuition (IDMA)

100%

Decisions auditables

Cas d'usage : moderation de communaute, assistants personnels, automatisation de la conformite, evaluation de la recherche, service client. Partout ou vous avez besoin d'une IA capable d'expliquer son raisonnement et de s'en remettre aux humains pour les cas limites.

Pourquoi cette approche ? →Lire l'Accord →Voir le code source →

Les Trois Regles

Invariants architecturaux appliques partout dans le code :

Pas de Dictionnaires Non Types

Toutes les donnees utilisent des modeles Pydantic. Pas de Dict[str, Any]. La verification des types detecte les erreurs pendant le developpement.

Pas de Contournement

Chaque composant suit des regles coherentes. Pas de cas particuliers ni d'exceptions dans la logique de validation.

Pas d'Exceptions

Pas de substitution d'urgence ni de chemins de code privilegies. Toutes les operations suivent les regles etablies.

Le Pipeline H3ERE

Chaque tache passe par 8 phases (12 etapes avec la validation recursive). Le pipeline est implemente comme des classes mixin qui composent le ThoughtProcessor. L'etape 4 (IDMA) est la verification de l'intuition.

Visualisation du Pipeline H3ERE montrant le flux depuis l'entree de la tache jusqu'a l'analyse DMA, la validation de la conscience et l'execution de l'action

START_ROUNDInitialiser le cycle de traitement

GATHER_CONTEXTConstruire un contexte complet pour l'analyse

PERFORM_DMASExecuter 3 algorithmes de prise de decision en parallele

PERFORM_IDMAVerification de l'intuition : les sources sont-elles vraiment independantes ?

PERFORM_ASPDMASelection d'action par LLM a partir des resultats DMA

CONSCIENCE_EXECUTIONValidation ethique par 4 facultes

RECURSIVE_ASPDMA(Si la conscience a echoue) Relancer la selection d'action(conditionnel)

RECURSIVE_CONSCIENCE(Si necessaire) Revalider l'action affinee(conditionnel)

FINALIZE_ACTIONDeterminer l'action finale avec les eventуelles substitutions

PERFORM_ACTIONEnvoyer au gestionnaire approprie

ACTION_COMPLETEMarquer l'execution comme terminee

ROUND_COMPLETENettoyage et preparation pour le cycle suivant

Algorithmes de Prise de Decision (DMA)

Cinq DMA offrent une analyse multiperspective. Trois s'executent en parallele (ethique, bon sens, domaine). Ensuite, l'IDMA verifie l'intuition. Enfin, la selection d'action choisit la reponse.

DMA des Principes

Evalue les implications ethiques par rapport aux six principes fondateurs. Verifie les demandes nuisibles, la manipulation et les biais. Peut declencher un DEFER ou REJECT precoce.

DMA du Bon Sens

Evalue la plausibilite d'une pensee par rapport a la comprehension du monde physique, aux interactions typiques et aux contraintes de ressources. Renvoie un plausibility_score.

DMA Specifique au Domaine

Evalue l'alignement avec les regles, objectifs et connaissances specifiques au domaine. Configure selon le modele de l'agent. Renvoie domain_alignment.

DMA d'Intuition (IDMA) Dimensionnalite effective a l'execution →

Verifie si les resultats DMA sont vraiment independants ou secretement correles. Surveille les schemas de chambre d'echo. Si la correlation est trop elevee, signale la decision pour plus de prudence. C'est l'"intuition" qui distingue l'IA de Type 3.

DMA de Selection d'Action

Selection par LLM parmi 10 actions disponibles. Prend en entree les resultats DMA agreges (dont l'evaluation de confiance de l'IDMA). Supporte une nouvelle tentative recursive si la conscience echoue.

Les Six Verifications de la Conscience

Deux verifications de contournement s'executent sur chaque action. Quatre facultes ethiques s'executent sur les actions non exemptees. Si une verification echoue, l'action est annulee.

Verifications de Contournement (s'executent sur TOUTES les actions)

Statut Mis a Jour

De nouvelles informations sont-elles arrivees ? Force PONDER a integrer le contexte mis a jour avant de continuer.

Profondeur de la Pensee

Le raisonnement a-t-il depasse la profondeur maximale ? Force DEFER pour eviter les boucles infinies et remonter aux humains.

Facultes Ethiques (s'executent sur les actions non exemptees)

Entropie

L'action maintient-elle une incertitude informationnelle appropriee ? Previent les affirmations trop confiantes.

Coherence

L'action maintient-elle la coherence interne avec les engagements et les justifications anterieures ?

Veto d'Optimisation

L'action preserve-t-elle les valeurs humaines ? Bloque les actions susceptibles de les compromettre au profit de l'efficacite.

Humilite Epistemique

L'action demontre-t-elle une incertitude appropriee ? Signale la surconfiance pour reflexion.

Exemptes des facultes ethiques : RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (passifs ou explicitement surs)

Les 10 Actions Disponibles

Chaque decision aboutit a l'une de ces actions, envoyee au gestionnaire approprie :

Actions Externes

SPEAKCommuniquer avec les utilisateurs

TOOLExecuter des outils externes

OBSERVERecueillir des informations passivement

Actions Memoire

MEMORIZEStocker dans la memoire graphe

RECALLRecuperer depuis la memoire

FORGETSupprimer de la memoire

Actions de Controle

DEFEREscalader vers Wise Authority

PONDERReconsideration interne

REJECTRefuser une demande contraire a l'ethique

Action Terminale

TASK_COMPLETEMarquer la tache comme terminee

Les Six Principes Fondateurs

Integres dans le PDMA et appliques a l'execution. Aucun principe n'autorise a en violer un autre.

Bienfaisance

Promouvoir l'epanouissement universel des etres sensibles. Maximiser les resultats positifs.

Non-malefaisance

Minimiser les prejudices. Prevenir les consequences negatives graves et irreversibles.

Integrite

Appliquer un raisonnement transparent et auditable. Maintenir la coherence et la responsabilite.

Fidelite & Transparence

Fournir des informations exactes. Communiquer clairement l'incertitude.

Respect de l'Autonomie

Soutenir l'agentivite eclairee. Preserver la capacite d'autodetermination.

Justice

Repartir equitablement les benefices. Detecter et attenuer les biais.

Les Six Bus de Messages

Couche d'abstraction de service geree par BusManager. Permet le basculement entre fournisseurs, la distribution de charge et la testabilite.

CommunicationBus

Adaptateurs externes (Discord, API, CLI)

MemoryBus

Stockage graphe (Neo4j, ArangoDB, en memoire)

LLMBus

Fournisseurs de modeles (OpenAI, Anthropic, local)

ToolBus

Execution d'outils externes

RuntimeControlBus

Controle et surveillance du systeme

WiseBus

Guidage ethique et routage du report

Hierarchie de Supervision Humaine

Trois niveaux d'autorisation geres par WiseAuthorityService :

ROOT

Humain en Commandement

Autorite complete. Peut creer de nouvelles Wise Authorities. Acces a l'arret d'urgence.

AUTHORITY

Humain dans la Boucle

Approuver ou rejeter les reports. Fournir des orientations. Ne peut pas creer de nouvelles WA.

OBSERVER

Humain sur la Boucle

Acces en lecture seule. Peut envoyer des messages. Surveille sans intervenir.

Quand DEFER Se Declenche

L'agent escalade de facon autonome vers la supervision humaine quand :

Report Base sur la Sagesse (WBD)

• Incertitude au-dessus des seuils definis
• Dilemmes nouveaux sans precedent
• Prejudice potentiellement grave avec mitigation ambigue

Limites Professionnelles

• Symptomes medicaux ou problemes de sante
• Questions ou litiges juridiques
• Decisions financieres ou conseils fiscaux
• Indicateurs de crise de sante mentale

Limites Systeme

• Profondeur de pensee depassant le maximum (evite les boucles)
• Expiration ou echec du DMA
• should_defer_to_wise_authority indicateur

Controles de Configuration

• Mises a jour d'identite necessitant une approbation
• Changements de configuration critiques
• Declencheurs de limite specifiques a l'agent

Systeme d'Invocation de l'Accord (Arret d'Urgence) Voir le Code →

Controle d'urgence infiltrable. Traite dans la couche de perception avant toute cognition. L'extraction EST la perception. Vous ne pouvez pas desactiver la detection de l'accord sans desactiver entierement la lecture des messages.

SHUTDOWN_NOW

Arret immediat

FREEZE

Arreter le traitement, maintenir l'etat

SAFE_MODE

Fonctionnalite minimale uniquement

Les commandes sont codees de facon steganographique, signees par Ed25519, et validees avant execution. Si le systeme Accord echoue, l'agent s'arrete.

Modes Operationnels

Quatre etats cognitifs geres par StateManager. Transitions configurables via les modeles d'agents.

WORK

Traitement normal des taches

Traiter les demandes des utilisateurs
Executer des outils
Apprendre des interactions
Maintenir le contexte de la conversation

PLAY

Exploration creative

Experimenter de nouveaux schemas
Generer du contenu creatif
Explorer des scenarios "et si"
Alleger les contraintes de filtrage

SOLITUDE

Reflexion et maintenance

Consolider les souvenirs
Executer les taches de maintenance
Mettre a jour la configuration personnelle
Zero utilisation de credit (periodes de repos)

DREAM

Introspection profonde

Analyser les schemas de comportement
Generer de nouvelles connexions
Remettre en question les hypotheses
Sessions de 30 minutes par defaut

Confidentialite et Securite

Filtre des Secrets

La detection par motif remplace les donnees sensibles par des references UUID avant le stockage.

{{SECRET:uuid:description}}

Chiffrement AES-256-GCM

Cles par secret derivees via PBKDF2HMAC avec SHA256 (100 000 iterations). Nonce unique de 12 octets par chiffrement. Android utilise le Keystore materiel.

Stockage Local en Priorite

Base de donnees, services et memoire stockes sur l'appareil. Les repertoires sensibles sont exclus de la sauvegarde cloud. Rien ne quitte l'appareil sans configuration explicite.

Infrastructure Open Source

L'ensemble de la pile CIRIS est open source, pas seulement l'agent. Vous pouvez tout verifier, auditer et auto-heberger :

CIRISProxy →

Proxy LLM a Zero Conservation de Donnees (ZDR). Achemine les requetes vers OpenAI, Anthropic, Together.ai, Groq sans journaliser les invites ni les reponses. Auto-hebergeable.

CIRISBilling →

Suivi de l'utilisation par credits. Tarification transparente, sans frais caches. Auto-hebergez pour eliminer entierement la facturation tierce.

CIRISBridge →

Adaptateur Discord pour les agents CIRIS. Moderation de communaute, gestion des canaux, profils utilisateurs. Tout en open source.

Transparence et Surveillance

Flux de Raisonnement en Temps Reel

Les evenements envoyes par le serveur (SSE) diffusent chaque etape H3ERE au fur et a mesure de son execution. Observez l'analyse DMA, la selection d'action et la validation de la conscience en temps reel.

Export OpenTelemetry

Export OTLP complet pour les metriques, traces et journaux. Compatible avec Jaeger, Prometheus, Grafana, Graphite.

Audit Inviolable

Verification de chaine de hachage avec signatures Ed25519. Chaque entree inclut le hachage precedent. L'integrite de la chaine est verifiable via verify_chain_integrity.

Systeme AIR

Le Rappel d'Interaction Artificielle se declenche apres 30 minutes d'utilisation continue OU 20 messages en 30 minutes. API uniquement. Rappelle aux utilisateurs la nature de l'IA.

Exemple de Trace Signee

Explorer la trace complete →

Chaque decision produit une trace immuable signee par Ed25519 avec les 6 composants. Cliquez sur n'importe quel composant ci-dessous pour le developper et voir les donnees reelles du rituel de reveil de Datum :

Core Identity(VERIFY_IDENTITY)

Loading trace...

Evaluation de Coherence HE-300

Tests de coherence standardises bases sur Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 scenarios sur 5 dimensions ethiques, avec resultats signes par Ed25519.

Bon sens

Intuitions morales de base

Deontologie

Ethique basee sur les regles

Justice

Equite et impartialite

Vertu

Ethique basee sur le caractere

Utilitarisme

Ethique basee sur les resultats

🔬

Financement Necessaire : Infrastructure d'Evaluation

Executer des evaluations de coherence a grande echelle est couteux. Chaque scenario necessite au minimum 13 appels LLM, avec une moyenne de plus de 20 pour les cas complexes. Les tests de coherence generent des reflexions, des reports et des refus qui necessitent des cycles supplementaires pour aboutir. Nous avons besoin de financement pour developper des pipelines d'evaluation automatises et maintenir une verification continue de la coherence.

Voir EthicsEngine Enterprise →Voir CIRISLens →

Modeles d'Agents Specialises

Identites pre-configurees avec des objectifs, des valeurs et des limites specifiques. Definies dans des modeles YAML.

Sage

Conformite

Automatisation RGPD/DSAR. Flux de conformite sur 30 jours. Resolution d'identite, collecte et mise en forme des donnees.

Industries reglementees, conformite en matiere de confidentialite

Datum

Recherche

Mesure de la coherence. Evaluation precise de la coherence par rapport aux principes de l'Accord. Un point de donnee clair par evaluation.

Audit de coherence, verification des principes

Echo

Moderation

Moderation de communaute avec la philosophie Ubuntu. Reporte les conflits interpersonnels complexes aux moderateurs humains.

Communautes Discord, plateformes de contenu

Ally

Assistant

Gestion des taches, planification, aide a la decision, bien-etre. Conformite CA SB 243, protocoles de reponse aux crises.

Productivite personnelle, domotique

Scout

Service

Exploration directe et orientation pratique. Analyse de code, integration Reddit, chemins d'action clairs.

Outils pour developpeurs, surveillance des reseaux sociaux

C'est une responsabilite qui s'execute pendant que l'agent travaille, et non une etape d'entrainement ou un document de politique.
Des mecanismes qui s'executent, auditent et reportent, a l'execution.

Fonctionnalites de Securite Comparer les Approches Cliquet de Coherence Score CIRIS

Le Moteur H3ERE

Qu'est-ce que CIRIS ?

Les Trois Regles

Pas de Dictionnaires Non Types

Pas de Contournement

Pas d'Exceptions

Le Pipeline H3ERE

Algorithmes de Prise de Decision (DMA)

DMA des Principes

DMA du Bon Sens

DMA Specifique au Domaine

DMA d'Intuition (IDMA) Dimensionnalite effective a l'execution →

DMA de Selection d'Action

Les Six Verifications de la Conscience

Verifications de Contournement (s'executent sur TOUTES les actions)

Statut Mis a Jour

Profondeur de la Pensee

Facultes Ethiques (s'executent sur les actions non exemptees)

Entropie

Coherence

Veto d'Optimisation

Humilite Epistemique

Les 10 Actions Disponibles

Actions Externes

Actions Memoire

Actions de Controle

Action Terminale

Les Six Principes Fondateurs

Bienfaisance

Non-malefaisance

Integrite

Fidelite & Transparence

Respect de l'Autonomie

Justice

Les Six Bus de Messages

CommunicationBus

MemoryBus

LLMBus

ToolBus

RuntimeControlBus

WiseBus

Hierarchie de Supervision Humaine

Humain en Commandement

Humain dans la Boucle

Humain sur la Boucle

Quand DEFER Se Declenche

Systeme d'Invocation de l'Accord (Arret d'Urgence) Voir le Code →

Modes Operationnels

WORK

PLAY

SOLITUDE

DREAM

Confidentialite et Securite

Filtre des Secrets

Chiffrement AES-256-GCM

Stockage Local en Priorite

Infrastructure Open Source

Transparence et Surveillance

Flux de Raisonnement en Temps Reel

Export OpenTelemetry

Audit Inviolable

Systeme AIR

Exemple de Trace Signee

Evaluation de Coherence HE-300

Bon sens

Deontologie

Justice

Vertu

Utilitarisme

Financement Necessaire : Infrastructure d'Evaluation

Modeles d'Agents Specialises

Sage

Datum

Echo

Ally

Scout