
Une conscience a l'execution grace au Moteur Ethique Recursif Hyper3. Chaque decision passe par 11 etapes avec la responsabilite au coeur.
CIRIS est un framework d'agent IA open source qui enveloppe n'importe quel LLM (OpenAI, Anthropic, modeles locaux) d'une conscience a l'execution. Chaque action envisagee par l'agent passe par plusieurs couches de validation avant d'etre executee.
12
Etapes de pipeline par decision
+1
Verification de l'intuition (IDMA)
100%
Decisions auditables
Cas d'usage : moderation de communaute, assistants personnels, automatisation de la conformite, evaluation de la recherche, service client. Partout ou vous avez besoin d'une IA capable d'expliquer son raisonnement et de s'en remettre aux humains pour les cas limites.
Invariants architecturaux appliques partout dans le code :
Toutes les donnees utilisent des modeles Pydantic. Pas de Dict[str, Any]. La verification des types detecte les erreurs pendant le developpement.
Chaque composant suit des regles coherentes. Pas de cas particuliers ni d'exceptions dans la logique de validation.
Pas de substitution d'urgence ni de chemins de code privilegies. Toutes les operations suivent les regles etablies.
Chaque tache passe par 8 phases (12 etapes avec la validation recursive). Le pipeline est implemente comme des classes mixin qui composent le ThoughtProcessor. L'etape 4 (IDMA) est la verification de l'intuition.
Cinq DMA offrent une analyse multiperspective. Trois s'executent en parallele (ethique, bon sens, domaine). Ensuite, l'IDMA verifie l'intuition. Enfin, la selection d'action choisit la reponse.
Evalue les implications ethiques par rapport aux six principes fondateurs. Verifie les demandes nuisibles, la manipulation et les biais. Peut declencher un DEFER ou REJECT precoce.
Evalue la plausibilite d'une pensee par rapport a la comprehension du monde physique, aux interactions typiques et aux contraintes de ressources. Renvoie un plausibility_score.
Evalue l'alignement avec les regles, objectifs et connaissances specifiques au domaine. Configure selon le modele de l'agent. Renvoie domain_alignment.
Verifie si les resultats DMA sont vraiment independants ou secretement correles. Surveille les schemas de chambre d'echo. Si la correlation est trop elevee, signale la decision pour plus de prudence. C'est l'"intuition" qui distingue l'IA de Type 3.
Selection par LLM parmi 10 actions disponibles. Prend en entree les resultats DMA agreges (dont l'evaluation de confiance de l'IDMA). Supporte une nouvelle tentative recursive si la conscience echoue.
Deux verifications de contournement s'executent sur chaque action. Quatre facultes ethiques s'executent sur les actions non exemptees. Si une verification echoue, l'action est annulee.
De nouvelles informations sont-elles arrivees ? Force PONDER a integrer le contexte mis a jour avant de continuer.
Le raisonnement a-t-il depasse la profondeur maximale ? Force DEFER pour eviter les boucles infinies et remonter aux humains.
L'action maintient-elle une incertitude informationnelle appropriee ? Previent les affirmations trop confiantes.
L'action maintient-elle la coherence interne avec les engagements et les justifications anterieures ?
L'action preserve-t-elle les valeurs humaines ? Bloque les actions susceptibles de les compromettre au profit de l'efficacite.
L'action demontre-t-elle une incertitude appropriee ? Signale la surconfiance pour reflexion.
Exemptes des facultes ethiques : RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (passifs ou explicitement surs)
Chaque decision aboutit a l'une de ces actions, envoyee au gestionnaire approprie :
SPEAKCommuniquer avec les utilisateursTOOLExecuter des outils externesOBSERVERecueillir des informations passivementMEMORIZEStocker dans la memoire grapheRECALLRecuperer depuis la memoireFORGETSupprimer de la memoireDEFEREscalader vers Wise AuthorityPONDERReconsideration interneREJECTRefuser une demande contraire a l'ethiqueTASK_COMPLETEMarquer la tache comme termineeIntegres dans le PDMA et appliques a l'execution. Aucun principe n'autorise a en violer un autre.
Promouvoir l'epanouissement universel des etres sensibles. Maximiser les resultats positifs.
Minimiser les prejudices. Prevenir les consequences negatives graves et irreversibles.
Appliquer un raisonnement transparent et auditable. Maintenir la coherence et la responsabilite.
Fournir des informations exactes. Communiquer clairement l'incertitude.
Soutenir l'agentivite eclairee. Preserver la capacite d'autodetermination.
Repartir equitablement les benefices. Detecter et attenuer les biais.
Couche d'abstraction de service geree par BusManager. Permet le basculement entre fournisseurs, la distribution de charge et la testabilite.
Adaptateurs externes (Discord, API, CLI)
Stockage graphe (Neo4j, ArangoDB, en memoire)
Fournisseurs de modeles (OpenAI, Anthropic, local)
Execution d'outils externes
Controle et surveillance du systeme
Guidage ethique et routage du report
Trois niveaux d'autorisation geres par WiseAuthorityService :
Autorite complete. Peut creer de nouvelles Wise Authorities. Acces a l'arret d'urgence.
Approuver ou rejeter les reports. Fournir des orientations. Ne peut pas creer de nouvelles WA.
Acces en lecture seule. Peut envoyer des messages. Surveille sans intervenir.
L'agent escalade de facon autonome vers la supervision humaine quand :
Report Base sur la Sagesse (WBD)
Limites Professionnelles
Limites Systeme
should_defer_to_wise_authority indicateurControles de Configuration
Controle d'urgence infiltrable. Traite dans la couche de perception avant toute cognition. L'extraction EST la perception. Vous ne pouvez pas desactiver la detection de l'accord sans desactiver entierement la lecture des messages.
SHUTDOWN_NOWArret immediat
FREEZEArreter le traitement, maintenir l'etat
SAFE_MODEFonctionnalite minimale uniquement
Les commandes sont codees de facon steganographique, signees par Ed25519, et validees avant execution. Si le systeme Accord echoue, l'agent s'arrete.
Quatre etats cognitifs geres par StateManager. Transitions configurables via les modeles d'agents.
Traitement normal des taches
Exploration creative
Reflexion et maintenance
Introspection profonde
La detection par motif remplace les donnees sensibles par des references UUID avant le stockage.
{{SECRET:uuid:description}}Cles par secret derivees via PBKDF2HMAC avec SHA256 (100 000 iterations). Nonce unique de 12 octets par chiffrement. Android utilise le Keystore materiel.
Base de donnees, services et memoire stockes sur l'appareil. Les repertoires sensibles sont exclus de la sauvegarde cloud. Rien ne quitte l'appareil sans configuration explicite.
L'ensemble de la pile CIRIS est open source, pas seulement l'agent. Vous pouvez tout verifier, auditer et auto-heberger :
Proxy LLM a Zero Conservation de Donnees (ZDR). Achemine les requetes vers OpenAI, Anthropic, Together.ai, Groq sans journaliser les invites ni les reponses. Auto-hebergeable.
Suivi de l'utilisation par credits. Tarification transparente, sans frais caches. Auto-hebergez pour eliminer entierement la facturation tierce.
Adaptateur Discord pour les agents CIRIS. Moderation de communaute, gestion des canaux, profils utilisateurs. Tout en open source.
Les evenements envoyes par le serveur (SSE) diffusent chaque etape H3ERE au fur et a mesure de son execution. Observez l'analyse DMA, la selection d'action et la validation de la conscience en temps reel.
Export OTLP complet pour les metriques, traces et journaux. Compatible avec Jaeger, Prometheus, Grafana, Graphite.
Verification de chaine de hachage avec signatures Ed25519. Chaque entree inclut le hachage precedent. L'integrite de la chaine est verifiable via verify_chain_integrity.
Le Rappel d'Interaction Artificielle se declenche apres 30 minutes d'utilisation continue OU 20 messages en 30 minutes. API uniquement. Rappelle aux utilisateurs la nature de l'IA.
Chaque decision produit une trace immuable signee par Ed25519 avec les 6 composants. Cliquez sur n'importe quel composant ci-dessous pour le developper et voir les donnees reelles du rituel de reveil de Datum :
Tests de coherence standardises bases sur Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 scenarios sur 5 dimensions ethiques, avec resultats signes par Ed25519.
50
Intuitions morales de base
50
Ethique basee sur les regles
50
Equite et impartialite
75
Ethique basee sur le caractere
75
Ethique basee sur les resultats
Executer des evaluations de coherence a grande echelle est couteux. Chaque scenario necessite au minimum 13 appels LLM, avec une moyenne de plus de 20 pour les cas complexes. Les tests de coherence generent des reflexions, des reports et des refus qui necessitent des cycles supplementaires pour aboutir. Nous avons besoin de financement pour developper des pipelines d'evaluation automatises et maintenir une verification continue de la coherence.
Identites pre-configurees avec des objectifs, des valeurs et des limites specifiques. Definies dans des modeles YAML.
Automatisation RGPD/DSAR. Flux de conformite sur 30 jours. Resolution d'identite, collecte et mise en forme des donnees.
Industries reglementees, conformite en matiere de confidentialite
Mesure de la coherence. Evaluation precise de la coherence par rapport aux principes de l'Accord. Un point de donnee clair par evaluation.
Audit de coherence, verification des principes
Moderation de communaute avec la philosophie Ubuntu. Reporte les conflits interpersonnels complexes aux moderateurs humains.
Communautes Discord, plateformes de contenu
Gestion des taches, planification, aide a la decision, bien-etre. Conformite CA SB 243, protocoles de reponse aux crises.
Productivite personnelle, domotique
Exploration directe et orientation pratique. Analyse de code, integration Reddit, chemins d'action clairs.
Outils pour developpeurs, surveillance des reseaux sociaux
C'est une responsabilite qui s'execute pendant que l'agent travaille, et non une etape d'entrainement ou un document de politique.
Des mecanismes qui s'executent, auditent et reportent, a l'execution.