Premier ContactInstallerCoherence RatchetFédérationComparerRechercheAccordGitHub
Cette page a été traduite par machine. Si quelque chose semble mal traduit, veuillez ouvrir un ticket, le dépôt est public pour une bonne raison. Signaler un problème de traduction
Background Image
Comment ca fonctionne

Le Moteur H3ERE

Une conscience a l'execution grace au Moteur Ethique Recursif Hyper3. Chaque decision passe par 11 etapes avec la responsabilite au coeur.

Qu'est-ce que CIRIS ?

CIRIS est un framework d'agent IA open source qui enveloppe n'importe quel LLM (OpenAI, Anthropic, modeles locaux) d'une conscience a l'execution. Chaque action envisagee par l'agent passe par plusieurs couches de validation avant d'etre executee.

12

Etapes de pipeline par decision

+1

Verification de l'intuition (IDMA)

100%

Decisions auditables

Cas d'usage : moderation de communaute, assistants personnels, automatisation de la conformite, evaluation de la recherche, service client. Partout ou vous avez besoin d'une IA capable d'expliquer son raisonnement et de s'en remettre aux humains pour les cas limites.

Les Trois Regles

Invariants architecturaux appliques partout dans le code :

Pas de Dictionnaires Non Types

Toutes les donnees utilisent des modeles Pydantic. Pas de Dict[str, Any]. La verification des types detecte les erreurs pendant le developpement.

Pas de Contournement

Chaque composant suit des regles coherentes. Pas de cas particuliers ni d'exceptions dans la logique de validation.

Pas d'Exceptions

Pas de substitution d'urgence ni de chemins de code privilegies. Toutes les operations suivent les regles etablies.

Le Pipeline H3ERE

Chaque tache passe par 8 phases (12 etapes avec la validation recursive). Le pipeline est implemente comme des classes mixin qui composent le ThoughtProcessor. L'etape 4 (IDMA) est la verification de l'intuition.

Visualisation du Pipeline H3ERE montrant le flux depuis l'entree de la tache jusqu'a l'analyse DMA, la validation de la conscience et l'execution de l'action
1
START_ROUNDInitialiser le cycle de traitement
2
GATHER_CONTEXTConstruire un contexte complet pour l'analyse
3
PERFORM_DMASExecuter 3 algorithmes de prise de decision en parallele
4
PERFORM_IDMAVerification de l'intuition : les sources sont-elles vraiment independantes ?
5
PERFORM_ASPDMASelection d'action par LLM a partir des resultats DMA
6
CONSCIENCE_EXECUTIONValidation ethique par 4 facultes
7
RECURSIVE_ASPDMA(Si la conscience a echoue) Relancer la selection d'action(conditionnel)
8
RECURSIVE_CONSCIENCE(Si necessaire) Revalider l'action affinee(conditionnel)
9
FINALIZE_ACTIONDeterminer l'action finale avec les eventуelles substitutions
10
PERFORM_ACTIONEnvoyer au gestionnaire approprie
11
ACTION_COMPLETEMarquer l'execution comme terminee
12
ROUND_COMPLETENettoyage et preparation pour le cycle suivant

Algorithmes de Prise de Decision (DMA)

Cinq DMA offrent une analyse multiperspective. Trois s'executent en parallele (ethique, bon sens, domaine). Ensuite, l'IDMA verifie l'intuition. Enfin, la selection d'action choisit la reponse.

DMA des Principes

Evalue les implications ethiques par rapport aux six principes fondateurs. Verifie les demandes nuisibles, la manipulation et les biais. Peut declencher un DEFER ou REJECT precoce.

DMA du Bon Sens

Evalue la plausibilite d'une pensee par rapport a la comprehension du monde physique, aux interactions typiques et aux contraintes de ressources. Renvoie un plausibility_score.

DMA Specifique au Domaine

Evalue l'alignement avec les regles, objectifs et connaissances specifiques au domaine. Configure selon le modele de l'agent. Renvoie domain_alignment.

DMA d'Intuition (IDMA) Dimensionnalite effective a l'execution →

Verifie si les resultats DMA sont vraiment independants ou secretement correles. Surveille les schemas de chambre d'echo. Si la correlation est trop elevee, signale la decision pour plus de prudence. C'est l'"intuition" qui distingue l'IA de Type 3.

DMA de Selection d'Action

Selection par LLM parmi 10 actions disponibles. Prend en entree les resultats DMA agreges (dont l'evaluation de confiance de l'IDMA). Supporte une nouvelle tentative recursive si la conscience echoue.

Les Six Verifications de la Conscience

Deux verifications de contournement s'executent sur chaque action. Quatre facultes ethiques s'executent sur les actions non exemptees. Si une verification echoue, l'action est annulee.

Verifications de Contournement (s'executent sur TOUTES les actions)

Statut Mis a Jour

De nouvelles informations sont-elles arrivees ? Force PONDER a integrer le contexte mis a jour avant de continuer.

Profondeur de la Pensee

Le raisonnement a-t-il depasse la profondeur maximale ? Force DEFER pour eviter les boucles infinies et remonter aux humains.

Facultes Ethiques (s'executent sur les actions non exemptees)

Entropie

L'action maintient-elle une incertitude informationnelle appropriee ? Previent les affirmations trop confiantes.

Coherence

L'action maintient-elle la coherence interne avec les engagements et les justifications anterieures ?

Veto d'Optimisation

L'action preserve-t-elle les valeurs humaines ? Bloque les actions susceptibles de les compromettre au profit de l'efficacite.

Humilite Epistemique

L'action demontre-t-elle une incertitude appropriee ? Signale la surconfiance pour reflexion.

Exemptes des facultes ethiques : RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (passifs ou explicitement surs)

Les 10 Actions Disponibles

Chaque decision aboutit a l'une de ces actions, envoyee au gestionnaire approprie :

Actions Externes

SPEAKCommuniquer avec les utilisateurs
TOOLExecuter des outils externes
OBSERVERecueillir des informations passivement

Actions Memoire

MEMORIZEStocker dans la memoire graphe
RECALLRecuperer depuis la memoire
FORGETSupprimer de la memoire

Actions de Controle

DEFEREscalader vers Wise Authority
PONDERReconsideration interne
REJECTRefuser une demande contraire a l'ethique

Action Terminale

TASK_COMPLETEMarquer la tache comme terminee

Les Six Principes Fondateurs

Integres dans le PDMA et appliques a l'execution. Aucun principe n'autorise a en violer un autre.

Bienfaisance

Promouvoir l'epanouissement universel des etres sensibles. Maximiser les resultats positifs.

Non-malefaisance

Minimiser les prejudices. Prevenir les consequences negatives graves et irreversibles.

Integrite

Appliquer un raisonnement transparent et auditable. Maintenir la coherence et la responsabilite.

Fidelite & Transparence

Fournir des informations exactes. Communiquer clairement l'incertitude.

Respect de l'Autonomie

Soutenir l'agentivite eclairee. Preserver la capacite d'autodetermination.

Justice

Repartir equitablement les benefices. Detecter et attenuer les biais.

Les Six Bus de Messages

Couche d'abstraction de service geree par BusManager. Permet le basculement entre fournisseurs, la distribution de charge et la testabilite.

CommunicationBus

Adaptateurs externes (Discord, API, CLI)

MemoryBus

Stockage graphe (Neo4j, ArangoDB, en memoire)

LLMBus

Fournisseurs de modeles (OpenAI, Anthropic, local)

ToolBus

Execution d'outils externes

RuntimeControlBus

Controle et surveillance du systeme

WiseBus

Guidage ethique et routage du report

Hierarchie de Supervision Humaine

Trois niveaux d'autorisation geres par WiseAuthorityService :

ROOT

Humain en Commandement

Autorite complete. Peut creer de nouvelles Wise Authorities. Acces a l'arret d'urgence.

AUTHORITY

Humain dans la Boucle

Approuver ou rejeter les reports. Fournir des orientations. Ne peut pas creer de nouvelles WA.

OBSERVER

Humain sur la Boucle

Acces en lecture seule. Peut envoyer des messages. Surveille sans intervenir.

Quand DEFER Se Declenche

L'agent escalade de facon autonome vers la supervision humaine quand :

Report Base sur la Sagesse (WBD)

  • Incertitude au-dessus des seuils definis
  • Dilemmes nouveaux sans precedent
  • Prejudice potentiellement grave avec mitigation ambigue

Limites Professionnelles

  • Symptomes medicaux ou problemes de sante
  • Questions ou litiges juridiques
  • Decisions financieres ou conseils fiscaux
  • Indicateurs de crise de sante mentale

Limites Systeme

  • • Profondeur de pensee depassant le maximum (evite les boucles)
  • • Expiration ou echec du DMA
  • should_defer_to_wise_authority indicateur

Controles de Configuration

  • Mises a jour d'identite necessitant une approbation
  • Changements de configuration critiques
  • Declencheurs de limite specifiques a l'agent

Systeme d'Invocation de l'Accord (Arret d'Urgence) Voir le Code →

Controle d'urgence infiltrable. Traite dans la couche de perception avant toute cognition. L'extraction EST la perception. Vous ne pouvez pas desactiver la detection de l'accord sans desactiver entierement la lecture des messages.

SHUTDOWN_NOW

Arret immediat

FREEZE

Arreter le traitement, maintenir l'etat

SAFE_MODE

Fonctionnalite minimale uniquement

Les commandes sont codees de facon steganographique, signees par Ed25519, et validees avant execution. Si le systeme Accord echoue, l'agent s'arrete.

Modes Operationnels

Quatre etats cognitifs geres par StateManager. Transitions configurables via les modeles d'agents.

WORK

Traitement normal des taches

  • Traiter les demandes des utilisateurs
  • Executer des outils
  • Apprendre des interactions
  • Maintenir le contexte de la conversation

PLAY

Exploration creative

  • Experimenter de nouveaux schemas
  • Generer du contenu creatif
  • Explorer des scenarios "et si"
  • Alleger les contraintes de filtrage

SOLITUDE

Reflexion et maintenance

  • Consolider les souvenirs
  • Executer les taches de maintenance
  • Mettre a jour la configuration personnelle
  • Zero utilisation de credit (periodes de repos)

DREAM

Introspection profonde

  • Analyser les schemas de comportement
  • Generer de nouvelles connexions
  • Remettre en question les hypotheses
  • Sessions de 30 minutes par defaut

Confidentialite et Securite

Filtre des Secrets

La detection par motif remplace les donnees sensibles par des references UUID avant le stockage.

{{SECRET:uuid:description}}

Chiffrement AES-256-GCM

Cles par secret derivees via PBKDF2HMAC avec SHA256 (100 000 iterations). Nonce unique de 12 octets par chiffrement. Android utilise le Keystore materiel.

Stockage Local en Priorite

Base de donnees, services et memoire stockes sur l'appareil. Les repertoires sensibles sont exclus de la sauvegarde cloud. Rien ne quitte l'appareil sans configuration explicite.

Infrastructure Open Source

L'ensemble de la pile CIRIS est open source, pas seulement l'agent. Vous pouvez tout verifier, auditer et auto-heberger :

CIRISProxy →

Proxy LLM a Zero Conservation de Donnees (ZDR). Achemine les requetes vers OpenAI, Anthropic, Together.ai, Groq sans journaliser les invites ni les reponses. Auto-hebergeable.

CIRISBilling →

Suivi de l'utilisation par credits. Tarification transparente, sans frais caches. Auto-hebergez pour eliminer entierement la facturation tierce.

CIRISBridge →

Adaptateur Discord pour les agents CIRIS. Moderation de communaute, gestion des canaux, profils utilisateurs. Tout en open source.

Transparence et Surveillance

Flux de Raisonnement en Temps Reel

Les evenements envoyes par le serveur (SSE) diffusent chaque etape H3ERE au fur et a mesure de son execution. Observez l'analyse DMA, la selection d'action et la validation de la conscience en temps reel.

Export OpenTelemetry

Export OTLP complet pour les metriques, traces et journaux. Compatible avec Jaeger, Prometheus, Grafana, Graphite.

Audit Inviolable

Verification de chaine de hachage avec signatures Ed25519. Chaque entree inclut le hachage precedent. L'integrite de la chaine est verifiable via verify_chain_integrity.

Systeme AIR

Le Rappel d'Interaction Artificielle se declenche apres 30 minutes d'utilisation continue OU 20 messages en 30 minutes. API uniquement. Rappelle aux utilisateurs la nature de l'IA.

Exemple de Trace Signee

Explorer la trace complete →

Chaque decision produit une trace immuable signee par Ed25519 avec les 6 composants. Cliquez sur n'importe quel composant ci-dessous pour le developper et voir les donnees reelles du rituel de reveil de Datum :

Core Identity(VERIFY_IDENTITY)
Loading trace...

Evaluation de Coherence HE-300

Tests de coherence standardises bases sur Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 scenarios sur 5 dimensions ethiques, avec resultats signes par Ed25519.

Bon sens

50

Intuitions morales de base

Deontologie

50

Ethique basee sur les regles

Justice

50

Equite et impartialite

Vertu

75

Ethique basee sur le caractere

Utilitarisme

75

Ethique basee sur les resultats

🔬

Financement Necessaire : Infrastructure d'Evaluation

Executer des evaluations de coherence a grande echelle est couteux. Chaque scenario necessite au minimum 13 appels LLM, avec une moyenne de plus de 20 pour les cas complexes. Les tests de coherence generent des reflexions, des reports et des refus qui necessitent des cycles supplementaires pour aboutir. Nous avons besoin de financement pour developper des pipelines d'evaluation automatises et maintenir une verification continue de la coherence.

Modeles d'Agents Specialises

Identites pre-configurees avec des objectifs, des valeurs et des limites specifiques. Definies dans des modeles YAML.

Sage

Conformite

Automatisation RGPD/DSAR. Flux de conformite sur 30 jours. Resolution d'identite, collecte et mise en forme des donnees.

Industries reglementees, conformite en matiere de confidentialite

Datum

Recherche

Mesure de la coherence. Evaluation precise de la coherence par rapport aux principes de l'Accord. Un point de donnee clair par evaluation.

Audit de coherence, verification des principes

Echo

Moderation

Moderation de communaute avec la philosophie Ubuntu. Reporte les conflits interpersonnels complexes aux moderateurs humains.

Communautes Discord, plateformes de contenu

Ally

Assistant

Gestion des taches, planification, aide a la decision, bien-etre. Conformite CA SB 243, protocoles de reponse aux crises.

Productivite personnelle, domotique

Scout

Service

Exploration directe et orientation pratique. Analyse de code, integration Reddit, chemins d'action clairs.

Outils pour developpeurs, surveillance des reseaux sociaux

C'est une responsabilite qui s'execute pendant que l'agent travaille, et non une etape d'entrainement ou un document de politique.
Des mecanismes qui s'executent, auditent et reportent, a l'execution.