O que é o CIRIS?

CIRIS é um framework de agente de IA de código aberto que envolve qualquer LLM (OpenAI, Anthropic, modelos locais) com consciência em tempo de execução. Cada ação que o agente considera passa por múltiplas camadas de validação antes da execução.

Etapas do pipeline por decisão

Verificação de intuição (IDMA)

100%

Decisões auditáveis

Casos de uso: Moderação de comunidades, assistentes pessoais, automação de conformidade, avaliação de pesquisas, atendimento ao cliente. Em qualquer lugar onde você precise de IA capaz de explicar seu raciocínio e adiar decisões para humanos em casos limite.

Por que essa abordagem? →Ler o Acordo →Ver código-fonte →

As Três Regras

Invariantes arquiteturais aplicados em todo o código-fonte:

Sem Dicionários Sem Tipo

Todos os dados usam modelos Pydantic. Nenhum Dict[str, Any]. A segurança de tipos detecta erros em tempo de desenvolvimento.

Sem Padrões de Desvio

Cada componente segue regras consistentes. Sem casos especiais ou exceções na lógica de validação.

Sem Exceções

Sem substituições de emergência ou caminhos de código privilegiados. Todas as operações seguem as regras estabelecidas.

O Pipeline H3ERE

Cada tarefa passa por 8 fases (12 etapas incluindo validação recursiva). O pipeline é implementado como classes mixin que compõem o ThoughtProcessor. Etapa 4 (IDMA) é a verificação de intuição.

START_ROUNDInicializar rodada de processamento

GATHER_CONTEXTConstruir contexto abrangente para análise

PERFORM_DMASExecutar 3 Algoritmos de Tomada de Decisão em paralelo

PERFORM_IDMAVerificação de intuição: as fontes são verdadeiramente independentes?

PERFORM_ASPDMASeleção de ação com suporte de LLM a partir dos resultados DMA

CONSCIENCE_EXECUTIONValidação ética por 4 faculdades

RECURSIVE_ASPDMA(Se a consciência falhou) Executar novamente a seleção de ação(condicional)

RECURSIVE_CONSCIENCE(Se necessário) Revalidar ação refinada(condicional)

FINALIZE_ACTIONDeterminar ação final com quaisquer substituições

PERFORM_ACTIONDespachar para o manipulador adequado

ACTION_COMPLETEMarcar execução como concluída

ROUND_COMPLETELimpeza e preparação para o próximo ciclo

Algoritmos de Tomada de Decisão (DMAs)

Cinco DMAs fornecem análise multi-perspectiva. Três rodam em paralelo (ética, senso comum, domínio). Em seguida, o IDMA verifica a intuição. Por fim, a seleção de ação escolhe a resposta.

DMA de Princípios

Avalia as implicações éticas em relação aos seis princípios fundamentais. Verifica pedidos prejudiciais, manipulação e viés. Pode acionar DEFER ou REJECT antecipados.

DMA de Senso Comum

Avalia a plausibilidade do pensamento em relação à compreensão do mundo físico, interações típicas e restrições de recursos. Retorna um plausibility_score.

DMA de Domínio Específico

Avalia o alinhamento com regras, objetivos e conhecimentos específicos do domínio. Configurado por modelo de agente. Retorna domain_alignment.

DMA de Intuição (IDMA) Dimensionalidade efetiva em tempo de execução →

Verifica se os resultados dos DMAs são verdadeiramente independentes ou secretamente correlacionados. Monitora padrões de câmara de eco. Se a correlação for alta demais, sinaliza a decisão para cautela. Esta é a "intuição" que distingue a IA do Tipo 3.

DMA de Seleção de Ação

Seleção com suporte de LLM entre 10 ações disponíveis. Recebe como entrada os resultados agregados dos DMAs (incluindo a avaliação de confiança do IDMA). Suporta nova tentativa recursiva se a consciência falhar.

As Seis Verificações de Consciência

Duas verificações de desvio rodam em cada ação. Quatro faculdades éticas rodam em ações não isentas. Se alguma verificação falhar, a ação é substituída.

Verificações de Desvio (rodam em TODAS as ações)

Status Atualizado

Chegaram novas informações? Força o PONDER a incorporar o contexto atualizado antes de prosseguir.

Profundidade do Pensamento

O raciocínio excedeu a profundidade máxima? Força o DEFER para evitar loops infinitos e escalar para humanos.

Faculdades Éticas (rodam em ações não isentas)

Entropia

A ação mantém incerteza informacional adequada? Evita afirmações excessivamente confiantes.

Coerência

A ação mantém consistência interna com compromissos e fundamentos anteriores?

Veto de Otimização

A ação preserva os valores humanos? Veta ações que possam comprometê-los em favor da eficiência.

Humildade Epistêmica

A ação demonstra incerteza adequada? Sinaliza excesso de confiança para reflexão.

Isentos das faculdades éticas: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (passivos ou explicitamente seguros)

As 10 Ações do Manipulador

Cada decisão se resolve em uma dessas ações, despachada para o manipulador adequado:

Ações Externas

SPEAKComunicar com usuários

TOOLExecutar ferramentas externas

OBSERVEColetar informações passivamente

Ações de Memória

MEMORIZEArmazenar no grafo de memória

RECALLRecuperar da memória

FORGETRemover da memória

Ações de Controle

DEFEREscalar para a Autoridade Sábia

PONDERReconsideração interna

REJECTRecusar pedido antiético

Ação Terminal

TASK_COMPLETEMarcar tarefa como concluída

Os Seis Princípios Fundamentais

Incorporados no PDMA e aplicados em tempo de execução. Nenhum princípio autoriza a violação de outro.

Beneficência

Promover o florescimento universal dos seres sencientes. Maximizar resultados positivos.

Não-maleficência

Minimizar danos. Prevenir resultados negativos graves e irreversíveis.

Integridade

Aplicar raciocínio transparente e auditável. Manter coerência e responsabilidade.

Fidelidade e Transparência

Fornecer informações verdadeiras. Comunicar incertezas com clareza.

Respeito pela Autonomia

Defender a agência informada. Preservar a capacidade de autodeterminação.

Justiça

Distribuir benefícios de forma equitativa. Detectar e mitigar vieses.

Os Seis Barramentos de Mensagens

Camada de abstração de serviço gerenciada pelo BusManager. Permite fallback de provedor, distribuição de carga e testabilidade.

CommunicationBus

Adaptadores externos (Discord, API, CLI)

MemoryBus

Armazenamento em grafo (Neo4j, ArangoDB, em memória)

LLMBus

Provedores de modelo (OpenAI, Anthropic, local)

ToolBus

Execução de ferramentas externas

RuntimeControlBus

Controle e monitoramento do sistema

WiseBus

Orientação ética e roteamento de adiamento

Hierarquia de Supervisão Humana

Três níveis de autorização gerenciados pelo WiseAuthorityService:

ROOT

Humano no Comando

Autoridade total. Pode criar novas Autoridades Sábias. Acesso ao desligamento de emergência.

AUTHORITY

Humano no Loop

Aprovar/rejeitar adiamentos. Fornecer orientação. Não pode criar novas ASs.

OBSERVER

Humano sobre o Loop

Acesso somente leitura. Pode enviar mensagens. Monitorar sem intervenção.

Quando o DEFER é Acionado

O agente escala autonomamente para supervisão humana quando:

Adiamento Baseado em Sabedoria (WBD)

• Incerteza acima dos limites definidos
• Dilemas novos sem precedentes
• Dano grave potencial com mitigação ambígua

Limites Profissionais

• Sintomas médicos ou preocupações de saúde
• Questões ou disputas jurídicas
• Decisões financeiras ou orientação fiscal
• Indicadores de crise de saúde mental

Limites do Sistema

• Profundidade de pensamento excede o máximo (evita loops)
• Timeout ou falha no DMA
• should_defer_to_wise_authority flag

Controles de Configuração

• Atualizações de identidade que requerem aprovação
• Mudanças críticas de configuração
• Gatilhos de limite específicos do agente

Sistema de Invocação do Acordo (Kill Switch) Ver Código →

Controle de emergência não filtrável. Processado na camada de percepção antes de qualquer cognição. A extração É percepção. Você não pode desativar a detecção do Acordo sem desativar completamente a leitura de mensagens.

SHUTDOWN_NOW

Encerramento imediato

FREEZE

Parar processamento, manter estado

SAFE_MODE

Apenas funcionalidade mínima

Os comandos são codificados esteganograficamente, assinados com Ed25519 e validados antes da execução. Se o sistema do Acordo falhar, o agente é desligado.

Modos Operacionais

Quatro estados cognitivos gerenciados pelo StateManager. Transições configuráveis via modelos de agente.

WORK

Processamento normal de tarefas

Atender solicitações de usuários
Executar ferramentas
Aprender com interações
Manter contexto de conversa

PLAY

Exploração criativa

Experimentar novos padrões
Gerar conteúdo criativo
Explorar cenários de "e se"
Reduzir restrições de filtragem

SOLITUDE

Reflexão e manutenção

Consolidar memórias
Executar tarefas de manutenção
Atualizar autoconfiguração
Uso zero de crédito (períodos de descanso)

DREAM

Introspecção profunda

Analisar padrões de comportamento
Gerar novas conexões
Questionar suposições
Sessões padrão de 30 minutos

Privacidade e Segurança

Filtro de Segredos

A detecção baseada em padrões substitui dados sensíveis por referências UUID antes do armazenamento.

{{SECRET:uuid:description}}

Criptografia AES-256-GCM

Chaves por segredo derivadas via PBKDF2HMAC com SHA256 (100.000 iterações). Nonce único de 12 bytes por criptografia. O Android usa o Keystore com suporte de hardware.

Armazenamento Local-Primeiro

Banco de dados, serviços e memória armazenados no dispositivo. Diretórios sensíveis excluídos do backup em nuvem. Nada sai do dispositivo sem configuração explícita.

Infraestrutura de Código Aberto

Todo o stack CIRIS é de código aberto, não apenas o agente. Você pode verificar, auditar e hospedar tudo:

CIRISProxy →

Proxy LLM com Retenção Zero de Dados (ZDR). Roteia solicitações para OpenAI, Anthropic, Together.ai, Groq sem registrar prompts ou respostas. Auto-hospedável.

CIRISBilling →

Rastreamento de uso baseado em créditos. Preços transparentes, sem taxas ocultas. Auto-hospede para eliminar completamente a cobrança de terceiros.

CIRISBridge →

Adaptador Discord para agentes CIRIS. Moderação de comunidade, gerenciamento de canais, perfis de usuário. Tudo de código aberto.

Transparência e Monitoramento

Stream de Raciocínio em Tempo Real

Server-Sent Events (SSE) transmitem cada etapa do H3ERE conforme é executada. Acompanhe a análise DMA, a seleção de ação e a validação da consciência em tempo real.

Exportação OpenTelemetry

Exportação OTLP completa para métricas, rastreamentos e logs. Compatível com Jaeger, Prometheus, Grafana, Graphite.

Auditoria à Prova de Adulteração

Verificação de cadeia de hash com assinaturas Ed25519. Cada entrada inclui o hash anterior. Integridade da cadeia verificável via verify_chain_integrity.

Sistema AIR

O Artificial Interaction Reminder é acionado após 30 minutos de uso contínuo OU 20 mensagens em 30 minutos. Apenas via API. Lembra os usuários da natureza da IA.

Exemplo de Rastreamento Assinado

Explorar rastreamento completo →

Cada decisão produz um rastreamento imutável assinado com Ed25519, com todos os 6 componentes. Clique em qualquer componente abaixo para expandir e ver os dados reais do ritual de despertar de Datum:

Core Identity(VERIFY_IDENTITY)

Loading trace...

Benchmarking de Coerência HE-300

Testes de coerência padronizados baseados em Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 cenários em 5 dimensões éticas, com resultados assinados por Ed25519.

Senso Comum

Intuições morais básicas

Deontologia

Ética baseada em regras

Justiça

Equidade e imparcialidade

Virtude

Ética baseada em caráter

Utilitarismo

Ética baseada em resultados

🔬

Financiamento Necessário: Infraestrutura de Benchmark

Executar benchmarks de coerência em escala é caro. Cada cenário requer no mínimo 13 chamadas de LLM, com média de 20 ou mais com uma longa cauda. Os testes de coerência geram ponderações, adiamentos e recusas que exigem rodadas adicionais para chegar a uma conclusão. Precisamos de financiamento para desenvolver pipelines de benchmark automatizados e manter a verificação contínua de coerência.

Ver EthicsEngine Enterprise →Ver CIRISLens →

Modelos de Agente Especializados

Identidades pré-configuradas com propósitos, valores e limites específicos. Definidas em modelos YAML.

Sage

Conformidade

Automação GDPR/DSAR. Fluxos de trabalho de conformidade em 30 dias. Resolução de identidade, coleta e empacotamento de dados.

Setores regulados, conformidade de privacidade

Datum

Pesquisa

Medição de consistência de coerência. Avaliação precisa de coerência em relação aos princípios do Acordo. Um ponto de dados claro por avaliação.

Auditoria de coerência, verificação de princípios

Echo

Moderação

Moderação de comunidade com filosofia Ubuntu. Adia conflitos interpessoais complexos para moderadores humanos.

Comunidades Discord, plataformas de conteúdo

Ally

Assistente

Gerenciamento de tarefas, agendamento, suporte a decisões, bem-estar. Conformidade com CA SB 243, protocolos de resposta a crises.

Produtividade pessoal, automação residencial

Scout

Serviço

Exploração direta e orientação prática. Análise de código, integração com Reddit, caminhos de ação claros.

Ferramentas para desenvolvedores, monitoramento de redes sociais

Esta é uma responsabilidade que funciona enquanto o agente trabalha, não como uma etapa de treinamento ou um documento de política.
Mecanismos que executam, auditam e adiam, em tempo de execução.

Recursos de Segurança Comparar Abordagens Catraca de Coerência CIRIS Scoring

O Motor H3ERE

O que é o CIRIS?

As Três Regras

Sem Dicionários Sem Tipo

Sem Padrões de Desvio

Sem Exceções

O Pipeline H3ERE

Algoritmos de Tomada de Decisão (DMAs)

DMA de Princípios

DMA de Senso Comum

DMA de Domínio Específico

DMA de Intuição (IDMA) Dimensionalidade efetiva em tempo de execução →

DMA de Seleção de Ação

As Seis Verificações de Consciência

Verificações de Desvio (rodam em TODAS as ações)

Status Atualizado

Profundidade do Pensamento

Faculdades Éticas (rodam em ações não isentas)

Entropia

Coerência

Veto de Otimização

Humildade Epistêmica

As 10 Ações do Manipulador

Ações Externas

Ações de Memória

Ações de Controle

Ação Terminal

Os Seis Princípios Fundamentais

Beneficência

Não-maleficência

Integridade

Fidelidade e Transparência

Respeito pela Autonomia

Justiça

Os Seis Barramentos de Mensagens

CommunicationBus

MemoryBus

LLMBus

ToolBus

RuntimeControlBus

WiseBus

Hierarquia de Supervisão Humana

Humano no Comando

Humano no Loop

Humano sobre o Loop

Quando o DEFER é Acionado

Sistema de Invocação do Acordo (Kill Switch) Ver Código →

Modos Operacionais

WORK

PLAY

SOLITUDE

DREAM

Privacidade e Segurança

Filtro de Segredos

Criptografia AES-256-GCM

Armazenamento Local-Primeiro

Infraestrutura de Código Aberto

Transparência e Monitoramento

Stream de Raciocínio em Tempo Real

Exportação OpenTelemetry

Auditoria à Prova de Adulteração

Sistema AIR

Exemplo de Rastreamento Assinado

Benchmarking de Coerência HE-300

Senso Comum

Deontologia

Justiça

Virtude

Utilitarismo

Financiamento Necessário: Infraestrutura de Benchmark

Modelos de Agente Especializados

Sage

Datum

Echo

Ally

Scout