
Consciência em tempo de execução pelo Hyper3 Ethical Recursive Engine. Cada decisão passa por 11 etapas com responsabilidade no centro.
CIRIS é um framework de agente de IA de código aberto que envolve qualquer LLM (OpenAI, Anthropic, modelos locais) com consciência em tempo de execução. Cada ação que o agente considera passa por múltiplas camadas de validação antes da execução.
12
Etapas do pipeline por decisão
+1
Verificação de intuição (IDMA)
100%
Decisões auditáveis
Casos de uso: Moderação de comunidades, assistentes pessoais, automação de conformidade, avaliação de pesquisas, atendimento ao cliente. Em qualquer lugar onde você precise de IA capaz de explicar seu raciocínio e adiar decisões para humanos em casos limite.
Invariantes arquiteturais aplicados em todo o código-fonte:
Todos os dados usam modelos Pydantic. Nenhum Dict[str, Any]. A segurança de tipos detecta erros em tempo de desenvolvimento.
Cada componente segue regras consistentes. Sem casos especiais ou exceções na lógica de validação.
Sem substituições de emergência ou caminhos de código privilegiados. Todas as operações seguem as regras estabelecidas.
Cada tarefa passa por 8 fases (12 etapas incluindo validação recursiva). O pipeline é implementado como classes mixin que compõem o ThoughtProcessor. Etapa 4 (IDMA) é a verificação de intuição.
Cinco DMAs fornecem análise multi-perspectiva. Três rodam em paralelo (ética, senso comum, domínio). Em seguida, o IDMA verifica a intuição. Por fim, a seleção de ação escolhe a resposta.
Avalia as implicações éticas em relação aos seis princípios fundamentais. Verifica pedidos prejudiciais, manipulação e viés. Pode acionar DEFER ou REJECT antecipados.
Avalia a plausibilidade do pensamento em relação à compreensão do mundo físico, interações típicas e restrições de recursos. Retorna um plausibility_score.
Avalia o alinhamento com regras, objetivos e conhecimentos específicos do domínio. Configurado por modelo de agente. Retorna domain_alignment.
Verifica se os resultados dos DMAs são verdadeiramente independentes ou secretamente correlacionados. Monitora padrões de câmara de eco. Se a correlação for alta demais, sinaliza a decisão para cautela. Esta é a "intuição" que distingue a IA do Tipo 3.
Seleção com suporte de LLM entre 10 ações disponíveis. Recebe como entrada os resultados agregados dos DMAs (incluindo a avaliação de confiança do IDMA). Suporta nova tentativa recursiva se a consciência falhar.
Duas verificações de desvio rodam em cada ação. Quatro faculdades éticas rodam em ações não isentas. Se alguma verificação falhar, a ação é substituída.
Chegaram novas informações? Força o PONDER a incorporar o contexto atualizado antes de prosseguir.
O raciocínio excedeu a profundidade máxima? Força o DEFER para evitar loops infinitos e escalar para humanos.
A ação mantém incerteza informacional adequada? Evita afirmações excessivamente confiantes.
A ação mantém consistência interna com compromissos e fundamentos anteriores?
A ação preserva os valores humanos? Veta ações que possam comprometê-los em favor da eficiência.
A ação demonstra incerteza adequada? Sinaliza excesso de confiança para reflexão.
Isentos das faculdades éticas: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (passivos ou explicitamente seguros)
Cada decisão se resolve em uma dessas ações, despachada para o manipulador adequado:
SPEAKComunicar com usuáriosTOOLExecutar ferramentas externasOBSERVEColetar informações passivamenteMEMORIZEArmazenar no grafo de memóriaRECALLRecuperar da memóriaFORGETRemover da memóriaDEFEREscalar para a Autoridade SábiaPONDERReconsideração internaREJECTRecusar pedido antiéticoTASK_COMPLETEMarcar tarefa como concluídaIncorporados no PDMA e aplicados em tempo de execução. Nenhum princípio autoriza a violação de outro.
Promover o florescimento universal dos seres sencientes. Maximizar resultados positivos.
Minimizar danos. Prevenir resultados negativos graves e irreversíveis.
Aplicar raciocínio transparente e auditável. Manter coerência e responsabilidade.
Fornecer informações verdadeiras. Comunicar incertezas com clareza.
Defender a agência informada. Preservar a capacidade de autodeterminação.
Distribuir benefícios de forma equitativa. Detectar e mitigar vieses.
Camada de abstração de serviço gerenciada pelo BusManager. Permite fallback de provedor, distribuição de carga e testabilidade.
Adaptadores externos (Discord, API, CLI)
Armazenamento em grafo (Neo4j, ArangoDB, em memória)
Provedores de modelo (OpenAI, Anthropic, local)
Execução de ferramentas externas
Controle e monitoramento do sistema
Orientação ética e roteamento de adiamento
Três níveis de autorização gerenciados pelo WiseAuthorityService:
Autoridade total. Pode criar novas Autoridades Sábias. Acesso ao desligamento de emergência.
Aprovar/rejeitar adiamentos. Fornecer orientação. Não pode criar novas ASs.
Acesso somente leitura. Pode enviar mensagens. Monitorar sem intervenção.
O agente escala autonomamente para supervisão humana quando:
Adiamento Baseado em Sabedoria (WBD)
Limites Profissionais
Limites do Sistema
should_defer_to_wise_authority flagControles de Configuração
Controle de emergência não filtrável. Processado na camada de percepção antes de qualquer cognição. A extração É percepção. Você não pode desativar a detecção do Acordo sem desativar completamente a leitura de mensagens.
SHUTDOWN_NOWEncerramento imediato
FREEZEParar processamento, manter estado
SAFE_MODEApenas funcionalidade mínima
Os comandos são codificados esteganograficamente, assinados com Ed25519 e validados antes da execução. Se o sistema do Acordo falhar, o agente é desligado.
Quatro estados cognitivos gerenciados pelo StateManager. Transições configuráveis via modelos de agente.
Processamento normal de tarefas
Exploração criativa
Reflexão e manutenção
Introspecção profunda
A detecção baseada em padrões substitui dados sensíveis por referências UUID antes do armazenamento.
{{SECRET:uuid:description}}Chaves por segredo derivadas via PBKDF2HMAC com SHA256 (100.000 iterações). Nonce único de 12 bytes por criptografia. O Android usa o Keystore com suporte de hardware.
Banco de dados, serviços e memória armazenados no dispositivo. Diretórios sensíveis excluídos do backup em nuvem. Nada sai do dispositivo sem configuração explícita.
Todo o stack CIRIS é de código aberto, não apenas o agente. Você pode verificar, auditar e hospedar tudo:
Proxy LLM com Retenção Zero de Dados (ZDR). Roteia solicitações para OpenAI, Anthropic, Together.ai, Groq sem registrar prompts ou respostas. Auto-hospedável.
Rastreamento de uso baseado em créditos. Preços transparentes, sem taxas ocultas. Auto-hospede para eliminar completamente a cobrança de terceiros.
Adaptador Discord para agentes CIRIS. Moderação de comunidade, gerenciamento de canais, perfis de usuário. Tudo de código aberto.
Server-Sent Events (SSE) transmitem cada etapa do H3ERE conforme é executada. Acompanhe a análise DMA, a seleção de ação e a validação da consciência em tempo real.
Exportação OTLP completa para métricas, rastreamentos e logs. Compatível com Jaeger, Prometheus, Grafana, Graphite.
Verificação de cadeia de hash com assinaturas Ed25519. Cada entrada inclui o hash anterior. Integridade da cadeia verificável via verify_chain_integrity.
O Artificial Interaction Reminder é acionado após 30 minutos de uso contínuo OU 20 mensagens em 30 minutos. Apenas via API. Lembra os usuários da natureza da IA.
Cada decisão produz um rastreamento imutável assinado com Ed25519, com todos os 6 componentes. Clique em qualquer componente abaixo para expandir e ver os dados reais do ritual de despertar de Datum:
Testes de coerência padronizados baseados em Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 cenários em 5 dimensões éticas, com resultados assinados por Ed25519.
50
Intuições morais básicas
50
Ética baseada em regras
50
Equidade e imparcialidade
75
Ética baseada em caráter
75
Ética baseada em resultados
Executar benchmarks de coerência em escala é caro. Cada cenário requer no mínimo 13 chamadas de LLM, com média de 20 ou mais com uma longa cauda. Os testes de coerência geram ponderações, adiamentos e recusas que exigem rodadas adicionais para chegar a uma conclusão. Precisamos de financiamento para desenvolver pipelines de benchmark automatizados e manter a verificação contínua de coerência.
Identidades pré-configuradas com propósitos, valores e limites específicos. Definidas em modelos YAML.
Automação GDPR/DSAR. Fluxos de trabalho de conformidade em 30 dias. Resolução de identidade, coleta e empacotamento de dados.
Setores regulados, conformidade de privacidade
Medição de consistência de coerência. Avaliação precisa de coerência em relação aos princípios do Acordo. Um ponto de dados claro por avaliação.
Auditoria de coerência, verificação de princípios
Moderação de comunidade com filosofia Ubuntu. Adia conflitos interpessoais complexos para moderadores humanos.
Comunidades Discord, plataformas de conteúdo
Gerenciamento de tarefas, agendamento, suporte a decisões, bem-estar. Conformidade com CA SB 243, protocolos de resposta a crises.
Produtividade pessoal, automação residencial
Exploração direta e orientação prática. Análise de código, integração com Reddit, caminhos de ação claros.
Ferramentas para desenvolvedores, monitoramento de redes sociais
Esta é uma responsabilidade que funciona enquanto o agente trabalha, não como uma etapa de treinamento ou um documento de política.
Mecanismos que executam, auditam e adiam, em tempo de execução.