
Se você não pode verificar a responsabilidade, é marketing. Veja o que procurar e como as abordagens existentes se comparam.
A consciência é necessária. Mas não é suficiente.
Algumas IAs não têm regras nenhuma. Outras seguem regras, mas não percebem quando suas fontes estão apenas repetindo umas às outras. Só um tipo verifica se as informações realmente vêm de lugares diferentes.
Sem princípios publicados. Sem registro de ações. Código fechado. Você não pode checar o que fez nem por quê.
A maioria dos assistentes de IA para consumidores (ChatGPT, Gemini) se encaixa aqui do ponto de vista de responsabilidade pública. Podem existir boas práticas internas; você não tem como verificar.
Exige regulação externa. Não consegue se autogerir.
Segue regras éticas. Mas não consegue perceber quando todas as suas fontes estão apenas copiando umas às outras, então pode estar confiante e errada.
Segura quando supervisionada. Não detecta câmaras de eco por conta própria.
Segue regras éticas E verifica se as informações vêm de lugares genuinamente diferentes. Quando o consenso parece suspeito, sinaliza antes de agir.
É isso que o CIRIS constrói.
Uma IA pode seguir todas as regras, passar em todas as auditorias e ainda assim falhar se todas as suas informações vierem do mesmo lugar. Esse ponto cego é o que o CIRIS foi criado para corrigir.
São essas as coisas que tornam a IA auditável e responsável. As primeiras seis tratam de fazer a coisa certa. A sétima é para identificar situações em que 'fazer a coisa certa' se baseia em informações ruins.
O agente deve seguir um framework ético público. Não são regras escondidas: é um documento que qualquer pessoa pode ler e usar para cobrar responsabilidade.
Toda ação passa por uma verificação de consciência antes de ser executada. Não depois. Antes.
Diante de incerteza ou possível dano, o agente consulta uma pessoa em vez de adivinhar. Integrado ao fluxo de trabalho, não opcional.
Cada decisão é registrada e assinada para que você possa verificar exatamente o que aconteceu e por quê. Um recibo para cada ação.
O consentimento vai nos dois sentidos. Você pode dizer não ao agente. O agente pode dizer não a você. Nenhum dos lados é forçado a ceder.
Não dá para auditar o que não se pode ver. O CIRIS é totalmente open source sob AGPL-3.0. Qualquer pessoa pode ler, verificar e melhorar o código.
O que as regras sozinhas não conseguem capturar.
Antes de agir, o agente pergunta: "Minhas fontes realmente discordam entre si, ou todas estão tirando as informações do mesmo lugar?" Dez fontes que copiaram do mesmo original são, na prática, apenas uma fonte. Quando o consenso parece uniforme demais, o agente sinaliza para uma pessoa revisar.
Barulho Demais
As fontes se contradizem tanto que nada útil pode ser concluído.
Saudável
As fontes realmente divergem. Um consenso real significa algo.
Câmara de Eco
Parece consenso, mas as fontes estão apenas se repetindo.
É isso que diferencia o CIRIS de outros frameworks de responsabilidade para IA.
Quer a matemática? Leia a tese completa →Com base em documentação publicamente disponível em fevereiro de 2026. Se nos enganamos em algo ou deixamos algo de fora, nos avise.
| Projeto | Verifica Cada Decisão | Regras Publicadas | Consciência Integrada | Prova do Que Fez | Código Aberto | Detecção de Câmara de Eco |
|---|---|---|---|---|---|---|
| CIRIS | Sim | Sim | Sim | Sim | AGPL-3.0 | Sim |
| Constitutional AI | Somente no treinamento | Implícita | Não | Não | Não | Não |
| LlamaFirewall / NeMo Guardrails | Sim | Não | Não | Registro | Sim | Não |
| HatCat | Sim | Parcial | Direcionamento | Parcial | CC0 | Não |
| Conselhos de Ética / Frameworks de Governança | Não | Sim | Não | Manual | Varia | Não |
Filtros de saída e frameworks de governança resolvem problemas importantes, mas diferentes. Filtros bloqueiam saídas prejudiciais. A consciência raciocina sobre valores. O CIRIS busca fazer os dois, e capturar os pontos cegos que nenhum dos dois aborda sozinho.
Bloqueiam saídas perigosas: injeção de prompt, conteúdo prejudicial, ataques adversariais. Como um filtro que retém coisas ruins na saída.
Raciocina sobre se uma ação é certa, não apenas se é segura. Como um juiz que pondera a situação antes de decidir.
Verifica se o consenso é real ou apenas repetição. Como um verificador de fatos que pergunta: 'todos leram o mesmo artigo?'
Muitos agentes menores, cada um vinculado a princípios publicados, cada um auditável, cada um deferindo à autoridade humana. Nenhuma empresa ou entidade controla toda a estrutura. Quanto mais independentes os agentes, mais difícil fica para qualquer falha se propagar.
Esta é uma pesquisa ativa. Somos transparentes sobre o que está estabelecido e o que ainda está sendo testado.
Bem estabelecido
Ainda sendo testado
Veja o Raciocínio em Ação
Acompanhe o raciocínio de um agente real passo a passo. Explore um rastreamento →
Verifique a Identidade
Veja como os agentes provam quem são, como um cartório para IA. Confiança e identidade →
Comece Agora
Implante seu primeiro agente ou leia a tese em linguagem simples. Primeiro contato →
Cada afirmação nesta página é respaldada por código que você pode ler, rastreamentos que pode verificar e pesquisas que pode checar. Esse é o ponto.