Primeiro ContatoInstalarCatraca de CoerênciaFederaçãoCompararPesquisaAcordoGitHub
Esta página foi traduzida por máquina. Se algo parecer errado, abra um issue — o repositório é público por uma razão. Reportar um problema de tradução
Background Image
A IA Mais Segura e Ética em Produção Hoje

Sem responsabilidade, a IA tende a extrair mais do que oferece.

Se você não pode verificar a responsabilidade, é marketing. Veja o que procurar e como as abordagens existentes se comparam.

Três Tipos de IA

A consciência é necessária. Mas não é suficiente.

Algumas IAs não têm regras nenhuma. Outras seguem regras, mas não percebem quando suas fontes estão apenas repetindo umas às outras. Só um tipo verifica se as informações realmente vêm de lugares diferentes.

1

Sem Regras

Sem princípios publicados. Sem registro de ações. Código fechado. Você não pode checar o que fez nem por quê.

A maioria dos assistentes de IA para consumidores (ChatGPT, Gemini) se encaixa aqui do ponto de vista de responsabilidade pública. Podem existir boas práticas internas; você não tem como verificar.

Exige regulação externa. Não consegue se autogerir.

2

Regras, Sem Consciência

Segue regras éticas. Mas não consegue perceber quando todas as suas fontes estão apenas copiando umas às outras, então pode estar confiante e errada.

Segura quando supervisionada. Não detecta câmaras de eco por conta própria.

3

Regras + Consciência

Segue regras éticas E verifica se as informações vêm de lugares genuinamente diferentes. Quando o consenso parece suspeito, sinaliza antes de agir.

É isso que o CIRIS constrói.

Uma IA pode seguir todas as regras, passar em todas as auditorias e ainda assim falhar se todas as suas informações vierem do mesmo lugar. Esse ponto cego é o que o CIRIS foi criado para corrigir.

Sete Coisas para Verificar

Seis para ética. Uma para pontos cegos.

São essas as coisas que tornam a IA auditável e responsável. As primeiras seis tratam de fazer a coisa certa. A sétima é para identificar situações em que 'fazer a coisa certa' se baseia em informações ruins.

1. Princípios Publicados

O agente deve seguir um framework ético público. Não são regras escondidas: é um documento que qualquer pessoa pode ler e usar para cobrar responsabilidade.

2. Verificação de Consciência em Cada Decisão

Toda ação passa por uma verificação de consciência antes de ser executada. Não depois. Antes.

3. Consulta Humanos Quando em Dúvida

Diante de incerteza ou possível dano, o agente consulta uma pessoa em vez de adivinhar. Integrado ao fluxo de trabalho, não opcional.

4. Prova do Que Fez

Cada decisão é registrada e assinada para que você possa verificar exatamente o que aconteceu e por quê. Um recibo para cada ação.

5. Consentimento em Dois Sentidos

O consentimento vai nos dois sentidos. Você pode dizer não ao agente. O agente pode dizer não a você. Nenhum dos lados é forçado a ceder.

6. Código Aberto

Não dá para auditar o que não se pode ver. O CIRIS é totalmente open source sob AGPL-3.0. Qualquer pessoa pode ler, verificar e melhorar o código.

7

Detecção de Câmara de Eco

O que as regras sozinhas não conseguem capturar.

Antes de agir, o agente pergunta: "Minhas fontes realmente discordam entre si, ou todas estão tirando as informações do mesmo lugar?" Dez fontes que copiaram do mesmo original são, na prática, apenas uma fonte. Quando o consenso parece uniforme demais, o agente sinaliza para uma pessoa revisar.

Barulho Demais

As fontes se contradizem tanto que nada útil pode ser concluído.

Saudável

As fontes realmente divergem. Um consenso real significa algo.

Câmara de Eco

Parece consenso, mas as fontes estão apenas se repetindo.

É isso que diferencia o CIRIS de outros frameworks de responsabilidade para IA.

Quer a matemática? Leia a tese completa →

O Cenário Atual

Projetos diferentes, objetivos diferentes.

Com base em documentação publicamente disponível em fevereiro de 2026. Se nos enganamos em algo ou deixamos algo de fora, nos avise.

ProjetoVerifica Cada DecisãoRegras PublicadasConsciência IntegradaProva do Que FezCódigo AbertoDetecção de Câmara de Eco
CIRISSimSimSimSimAGPL-3.0Sim
Constitutional AISomente no treinamentoImplícitaNãoNãoNãoNão
LlamaFirewall / NeMo GuardrailsSimNãoNãoRegistroSimNão
HatCatSimParcialDirecionamentoParcialCC0Não
Conselhos de Ética / Frameworks de GovernançaNãoSimNãoManualVariaNão

Filtros de saída e frameworks de governança resolvem problemas importantes, mas diferentes. Filtros bloqueiam saídas prejudiciais. A consciência raciocina sobre valores. O CIRIS busca fazer os dois, e capturar os pontos cegos que nenhum dos dois aborda sozinho.

Três Camadas de Proteção

Cada uma resolve um problema diferente.

Filtros de Saída

Bloqueiam saídas perigosas: injeção de prompt, conteúdo prejudicial, ataques adversariais. Como um filtro que retém coisas ruins na saída.

Consciência Ética

Raciocina sobre se uma ação é certa, não apenas se é segura. Como um juiz que pondera a situação antes de decidir.

Detecção de Câmara de Eco

Verifica se o consenso é real ou apenas repetição. Como um verificador de fatos que pergunta: 'todos leram o mesmo artigo?'

Muitos Agentes Coerentes

Governança distribuída, não poder concentrado.

Sem Ponto Único de Falha

Agentes menores, cada um responsável.

Muitos agentes menores, cada um vinculado a princípios publicados, cada um auditável, cada um deferindo à autoridade humana. Nenhuma empresa ou entidade controla toda a estrutura. Quanto mais independentes os agentes, mais difícil fica para qualquer falha se propagar.

Status da Pesquisa

Esta é uma pesquisa ativa. Somos transparentes sobre o que está estabelecido e o que ainda está sendo testado.

Bem estabelecido

  • - Fontes copiadas reduzem a diversidade real
  • - Modelos de IA compartilham sobreposição nos dados de treinamento
  • - Câmaras de eco criam falsa confiança
  • - Verificação independente detecta mais erros

Ainda sendo testado

  • - Medir com precisão o quanto as fontes de IA são copiadas
  • - Melhores limites para sinalizar câmaras de eco
  • - O quanto as intervenções reduzem a cópia
  • - Como isso varia em diferentes áreas

Experimente Você Mesmo

Verifique Você Mesmo.

Código aberto. Aberto ao escrutínio.

Cada afirmação nesta página é respaldada por código que você pode ler, rastreamentos que pode verificar e pesquisas que pode checar. Esse é o ponto.