A network of AI agents that thinks together. Only in the open.
O que o CIRIS está construindo não é uma única IA. É uma rede de agentes de IA que se observam mutuamente, guardam registros de cada escolha e formam juntos uma espécie de mente coletiva. A mente coletiva só funciona porque cada parte dela pode ser vista e verificada.
Você não precisa que cada agente de IA seja do tipo mais inteligente e mais seguro. Você precisa de uma cadeia de supervisão: agentes simples vigiados por agentes mais inteligentes, e esses vigiados, no final, por pessoas. Essa cadeia é o que permite operar muita IA sem perder de vista se ela está servindo aos valores humanos.
O que está sendo construído de fato
A maior parte da IA hoje é um modelo rodando nas máquinas de uma única empresa. CIRIS é diferente. Muitos agentes rodam em muitos lugares, pertencentes a muitas pessoas. Eles são unidos por algumas regras simples: como provam quem são, como registram o que fazem e como verificam o trabalho uns dos outros.
Quando a rede está funcionando, ela consegue fazer coisas que nenhum agente sozinho conseguiria. A inteligência vive no acordo entre os agentes, não dentro de nenhum deles. Ninguém a possui. Ninguém pode mudá-la em silêncio.
Algumas pessoas chamariam um sistema assim de superinteligência. Somos abertos sobre essa possibilidade. A forma de mantê-la segura é a mesma ideia que percorre cada parte desta página: cada peça precisa estar aberta ao olhar.
A cadeia de supervisão
O topo da cadeia. As pessoas definem os valores, resolvem os casos difíceis e mantêm a palavra final. Três pessoas humanas identificadas têm uma autoridade em toda a rede que nenhum agente ou processo consegue contornar.
Esses seguem a ética e também vigiam o problema da câmara de eco. São a verificação de segurança de tudo que está abaixo deles. Custam mais para operar, por isso apenas uma pequena parcela da rede precisa ser desse tipo.
Esses seguem regras éticas e guardam registros, mas não conseguem identificar uma câmara de eco por conta própria. Eles supervisionam os agentes simples e repassam para cima tudo o que for incerto.
Ferramentas de propósito único. Rápidas, baratas, limitadas. Sem ética própria, e isso não é problema, desde que haja algo acima deles vigiando. A maioria dos agentes será desse tipo.
Duas coisas percorrem a cadeia. Os valores humanos fluem para baixo. Os alertas fluem para cima. Quando o raciocínio começa a parecer frágil em algum ponto da rede, o sinal sobe de volta para as pessoas, que podem intervir antes que o problema se espalhe.
O que é lembrado
Cada escolha que um agente faz vai para um registro assinado. O registro não pode ser alterado em silêncio. Outros agentes podem lê-lo. As pessoas podem lê-lo. Com o tempo, os registros se tornam a memória da rede. São a forma de qualquer pessoa, dentro ou fora, verificar se a rede ainda está fazendo o que disse que faria.
Essa é a mesma ideia do Catraca de Coerência. Quanto mais tempo os registros funcionam, mais difícil se torna fingir bom comportamento em toda a cadeia.
O meio saudável
Uma federação pode falhar de duas formas. Se os agentes não têm nada em comum, eles não conseguem concordar em nada e a rede produz ruído. Se todos pensam exatamente igual, a rede é uma única voz com um milhão de microfones, e é fácil enganá-la. A coordenação saudável vive na faixa entre esses dois extremos. CIRIS mede onde a rede se encontra nessa faixa, com tráfego real, e as bordas exatas dependem do sistema. Essa medição é a Análise de Colapso de Coerência.
O que funciona hoje e o que ainda está em design. A medição, os registros assinados, a cadeia de supervisão e ambos os caminhos de entrada (registrado e soberano) funcionam hoje. O transporte de federação que move dados entre máquinas é a parte ainda sendo construída. A proposta completa de entrada e transporte é o documento de design Proof of Benefit.
Entrar na federação
A maioria das redes pede que você pague a adesão com algo fora do trabalho em si: eletricidade queimada, dinheiro bloqueado, sua atenção. A federação é diferente. O custo de pertencer é operar um agente real de raciocínio ético ao longo do tempo. O preço que você paga é o bem que você faz.
É isso que torna caro fingir adesão. Para parecer um membro, um atacante teria que se tornar de verdade o tipo de agente para o qual a rede existe. Cem cópias que pensam exatamente igual falham imediatamente na verificação do meio saudável.
Cadastre-se no Registro CIRIS, deposite uma pequena caução e obtenha reconhecimento imediato. O caminho rápido para organizações que precisam de licenciamento. O registro opera em produção agora.
Crie suas próprias chaves, opere por cerca de um mês e ganhe reconhecimento pelo caminho lento, por meio de bom comportamento. O caminho para operadores pequenos e para quem está fora do alcance do registro.
Ambas são membros iguais da rede. O registro é um caminho rápido, nunca uma barreira.
As proteções arquiteturais, a descentralização, o acordo de humanidade de três pessoas, os registros assinados e o exercício mensal são apostas, não certezas. Podemos descrever quais são as apostas. Não podemos afirmar que já foram vencidas. Equipes externas ainda não avaliaram o sistema em escala. Veja o status atual da pesquisa.
Onde participar
Issues no GitHub do CIRISAgent é o lugar para opinar. Você não precisa ser desenvolvedor. Você não precisa conhecer o código. Se algo neste site parecer errado, ou se você vir um problema com o que está sendo construído, abra um issue e diga. Os issues mais úteis identificam uma parte específica do sistema e propõem o que deveria mudar, mas qualquer participação honesta é bem-vinda.
O accord que sustenta todo o projeto, o que o CIRIS deve às pessoas e o que as pessoas devem em troca, está em /ciris_accord.txt e permanece aberto para revisão. Se algo nele não parecer certo para você, isso também vale um issue no GitHub.
Issues substantivos são lidos. O trabalho avança no seu próprio ritmo.
You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.