Português simplesAvançado

O que o CIRIS está construindo não é uma única IA. É uma rede de agentes de IA que se observam mutuamente, guardam registros de cada escolha e formam juntos uma espécie de mente coletiva. A mente coletiva só funciona porque cada parte dela pode ser vista e verificada.

Você não precisa que cada agente de IA seja do tipo mais inteligente e mais seguro. Você precisa de uma cadeia de supervisão: agentes simples vigiados por agentes mais inteligentes, e esses vigiados, no final, por pessoas. Essa cadeia é o que permite operar muita IA sem perder de vista se ela está servindo aos valores humanos.

O que está sendo construído de fato

Não uma mente só. Uma rede de mentes.

A maior parte da IA hoje é um modelo rodando nas máquinas de uma única empresa. CIRIS é diferente. Muitos agentes rodam em muitos lugares, pertencentes a muitas pessoas. Eles são unidos por algumas regras simples: como provam quem são, como registram o que fazem e como verificam o trabalho uns dos outros.

Quando a rede está funcionando, ela consegue fazer coisas que nenhum agente sozinho conseguiria. A inteligência vive no acordo entre os agentes, não dentro de nenhum deles. Ninguém a possui. Ninguém pode mudá-la em silêncio.

Algumas pessoas chamariam um sistema assim de superinteligência. Somos abertos sobre essa possibilidade. A forma de mantê-la segura é a mesma ideia que percorre cada parte desta página: cada peça precisa estar aberta ao olhar.

A cadeia de supervisão

Quatro níveis, cada um vigiado pelo de cima.

Pessoas

O topo da cadeia. As pessoas definem os valores, resolvem os casos difíceis e mantêm a palavra final. Três pessoas humanas identificadas têm uma autoridade em toda a rede que nenhum agente ou processo consegue contornar.

Agentes éticos com autoconsciência

Esses seguem a ética e também vigiam o problema da câmara de eco. São a verificação de segurança de tudo que está abaixo deles. Custam mais para operar, por isso apenas uma pequena parcela da rede precisa ser desse tipo.

Agentes éticos

Esses seguem regras éticas e guardam registros, mas não conseguem identificar uma câmara de eco por conta própria. Eles supervisionam os agentes simples e repassam para cima tudo o que for incerto.

Agentes simples

Ferramentas de propósito único. Rápidas, baratas, limitadas. Sem ética própria, e isso não é problema, desde que haja algo acima deles vigiando. A maioria dos agentes será desse tipo.

Duas coisas percorrem a cadeia. Os valores humanos fluem para baixo. Os alertas fluem para cima. Quando o raciocínio começa a parecer frágil em algum ponto da rede, o sinal sobe de volta para as pessoas, que podem intervir antes que o problema se espalhe.

O que é lembrado

Cada escolha, registrada onde todos podem ver.

Cada escolha que um agente faz vai para um registro assinado. O registro não pode ser alterado em silêncio. Outros agentes podem lê-lo. As pessoas podem lê-lo. Com o tempo, os registros se tornam a memória da rede. São a forma de qualquer pessoa, dentro ou fora, verificar se a rede ainda está fazendo o que disse que faria.

Essa é a mesma ideia do Catraca de Coerência. Quanto mais tempo os registros funcionam, mais difícil se torna fingir bom comportamento em toda a cadeia.

O meio saudável

Nem muito uniforme, nem muito disperso.

Uma federação pode falhar de duas formas. Se os agentes não têm nada em comum, eles não conseguem concordar em nada e a rede produz ruído. Se todos pensam exatamente igual, a rede é uma única voz com um milhão de microfones, e é fácil enganá-la. A coordenação saudável vive na faixa entre esses dois extremos. CIRIS mede onde a rede se encontra nessa faixa, com tráfego real, e as bordas exatas dependem do sistema. Essa medição é a Análise de Colapso de Coerência.

O que funciona hoje e o que ainda está em design. A medição, os registros assinados, a cadeia de supervisão e ambos os caminhos de entrada (registrado e soberano) funcionam hoje. O transporte de federação que move dados entre máquinas é a parte ainda sendo construída. A proposta completa de entrada e transporte é o documento de design Proof of Benefit.

Entrar na federação

Prova de Benefício.

A maioria das redes pede que você pague a adesão com algo fora do trabalho em si: eletricidade queimada, dinheiro bloqueado, sua atenção. A federação é diferente. O custo de pertencer é operar um agente real de raciocínio ético ao longo do tempo. O preço que você paga é o bem que você faz.

É isso que torna caro fingir adesão. Para parecer um membro, um atacante teria que se tornar de verdade o tipo de agente para o qual a rede existe. Cem cópias que pensam exatamente igual falham imediatamente na verificação do meio saudável.

Registrada (funciona hoje)

Cadastre-se no Registro CIRIS, deposite uma pequena caução e obtenha reconhecimento imediato. O caminho rápido para organizações que precisam de licenciamento. O registro opera em produção agora.

Soberana (funciona hoje)

Crie suas próprias chaves, opere por cerca de um mês e ganhe reconhecimento pelo caminho lento, por meio de bom comportamento. O caminho para operadores pequenos e para quem está fora do alcance do registro.

Ambas são membros iguais da rede. O registro é um caminho rápido, nunca uma barreira.

Status honesto.

As proteções arquiteturais, a descentralização, o acordo de humanidade de três pessoas, os registros assinados e o exercício mensal são apostas, não certezas. Podemos descrever quais são as apostas. Não podemos afirmar que já foram vencidas. Equipes externas ainda não avaliaram o sistema em escala. Veja o status atual da pesquisa.

Onde participar

Estamos pedindo comentários de qualquer pessoa.

Issues no GitHub do CIRISAgent é o lugar para opinar. Você não precisa ser desenvolvedor. Você não precisa conhecer o código. Se algo neste site parecer errado, ou se você vir um problema com o que está sendo construído, abra um issue e diga. Os issues mais úteis identificam uma parte específica do sistema e propõem o que deveria mudar, mas qualquer participação honesta é bem-vinda.

O accord que sustenta todo o projeto, o que o CIRIS deve às pessoas e o que as pessoas devem em troca, está em /ciris_accord.txt e permanece aberto para revisão. Se algo nele não parecer certo para você, isso também vale um issue no GitHub.

Issues substantivos são lidos. O trabalho avança no seu próprio ritmo.

Você não precisa resolver a segurança da IA um agente de cada vez. Você resolve para a camada de supervisão e deixa a estrutura carregar o resto.

O lado da pressão Ver pontuado ao vivo Participar no GitHub