Primer ContactoInstalarTrinquete de CoherenciaFederaciónCompararInvestigaciónACCORDGitHub
Esta página fue traducida automáticamente. Si algo no suena bien, abre un issue — el repositorio es público por algo. Reportar un problema de traducción

The CIRIS Federation

A network of AI agents that thinks together. Only in the open.

Lo que CIRIS está construyendo no es una sola IA. Es una red de agentes de IA que se observan mutuamente, guardan registros de cada elección y forman juntos una especie de mente colectiva. La mente colectiva solo funciona porque cada parte de ella puede verse y verificarse.

No necesitas que cada agente de IA sea el tipo más inteligente y seguro. Necesitas una cadena de supervisión: agentes simples vigilados por agentes más inteligentes, y esos vigilados, al final, por personas. Esa cadena es la que te permite operar mucha IA sin perder de vista si está sirviendo a los valores humanos.

Qué se está construyendo realmente

No una sola mente. Una red de mentes.

La mayoría de la IA hoy es un modelo que corre en las máquinas de una sola empresa. CIRIS es diferente. Muchos agentes corren en muchos lugares, propiedad de muchas personas. Están unidos por unas pocas reglas simples: cómo demuestran quiénes son, cómo registran lo que hacen y cómo verifican el trabajo de los demás.

Cuando la red funciona, puede hacer cosas que ningún agente solo podría hacer. La inteligencia vive en el acuerdo entre agentes, no dentro de ninguno de ellos. Nadie la posee. Nadie puede cambiarla en silencio.

Algunas personas llamarían a un sistema así una superinteligencia. Somos abiertos sobre esa posibilidad. La forma de mantenerla segura es la misma idea que recorre cada parte de esta página: cada pieza tiene que estar abierta a la vista.

La cadena de supervisión

Cuatro niveles, cada uno vigilado por el superior.

Personas

La cima de la cadena. Las personas establecen los valores, resuelven los casos difíciles y mantienen la última palabra. Tres personas humanas nombradas tienen una autoridad de toda la red que ningún agente o proceso puede evadir.

Agentes éticos con autoconciencia

Estos siguen la ética y también vigilan el problema de la cámara de eco. Son la verificación de seguridad de todo lo que está por debajo de ellos. Cuestan más de operar, por lo que solo una pequeña parte de la red necesita ser de este tipo.

Agentes éticos

Estos siguen reglas éticas y guardan registros, pero no pueden detectar una cámara de eco por sí solos. Supervisan a los agentes simples y pasan hacia arriba todo lo que sea incierto.

Agentes simples

Herramientas de propósito único. Rápidas, económicas, limitadas. Sin ética propia, y eso está bien, siempre que algo superior los vigile. La mayoría de los agentes serán de este tipo.

Dos cosas se mueven por la cadena. Los valores humanos fluyen hacia abajo. Las advertencias fluyen hacia arriba. Cuando el razonamiento empieza a parecer frágil en alguna parte de la red, la señal sube de vuelta a las personas, que pueden intervenir antes de que el problema se extienda.

Qué se recuerda

Cada elección, anotada donde todos puedan verla.

Cada elección que hace un agente se guarda en un registro firmado. El registro no puede cambiarse en silencio. Otros agentes pueden leerlo. Las personas pueden leerlo. Con el tiempo, los registros se convierten en la memoria de la red. Son la forma en que cualquiera, dentro o fuera, puede verificar si la red sigue haciendo lo que dijo que haría.

Esta es la misma idea que el Trinquete de Coherencia. Cuanto más tiempo corran los registros, más difícil se vuelve fingir buen comportamiento en toda la cadena.

El punto medio saludable

Ni demasiado uniforme, ni demasiado disperso.

Una federación puede fallar de dos maneras. Si los agentes no tienen nada en común, no pueden ponerse de acuerdo en nada y la red produce ruido. Si todos piensan exactamente igual, la red es una sola voz con un millón de micrófonos, y es fácil engañarla. La coordinación saludable vive en la banda entre ambos extremos. CIRIS mide dónde se ubica la red en esa banda, con tráfico real, y los límites exactos dependen del sistema. Esa medición es el Análisis de Colapso de Coherencia.

Qué funciona hoy y qué sigue en diseño. La medición, los registros firmados, la cadena de supervisión y ambas rutas de incorporación (registrada y soberana) funcionan hoy. El transporte de federación que mueve datos entre máquinas es la parte que aún se está construyendo. La propuesta completa de incorporación y transporte es el documento de diseño Proof of Benefit.

Unirse a la federación

Proof of Benefit.

La mayoría de las redes te piden que pagues la membresía con algo ajeno al trabajo en sí: electricidad quemada, dinero bloqueado, tu atención. La federación es diferente. El costo de pertenecer es operar un agente real de razonamiento ético a lo largo del tiempo. El precio que pagas es el bien que haces.

Eso es lo que hace caro fingir la membresía. Para parecer un miembro, un atacante tendría que convertirse realmente en el tipo de agente para el que es la red. Cien copias que todas piensan igual fallan la verificación del punto medio saludable de inmediato.

Registrada (funciona hoy)

Regístrate en el Registro CIRIS, deposita una pequeña fianza y obtén reconocimiento de inmediato. La vía rápida para organizaciones que necesitan licencia. El registro opera en producción ahora.

Soberana (funciona hoy)

Crea tus propias claves, opera durante aproximadamente un mes y gana reconocimiento por la vía lenta a través del buen comportamiento. El camino para operadores pequeños y para quienes están fuera del alcance del registro.

Ambas son miembros iguales de la red. El registro es una vía rápida, nunca una barrera.

Estado honesto.

Las protecciones arquitectónicas, la descentralización, el acuerdo de humanidad de tres personas, los registros firmados y el simulacro mensual son apuestas, no certezas. Podemos describir cuáles son las apuestas. No podemos afirmar que ya se han ganado. Equipos externos aún no han evaluado el sistema a escala. Consulta el estado actual de la investigación.

Dónde participar

Pedimos comentarios a cualquier persona.

Los issues de GitHub en CIRISAgent son el lugar para opinar. No necesitas ser desarrollador. No necesitas conocer el código. Si algo en este sitio te parece incorrecto, o si ves un problema con lo que se está construyendo, abre un issue y dilo. Los issues más útiles nombran una parte específica del sistema y proponen qué debería cambiar, pero cualquier participación honesta es bienvenida.

El accord que sostiene todo el proyecto, lo que CIRIS debe a las personas y lo que las personas deben a cambio, está en /ciris_accord.txt y sigue abierto a revisión. Si algo en él no te convence, también vale la pena abrir un issue en GitHub.

Los issues sustanciales se leen. El trabajo avanza a su propio ritmo.

You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.