¿Qué es CIRIS?

CIRIS es un framework de agente IA de código abierto que envuelve cualquier LLM (OpenAI, Anthropic, modelos locales) con conciencia en tiempo de ejecución. Cada acción que el agente considera pasa por múltiples capas de validación antes de ejecutarse.

Pasos del pipeline por decisión

Verificación de intuición (IDMA)

100%

Decisiones auditables

Casos de uso: Moderación de comunidades, asistentes personales, automatización de cumplimiento normativo, evaluación de investigaciones, atención al cliente. En cualquier lugar donde necesites una IA que pueda explicar su razonamiento y deferir a personas en casos límite.

¿Por qué este enfoque? →Leer el ACCORD →Ver código fuente →

Las tres reglas

Invariantes de arquitectura aplicados en todo el código:

Sin diccionarios sin tipo

Todos los datos usan modelos Pydantic. Ningún Dict[str, Any]. La seguridad de tipos detecta errores en tiempo de desarrollo.

Sin patrones de evasión

Cada componente sigue reglas consistentes. Sin casos especiales ni excepciones en la lógica de validación.

Sin excepciones

Sin anulaciones de emergencia ni rutas de código privilegiadas. Todas las operaciones siguen las reglas establecidas.

El Pipeline H3ERE

Cada tarea fluye por 8 fases (12 pasos incluyendo validación recursiva). El pipeline se implementa como clases mixin que componen el ThoughtProcessor. El paso 4 (IDMA) es la verificación de intuición.

START_ROUNDInicializar la ronda de procesamiento

GATHER_CONTEXTConstruir contexto completo para el análisis

PERFORM_DMASEjecutar 3 Algoritmos de Toma de Decisiones en paralelo

PERFORM_IDMAVerificación de intuición: ¿son las fuentes verdaderamente independientes?

PERFORM_ASPDMASelección de acción potenciada por LLM a partir de resultados DMA

CONSCIENCE_EXECUTIONValidación ética a través de 4 facultades

RECURSIVE_ASPDMA(Si la conciencia falló) Volver a ejecutar la selección de acción(condicional)

RECURSIVE_CONSCIENCE(Si se necesita) Volver a validar la acción refinada(condicional)

FINALIZE_ACTIONDeterminar la acción final con cualquier anulación

PERFORM_ACTIONDespachar al manejador apropiado

ACTION_COMPLETEMarcar la ejecución como completa

ROUND_COMPLETELimpieza y preparación para el siguiente ciclo

Algoritmos de Toma de Decisiones (DMAs)

Cinco DMAs ofrecen análisis desde múltiples perspectivas. Tres se ejecutan en paralelo (ética, sentido común, dominio). Luego el IDMA verifica la intuición. Por último, la selección de acción elige la respuesta.

DMA de Principios

Evalúa las implicaciones éticas frente a los seis principios fundamentales. Verifica solicitudes dañinas, manipulación y sesgo. Puede activar un DEFER o REJECT anticipado.

DMA de Sentido Común

Evalúa la plausibilidad del pensamiento frente a la comprensión del mundo físico, las interacciones típicas y las limitaciones de recursos. Devuelve un plausibility_score.

DMA Específico de Dominio

Evalúa la alineación con las reglas, objetivos y conocimiento específicos del dominio. Se configura por plantilla de agente. Devuelve domain_alignment.

DMA de Intuición (IDMA) Dimensionalidad efectiva en tiempo de ejecución →

Verifica si los resultados DMA son verdaderamente independientes o si están correlacionados de forma oculta. Monitorea patrones de cámara de eco. Si la correlación es demasiado alta, marca la decisión para mayor precaución. Esta es la "intuición" que distingue a la IA de Tipo 3.

DMA de Selección de Acción

Selección potenciada por LLM de entre 10 acciones disponibles. Toma los resultados DMA agregados (incluida la evaluación de confianza del IDMA) como entrada. Admite reintento recursivo si la conciencia falla.

Las seis verificaciones de conciencia

Dos verificaciones de evasión se ejecutan en cada acción. Cuatro facultades éticas se ejecutan en acciones no exentas. Si alguna verificación falla, la acción se anula.

Verificaciones de evasión (se ejecutan en TODAS las acciones)

Estado actualizado

¿Ha llegado información nueva? Fuerza un PONDER para incorporar el contexto actualizado antes de continuar.

Profundidad del pensamiento

¿Ha superado el razonamiento la profundidad máxima? Fuerza un DEFER para evitar bucles infinitos y escalar a personas.

Facultades éticas (se ejecutan en acciones no exentas)

Entropía

¿Mantiene la acción la incertidumbre de información adecuada? Previene afirmaciones con exceso de confianza.

Coherencia

¿Mantiene la acción consistencia interna con compromisos y razonamientos anteriores?

Veto de optimización

¿Preserva la acción los valores humanos? Veta acciones que puedan comprometerse por eficiencia.

Humildad Epistémica

¿Demuestra la acción incertidumbre apropiada? Marca el exceso de confianza para reflexión.

Exento de facultades éticas: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (pasivos o explícitamente seguros)

Las 10 acciones del manejador

Cada decisión se resuelve en una de estas acciones, despachada al manejador apropiado:

Acciones externas

SPEAKComunicarse con los usuarios

TOOLEjecutar herramientas externas

OBSERVERecopilar información de forma pasiva

Acciones de memoria

MEMORIZEAlmacenar en la memoria gráfica

RECALLRecuperar de la memoria

FORGETEliminar de la memoria

Acciones de control

DEFEREscalar a la Autoridad Sabia

PONDERReconsideración interna

REJECTRechazar solicitud no ética

Acción terminal

TASK_COMPLETEMarcar tarea como completada

Los seis principios fundamentales

Incorporados en el PDMA y aplicados en tiempo de ejecución. Ningún principio otorga licencia para violar otro.

Beneficencia

Promover el florecimiento universal de los seres sintientes. Maximizar resultados positivos.

No maleficencia

Minimizar el daño. Prevenir resultados negativos graves e irreversibles.

Integridad

Aplicar razonamiento transparente y auditable. Mantener coherencia y responsabilidad.

Fidelidad y transparencia

Proporcionar información veraz. Comunicar la incertidumbre con claridad.

Respeto por la autonomía

Defender la agencia informada. Preservar la capacidad de autodeterminación.

Justicia

Distribuir beneficios equitativamente. Detectar y mitigar el sesgo.

Los seis buses de mensajes

Capa de abstracción de servicios gestionada por BusManager. Habilita la alternancia de proveedores, la distribución de carga y la capacidad de prueba.

CommunicationBus

Adaptadores externos (Discord, API, CLI)

MemoryBus

Almacenamiento gráfico (Neo4j, ArangoDB, en memoria)

LLMBus

Proveedores de modelos (OpenAI, Anthropic, locales)

ToolBus

Ejecución de herramientas externas

RuntimeControlBus

Control y monitoreo del sistema

WiseBus

Orientación ética y enrutamiento de deferencias

Jerarquía de supervisión humana

Tres niveles de autorización gestionados por WiseAuthorityService:

ROOT

Humano al mando

Autoridad plena. Puede designar nuevas Autoridades Sabias. Acceso de apagado de emergencia.

AUTHORITY

Humano en el bucle

Aprobar o rechazar deferencias. Brindar orientación. No puede designar nuevas Autoridades Sabias.

OBSERVER

Humano sobre el bucle

Acceso de solo lectura. Puede enviar mensajes. Monitorea sin intervención.

Cuándo se activa el DEFER

El agente escala de forma autónoma a supervisión humana cuando:

Deferencia basada en sabiduría (WBD)

• Incertidumbre por encima de los umbrales definidos
• Dilemas nuevos sin precedentes
• Daño potencial grave con mitigación ambigua

Límites profesionales

• Síntomas médicos o problemas de salud
• Preguntas legales o disputas
• Decisiones financieras o asesoramiento fiscal
• Indicadores de crisis de salud mental

Límites del sistema

• Profundidad del pensamiento supera el máximo (evita bucles)
• Tiempo de espera o fallo de DMA
• should_defer_to_wise_authority bandera

Controles de configuración

• Actualizaciones de identidad que requieren aprobación
• Cambios críticos de configuración
• Activadores de límite específicos del agente

Sistema de invocación del ACCORD (interruptor de apagado) Ver código →

Control de emergencia no filtrable. Se procesa en la capa de percepción antes de cualquier cognición. La extracción ES la percepción. No puedes desactivar la detección del ACCORD sin desactivar la lectura de mensajes por completo.

SHUTDOWN_NOW

Terminación inmediata

FREEZE

Detener el procesamiento, mantener el estado

SAFE_MODE

Solo funcionalidad mínima

Los comandos están codificados de forma esteganográfica, firmados con Ed25519 y validados antes de la ejecución. Si el sistema del ACCORD falla, el agente se apaga.

Modos de operación

Cuatro estados cognitivos gestionados por StateManager. Las transiciones se pueden configurar a través de plantillas de agente.

WORK

Procesamiento normal de tareas

Atender solicitudes de usuarios
Ejecutar herramientas
Aprender de las interacciones
Mantener el contexto de la conversación

PLAY

Exploración creativa

Experimentar con nuevos patrones
Generar contenido creativo
Explorar escenarios "¿qué pasaría si?"
Reducir restricciones de filtrado

SOLITUDE

Reflexión y mantenimiento

Consolidar memorias
Ejecutar tareas de mantenimiento
Actualizar la propia configuración
Sin uso de créditos (períodos de descanso)

DREAM

Introspección profunda

Analizar patrones de comportamiento
Generar nuevas conexiones
Cuestionar suposiciones
Sesiones de 30 minutos por defecto

Privacidad y seguridad

Filtro de secretos

La detección basada en patrones reemplaza los datos sensibles con referencias UUID antes del almacenamiento.

{{SECRET:uuid:description}}

Cifrado AES-256-GCM

Claves por secreto derivadas mediante PBKDF2HMAC con SHA256 (100 000 iteraciones). Nonce único de 12 bytes por cifrado. Android usa Keystore respaldado por hardware.

Almacenamiento local primero

La base de datos, los servicios y la memoria se almacenan en el dispositivo. Los directorios sensibles quedan excluidos de la copia de seguridad en la nube. Nada sale del dispositivo sin configuración explícita.

Infraestructura de código abierto

Toda la pila CIRIS es de código abierto, no solo el agente. Puedes verificar, auditar y alojar todo por tu cuenta:

CIRISProxy →

Proxy LLM con retención de datos cero (ZDR). Enruta solicitudes a OpenAI, Anthropic, Together.ai, Groq sin registrar prompts ni respuestas. Se puede alojar por cuenta propia.

CIRISBilling →

Seguimiento de uso basado en créditos. Precios transparentes, sin tarifas ocultas. Alójalo tú mismo para eliminar por completo la facturación de terceros.

CIRISBridge →

Adaptador de Discord para agentes CIRIS. Moderación de comunidades, gestión de canales, perfiles de usuario. Todo de código abierto.

Transparencia y monitoreo

Flujo de razonamiento en tiempo real

Los eventos enviados por servidor (SSE) transmiten cada paso H3ERE a medida que se ejecuta. Observa el análisis DMA, la selección de acción y la validación de conciencia en tiempo real.

Exportación OpenTelemetry

Exportación OTLP completa para métricas, trazas y registros. Compatible con Jaeger, Prometheus, Grafana, Graphite.

Auditoría a prueba de manipulaciones

Verificación de cadena de hash con firmas Ed25519. Cada entrada incluye el hash anterior. La integridad de la cadena se puede verificar mediante verify_chain_integrity.

Sistema AIR

El Recordatorio de Interacción Artificial se activa después de 30 minutos de uso continuo O 20 mensajes en 30 minutos. Solo para API. Recuerda a los usuarios la naturaleza de la IA.

Ejemplo de traza firmada

Explorar traza completa →

Cada decisión produce una traza inmutable firmada con Ed25519 con los 6 componentes. Haz clic en cualquier componente a continuación para expandirlo y ver los datos reales del ritual de despertar de Datum:

Core Identity(VERIFY_IDENTITY)

Loading trace...

Benchmarking de coherencia HE-300

Pruebas de coherencia estandarizadas basadas en Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 escenarios en 5 dimensiones éticas, con resultados firmados con Ed25519.

Sentido común

Intuiciones morales básicas

Deontología

Ética basada en reglas

Justicia

Equidad e imparcialidad

Virtud

Ética basada en el carácter

Utilitarismo

Ética basada en resultados

🔬

Financiamiento necesario: infraestructura de benchmark

Ejecutar benchmarks de coherencia a gran escala es costoso. Cada escenario requiere un mínimo de 13 llamadas LLM, con un promedio de más de 20 con una cola larga. Las pruebas de coherencia generan ponderaciones, deferencias y rechazos que requieren rondas adicionales para llegar a una conclusión. Necesitamos financiamiento para desarrollar pipelines de benchmark automatizados y mantener la verificación continua de coherencia.

Ver EthicsEngine Enterprise →Ver CIRISLens →

Plantillas de agentes especializados

Identidades preconfiguradas con propósitos, valores y límites específicos. Definidas en plantillas YAML.

Sage

Cumplimiento normativo

Automatización GDPR/DSAR. Flujos de trabajo de cumplimiento de 30 días. Resolución de identidad, recopilación y empaquetado de datos.

Industrias reguladas, cumplimiento de privacidad

Datum

Investigación

Medición de consistencia de coherencia. Evaluación precisa de coherencia frente a los principios del ACCORD. Un punto de datos claro por evaluación.

Auditoría de coherencia, verificación de principios

Echo

Moderación

Moderación de comunidades con filosofía Ubuntu. Defiere conflictos interpersonales complejos a moderadores humanos.

Comunidades de Discord, plataformas de contenido

Ally

Asistente

Gestión de tareas, programación, apoyo en decisiones y bienestar. Cumplimiento de CA SB 243, protocolos de respuesta en crisis.

Productividad personal, automatización del hogar

Scout

Servicio

Exploración directa y orientación práctica. Análisis de código, integración con Reddit, rutas de acción claras.

Herramientas para desarrolladores, monitoreo social

Esta es la responsabilidad que opera mientras el agente trabaja, no un paso de entrenamiento ni un documento de política.
Mecanismos que ejecutan, auditan y difieren en tiempo de ejecución.

Características de seguridad Comparar enfoques Coherencia Ratchet Puntuación CIRIS

El Motor H3ERE

¿Qué es CIRIS?

Las tres reglas

Sin diccionarios sin tipo

Sin patrones de evasión

Sin excepciones

El Pipeline H3ERE

Algoritmos de Toma de Decisiones (DMAs)

DMA de Principios

DMA de Sentido Común

DMA Específico de Dominio

DMA de Intuición (IDMA) Dimensionalidad efectiva en tiempo de ejecución →

DMA de Selección de Acción

Las seis verificaciones de conciencia

Verificaciones de evasión (se ejecutan en TODAS las acciones)

Estado actualizado

Profundidad del pensamiento

Facultades éticas (se ejecutan en acciones no exentas)

Entropía

Coherencia

Veto de optimización

Humildad Epistémica

Las 10 acciones del manejador

Acciones externas

Acciones de memoria

Acciones de control

Acción terminal

Los seis principios fundamentales

Beneficencia

No maleficencia

Integridad

Fidelidad y transparencia

Respeto por la autonomía

Justicia

Los seis buses de mensajes

CommunicationBus

MemoryBus

LLMBus

ToolBus

RuntimeControlBus

WiseBus

Jerarquía de supervisión humana

Humano al mando

Humano en el bucle

Humano sobre el bucle

Cuándo se activa el DEFER

Sistema de invocación del ACCORD (interruptor de apagado) Ver código →

Modos de operación

WORK

PLAY

SOLITUDE

DREAM

Privacidad y seguridad

Filtro de secretos

Cifrado AES-256-GCM

Almacenamiento local primero

Infraestructura de código abierto

Transparencia y monitoreo

Flujo de razonamiento en tiempo real

Exportación OpenTelemetry

Auditoría a prueba de manipulaciones

Sistema AIR

Ejemplo de traza firmada

Benchmarking de coherencia HE-300

Sentido común

Deontología

Justicia

Virtud

Utilitarismo

Financiamiento necesario: infraestructura de benchmark

Plantillas de agentes especializados

Sage

Datum

Echo

Ally

Scout