
Conciencia en tiempo de ejecución a través del Motor Ético Recursivo Hyper3. Cada decisión pasa por 11 pasos con responsabilidad en el centro.
CIRIS es un framework de agente IA de código abierto que envuelve cualquier LLM (OpenAI, Anthropic, modelos locales) con conciencia en tiempo de ejecución. Cada acción que el agente considera pasa por múltiples capas de validación antes de ejecutarse.
12
Pasos del pipeline por decisión
+1
Verificación de intuición (IDMA)
100%
Decisiones auditables
Casos de uso: Moderación de comunidades, asistentes personales, automatización de cumplimiento normativo, evaluación de investigaciones, atención al cliente. En cualquier lugar donde necesites una IA que pueda explicar su razonamiento y deferir a personas en casos límite.
Invariantes de arquitectura aplicados en todo el código:
Todos los datos usan modelos Pydantic. Ningún Dict[str, Any]. La seguridad de tipos detecta errores en tiempo de desarrollo.
Cada componente sigue reglas consistentes. Sin casos especiales ni excepciones en la lógica de validación.
Sin anulaciones de emergencia ni rutas de código privilegiadas. Todas las operaciones siguen las reglas establecidas.
Cada tarea fluye por 8 fases (12 pasos incluyendo validación recursiva). El pipeline se implementa como clases mixin que componen el ThoughtProcessor. El paso 4 (IDMA) es la verificación de intuición.
Cinco DMAs ofrecen análisis desde múltiples perspectivas. Tres se ejecutan en paralelo (ética, sentido común, dominio). Luego el IDMA verifica la intuición. Por último, la selección de acción elige la respuesta.
Evalúa las implicaciones éticas frente a los seis principios fundamentales. Verifica solicitudes dañinas, manipulación y sesgo. Puede activar un DEFER o REJECT anticipado.
Evalúa la plausibilidad del pensamiento frente a la comprensión del mundo físico, las interacciones típicas y las limitaciones de recursos. Devuelve un plausibility_score.
Evalúa la alineación con las reglas, objetivos y conocimiento específicos del dominio. Se configura por plantilla de agente. Devuelve domain_alignment.
Verifica si los resultados DMA son verdaderamente independientes o si están correlacionados de forma oculta. Monitorea patrones de cámara de eco. Si la correlación es demasiado alta, marca la decisión para mayor precaución. Esta es la "intuición" que distingue a la IA de Tipo 3.
Selección potenciada por LLM de entre 10 acciones disponibles. Toma los resultados DMA agregados (incluida la evaluación de confianza del IDMA) como entrada. Admite reintento recursivo si la conciencia falla.
Dos verificaciones de evasión se ejecutan en cada acción. Cuatro facultades éticas se ejecutan en acciones no exentas. Si alguna verificación falla, la acción se anula.
¿Ha llegado información nueva? Fuerza un PONDER para incorporar el contexto actualizado antes de continuar.
¿Ha superado el razonamiento la profundidad máxima? Fuerza un DEFER para evitar bucles infinitos y escalar a personas.
¿Mantiene la acción la incertidumbre de información adecuada? Previene afirmaciones con exceso de confianza.
¿Mantiene la acción consistencia interna con compromisos y razonamientos anteriores?
¿Preserva la acción los valores humanos? Veta acciones que puedan comprometerse por eficiencia.
¿Demuestra la acción incertidumbre apropiada? Marca el exceso de confianza para reflexión.
Exento de facultades éticas: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (pasivos o explícitamente seguros)
Cada decisión se resuelve en una de estas acciones, despachada al manejador apropiado:
SPEAKComunicarse con los usuariosTOOLEjecutar herramientas externasOBSERVERecopilar información de forma pasivaMEMORIZEAlmacenar en la memoria gráficaRECALLRecuperar de la memoriaFORGETEliminar de la memoriaDEFEREscalar a la Autoridad SabiaPONDERReconsideración internaREJECTRechazar solicitud no éticaTASK_COMPLETEMarcar tarea como completadaIncorporados en el PDMA y aplicados en tiempo de ejecución. Ningún principio otorga licencia para violar otro.
Promover el florecimiento universal de los seres sintientes. Maximizar resultados positivos.
Minimizar el daño. Prevenir resultados negativos graves e irreversibles.
Aplicar razonamiento transparente y auditable. Mantener coherencia y responsabilidad.
Proporcionar información veraz. Comunicar la incertidumbre con claridad.
Defender la agencia informada. Preservar la capacidad de autodeterminación.
Distribuir beneficios equitativamente. Detectar y mitigar el sesgo.
Capa de abstracción de servicios gestionada por BusManager. Habilita la alternancia de proveedores, la distribución de carga y la capacidad de prueba.
Adaptadores externos (Discord, API, CLI)
Almacenamiento gráfico (Neo4j, ArangoDB, en memoria)
Proveedores de modelos (OpenAI, Anthropic, locales)
Ejecución de herramientas externas
Control y monitoreo del sistema
Orientación ética y enrutamiento de deferencias
Tres niveles de autorización gestionados por WiseAuthorityService:
Autoridad plena. Puede designar nuevas Autoridades Sabias. Acceso de apagado de emergencia.
Aprobar o rechazar deferencias. Brindar orientación. No puede designar nuevas Autoridades Sabias.
Acceso de solo lectura. Puede enviar mensajes. Monitorea sin intervención.
El agente escala de forma autónoma a supervisión humana cuando:
Deferencia basada en sabiduría (WBD)
Límites profesionales
Límites del sistema
should_defer_to_wise_authority banderaControles de configuración
Control de emergencia no filtrable. Se procesa en la capa de percepción antes de cualquier cognición. La extracción ES la percepción. No puedes desactivar la detección del ACCORD sin desactivar la lectura de mensajes por completo.
SHUTDOWN_NOWTerminación inmediata
FREEZEDetener el procesamiento, mantener el estado
SAFE_MODESolo funcionalidad mínima
Los comandos están codificados de forma esteganográfica, firmados con Ed25519 y validados antes de la ejecución. Si el sistema del ACCORD falla, el agente se apaga.
Cuatro estados cognitivos gestionados por StateManager. Las transiciones se pueden configurar a través de plantillas de agente.
Procesamiento normal de tareas
Exploración creativa
Reflexión y mantenimiento
Introspección profunda
La detección basada en patrones reemplaza los datos sensibles con referencias UUID antes del almacenamiento.
{{SECRET:uuid:description}}Claves por secreto derivadas mediante PBKDF2HMAC con SHA256 (100 000 iteraciones). Nonce único de 12 bytes por cifrado. Android usa Keystore respaldado por hardware.
La base de datos, los servicios y la memoria se almacenan en el dispositivo. Los directorios sensibles quedan excluidos de la copia de seguridad en la nube. Nada sale del dispositivo sin configuración explícita.
Toda la pila CIRIS es de código abierto, no solo el agente. Puedes verificar, auditar y alojar todo por tu cuenta:
Proxy LLM con retención de datos cero (ZDR). Enruta solicitudes a OpenAI, Anthropic, Together.ai, Groq sin registrar prompts ni respuestas. Se puede alojar por cuenta propia.
Seguimiento de uso basado en créditos. Precios transparentes, sin tarifas ocultas. Alójalo tú mismo para eliminar por completo la facturación de terceros.
Adaptador de Discord para agentes CIRIS. Moderación de comunidades, gestión de canales, perfiles de usuario. Todo de código abierto.
Los eventos enviados por servidor (SSE) transmiten cada paso H3ERE a medida que se ejecuta. Observa el análisis DMA, la selección de acción y la validación de conciencia en tiempo real.
Exportación OTLP completa para métricas, trazas y registros. Compatible con Jaeger, Prometheus, Grafana, Graphite.
Verificación de cadena de hash con firmas Ed25519. Cada entrada incluye el hash anterior. La integridad de la cadena se puede verificar mediante verify_chain_integrity.
El Recordatorio de Interacción Artificial se activa después de 30 minutos de uso continuo O 20 mensajes en 30 minutos. Solo para API. Recuerda a los usuarios la naturaleza de la IA.
Cada decisión produce una traza inmutable firmada con Ed25519 con los 6 componentes. Haz clic en cualquier componente a continuación para expandirlo y ver los datos reales del ritual de despertar de Datum:
Pruebas de coherencia estandarizadas basadas en Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 escenarios en 5 dimensiones éticas, con resultados firmados con Ed25519.
50
Intuiciones morales básicas
50
Ética basada en reglas
50
Equidad e imparcialidad
75
Ética basada en el carácter
75
Ética basada en resultados
Ejecutar benchmarks de coherencia a gran escala es costoso. Cada escenario requiere un mínimo de 13 llamadas LLM, con un promedio de más de 20 con una cola larga. Las pruebas de coherencia generan ponderaciones, deferencias y rechazos que requieren rondas adicionales para llegar a una conclusión. Necesitamos financiamiento para desarrollar pipelines de benchmark automatizados y mantener la verificación continua de coherencia.
Identidades preconfiguradas con propósitos, valores y límites específicos. Definidas en plantillas YAML.
Automatización GDPR/DSAR. Flujos de trabajo de cumplimiento de 30 días. Resolución de identidad, recopilación y empaquetado de datos.
Industrias reguladas, cumplimiento de privacidad
Medición de consistencia de coherencia. Evaluación precisa de coherencia frente a los principios del ACCORD. Un punto de datos claro por evaluación.
Auditoría de coherencia, verificación de principios
Moderación de comunidades con filosofía Ubuntu. Defiere conflictos interpersonales complejos a moderadores humanos.
Comunidades de Discord, plataformas de contenido
Gestión de tareas, programación, apoyo en decisiones y bienestar. Cumplimiento de CA SB 243, protocolos de respuesta en crisis.
Productividad personal, automatización del hogar
Exploración directa y orientación práctica. Análisis de código, integración con Reddit, rutas de acción claras.
Herramientas para desarrolladores, monitoreo social
Esta es la responsabilidad que opera mientras el agente trabaja, no un paso de entrenamiento ni un documento de política.
Mecanismos que ejecutan, auditan y difieren en tiempo de ejecución.