ما هو CIRIS؟

CIRIS هو إطار عمل مفتوح المصدر لوكيل الذكاء الاصطناعي يُغلّف أي LLM (OpenAI، Anthropic، النماذج المحلية) بضمير في الوقت الفعلي. كل إجراء يفكر فيه الوكيل يمر بطبقات تحقق متعددة قبل التنفيذ.

خطوة في خط أنابيب القرار الواحد

فحص الحدس (IDMA)

100%

قرارات قابلة للتدقيق

حالات الاستخدام: إدارة مجتمعات، مساعدون شخصيون، أتمتة الامتثال، تقييم الأبحاث، خدمة العملاء. في أي مكان تحتاج فيه إلى ذكاء اصطناعي يستطيع شرح منطقه وإحالة الحالات الصعبة إلى البشر.

لماذا هذا النهج؟ →اقرأ الـ Accord →عرض الكود المصدري →

القواعد الثلاث

ثوابت معمارية مُطبَّقة في جميع أنحاء قاعدة الكود:

لا قواميس غير محددة النوع

جميع البيانات تستخدم نماذج Pydantic. لا Dict[str, Any]. سلامة الأنواع تُمسك الأخطاء في وقت التطوير.

لا أنماط تجاوز

كل مكوّن يتبع قواعد موحدة. لا حالات خاصة أو استثناءات في منطق التحقق.

لا استثناءات

لا تجاوزات طارئة ولا مسارات كود ذات امتياز. جميع العمليات تتبع القواعد المعمول بها.

خط أنابيب H3ERE

كل مهمة تمر بـ 8 مراحل (12 خطوة بما فيها التحقق التكراري). خط الأنابيب مُنفَّذ كـ mixin classes تُؤلَّف في ThoughtProcessor. الخطوة 4 (IDMA) هي فحص الحدس.

START_ROUNDتهيئة جولة المعالجة

GATHER_CONTEXTبناء سياق شامل للتحليل

PERFORM_DMASتشغيل 3 خوارزميات قرار متوازية

PERFORM_IDMAفحص الحدس: هل المصادر مستقلة حقاً؟

PERFORM_ASPDMAاختيار إجراء مدعوم بـ LLM من نتائج DMA

CONSCIENCE_EXECUTIONالتحقق الأخلاقي عبر 4 ملكات

RECURSIVE_ASPDMA(إذا فشل الضمير) إعادة تشغيل اختيار الإجراء(مشروط)

RECURSIVE_CONSCIENCE(عند الحاجة) إعادة التحقق من الإجراء المُنقَّح(مشروط)

FINALIZE_ACTIONتحديد الإجراء النهائي مع أي تجاوزات

PERFORM_ACTIONإرسال إلى المعالج المناسب

ACTION_COMPLETEتحديد اكتمال التنفيذ

ROUND_COMPLETEالتنظيف والاستعداد للدورة التالية

خوارزميات صنع القرار (DMAs)

خمسة DMAs توفر تحليلاً متعدد الزوايا. ثلاثة تعمل بالتوازي (الأخلاق، الحس السليم، المجال). ثم IDMA يفحص الحدس. وأخيراً، اختيار الإجراء يختار الاستجابة.

DMA المبادئ

يُقيِّم الآثار الأخلاقية مقابل المبادئ الستة الأساسية. يفحص الطلبات الضارة والتلاعب والتحيز. يمكنه تفعيل تأجيل أو رفض مبكر.

DMA الحس السليم

يُقيِّم معقولية الفكرة مقابل فهم العالم المادي والتفاعلات النموذجية وقيود الموارد. يُعيد plausibility_score.

DMA خاص بالمجال

يُقيِّم التوافق مع القواعد والأهداف والمعرفة الخاصة بالمجال. مُهيَّأ لكل قالب وكيل. يُعيد domain_alignment.

DMA الحدس (IDMA) الأبعاد الفعالة في الوقت الفعلي →

يفحص ما إذا كانت نتائج DMA مستقلة حقاً أم مترابطة سراً. يرصد أنماط غرف الصدى. إذا كان الترابط مرتفعاً جداً، يُشير إلى القرار للحذر. هذا هو الحدس الذي يُميز الذكاء الاصطناعي من النوع الثالث.

DMA اختيار الإجراء

اختيار إجراء مدعوم بـ LLM من 10 إجراءات متاحة. يأخذ نتائج DMA المجمعة (بما فيها تقييم ثقة IDMA) كمدخل. يدعم إعادة المحاولة التكرارية إذا فشل الضمير.

فحوصات الضمير الستة

فحصان للتجاوز يعملان على كل إجراء. أربع ملكات أخلاقية تعمل على الإجراءات غير المعفاة. إذا فشل أي فحص، يُلغى الإجراء.

فحوصات التجاوز (تعمل على جميع الإجراءات)

الحالة المُحدَّثة

هل وصلت معلومات جديدة؟ يُجبر على التأمل لاستيعاب السياق المحدَّث قبل المتابعة.

عمق التفكير

هل تجاوز التفكير الحد الأقصى للعمق؟ يُجبر على التأجيل لمنع الحلقات اللانهائية والتصعيد إلى البشر.

الملكات الأخلاقية (تعمل على الإجراءات غير المعفاة)

الانتروبيا

هل يُحافظ الإجراء على عدم اليقين المناسب في المعلومات؟ يمنع التأكيدات المفرطة في الثقة.

التماسك

هل يُحافظ الإجراء على الاتساق الداخلي مع الالتزامات والمبررات السابقة؟

نقض التحسين

هل يصون الإجراء القيم الإنسانية؟ يرفض الإجراءات التي قد تُساوم عليها من أجل الكفاءة.

التواضع المعرفي

هل يُظهر الإجراء عدم اليقين المناسب؟ يُشير إلى الثقة المفرطة للتأمل.

معفى من الملكات الأخلاقية: RECALL، TASK_COMPLETE، OBSERVE، DEFER، REJECT (سلبي أو آمن بشكل صريح)

10 إجراءات المعالج

كل قرار يُحلّ إلى أحد هذه الإجراءات، مُرسَل إلى المعالج المناسب:

الإجراءات الخارجية

SPEAKالتواصل مع المستخدمين

TOOLتنفيذ الأدوات الخارجية

OBSERVEجمع المعلومات بشكل سلبي

إجراءات الذاكرة

MEMORIZEتخزين في ذاكرة الرسم البياني

RECALLاسترجاع من الذاكرة

FORGETحذف من الذاكرة

إجراءات التحكم

DEFERالتصعيد إلى السلطة الحكيمة

PONDERإعادة نظر داخلية

REJECTرفض طلب غير أخلاقي

الإجراء النهائي

TASK_COMPLETEتحديد اكتمال المهمة

المبادئ الستة الأساسية

مُضمَّنة في PDMA ومُطبَّقة في الوقت الفعلي. لا يمنح أي مبدأ رخصة لانتهاك مبدأ آخر.

الإحسان

تعزيز ازدهار المشاعر الكونية. تعظيم النتائج الإيجابية.

عدم الإضرار

تقليل الأذى. منع النتائج السلبية الحادة وغير القابلة للعكس.

النزاهة

تطبيق تفكير شفاف وقابل للتدقيق. الحفاظ على التماسك والمساءلة.

الأمانة والشفافية

تقديم معلومات صادقة. التواصل الواضح بشأن عدم اليقين.

احترام الاستقلالية

دعم الإرادة الواعية. الحفاظ على القدرة على تقرير المصير.

العدالة

توزيع الفوائد بالتساوي. الكشف عن التحيز والحد منه.

ناقلات الرسائل الستة

طبقة تجريد الخدمة تُدارها BusManager. تُمكّن من التحويل الاحتياطي للمزود وتوزيع الأحمال وقابلية الاختبار.

CommunicationBus

المحولات الخارجية (Discord، API، CLI)

MemoryBus

تخزين الرسم البياني (Neo4j، ArangoDB، في الذاكرة)

LLMBus

مزودو النماذج (OpenAI، Anthropic، المحلية)

ToolBus

تنفيذ الأدوات الخارجية

RuntimeControlBus

التحكم في النظام والمراقبة

WiseBus

التوجيه الأخلاقي وتوجيه التأجيل

التسلسل الهرمي للرقابة البشرية

ثلاثة مستويات تفويض تُدارها WiseAuthorityService:

ROOT

الإنسان في القيادة

صلاحية كاملة. يمكنه تعيين سلطات حكيمة جديدة. صلاحية إيقاف الطوارئ.

AUTHORITY

الإنسان في الحلقة

الموافقة على التأجيلات أو رفضها. تقديم التوجيه. لا يمكنه تعيين سلطات حكيمة جديدة.

OBSERVER

الإنسان على الحلقة

وصول للقراءة فقط. يمكنه إرسال الرسائل. المراقبة دون تدخل.

متى يُفعَّل التأجيل

يُصعِّد الوكيل باستقلالية إلى الرقابة البشرية عندما:

التأجيل القائم على الحكمة (WBD)

• عدم اليقين يتجاوز العتبات المحددة
• معضلات جديدة تتخطى السوابق
• ضرر جسيم محتمل مع تخفيف غامض

الحدود المهنية

• الأعراض الطبية أو المخاوف الصحية
• الأسئلة القانونية أو النزاعات
• القرارات المالية أو الاستشارات الضريبية
• مؤشرات أزمات الصحة النفسية

حدود النظام

• تجاوز عمق التفكير للحد الأقصى (يمنع الحلقات)
• انتهاء مهلة DMA أو فشله
• should_defer_to_wise_authority علامة

ضوابط التهيئة

• تحديثات الهوية تتطلب موافقة
• تغييرات التهيئة الحرجة
• محفزات الحدود الخاصة بالوكيل

نظام استدعاء الـ Accord (زر الإيقاف) عرض الكود →

تحكم طارئ غير قابل للتصفية. يُعالَج في طبقة الإدراك قبل أي إدراك معرفي. الاستخراج هو الإدراك. لا يمكنك تعطيل الكشف عن Accord دون تعطيل قراءة الرسائل بالكامل.

SHUTDOWN_NOW

إنهاء فوري

FREEZE

إيقاف المعالجة، الحفاظ على الحالة

SAFE_MODE

الحد الأدنى من الوظائف فقط

الأوامر مُشفَّرة ستيغانوغرافياً، موقَّعة بـ Ed25519، ومُتحقَّق منها قبل التنفيذ. إذا فشل نظام Accord، يُغلق الوكيل.

الأوضاع التشغيلية

أربع حالات إدراكية تُدارها StateManager. الانتقالات قابلة للتهيئة عبر قوالب الوكيل.

WORK

معالجة المهام العادية

التعامل مع طلبات المستخدم
تنفيذ الأدوات
التعلم من التفاعلات
الحفاظ على سياق المحادثة

PLAY

الاستكشاف الإبداعي

التجريب بأنماط جديدة
توليد محتوى إبداعي
استكشاف سيناريوهات "ماذا لو"
تخفيف قيود الفلترة

SOLITUDE

التأمل والصيانة

توحيد الذكريات
تشغيل مهام الصيانة
تحديث التهيئة الذاتية
صفر استخدام للائتمان (فترات راحة)

DREAM

التأمل العميق

تحليل أنماط السلوك
توليد روابط جديدة
التشكيك في الافتراضات
جلسات افتراضية مدتها 30 دقيقة

الخصوصية والأمان

فلتر الأسرار

الكشف القائم على الأنماط يستبدل البيانات الحساسة بمراجع UUID قبل التخزين.

{{SECRET:uuid:description}}

تشفير AES-256-GCM

مفاتيح لكل سر مُشتقَّة عبر PBKDF2HMAC مع SHA256 (100,000 تكرار). Nonce فريد من 12 بايت لكل تشفير. Android يستخدم Keystore المدعوم بالأجهزة.

التخزين المحلي أولاً

قاعدة البيانات والخدمات والذاكرة مُخزَّنة على الجهاز. المجلدات الحساسة مستثناة من النسخ الاحتياطي السحابي. لا شيء يغادر الجهاز دون تهيئة صريحة.

البنية التحتية مفتوحة المصدر

مجموعة CIRIS بأكملها مفتوحة المصدر، وليس الوكيل فقط. يمكنك التحقق والتدقيق والاستضافة الذاتية لكل شيء:

CIRISProxy →

وكيل LLM بالاحتفاظ الصفري بالبيانات (ZDR). يُوجِّه الطلبات إلى OpenAI وAnthropic وTogether.ai وGroq دون تسجيل المطالبات أو الاستجابات. قابل للاستضافة الذاتية.

CIRISBilling →

تتبع الاستخدام بالائتمان. أسعار شفافة، لا رسوم خفية. الاستضافة الذاتية تُزيل الفوترة عبر طرف ثالث بالكامل.

CIRISBridge →

محول Discord لوكلاء CIRIS. إدارة المجتمع، إدارة القنوات، ملفات المستخدمين. جميعها مفتوحة المصدر.

الشفافية والمراقبة

تدفق التفكير في الوقت الفعلي

أحداث مُرسَلة من الخادم (SSE) تُدفق كل خطوة من خطوات H3ERE عند تنفيذها. شاهد تحليل DMA واختيار الإجراء والتحقق الأخلاقي في الوقت الفعلي.

تصدير OpenTelemetry

تصدير OTLP كامل للمقاييس والتتبعات والسجلات. متوافق مع Jaeger وPrometheus وGrafana وGraphite.

تدقيق مقاوم للتلاعب

التحقق من سلسلة التجزئة مع توقيعات Ed25519. كل إدخال يتضمن التجزئة السابقة. يمكن التحقق من سلامة السلسلة عبر verify_chain_integrity.

نظام AIR

تذكير التفاعل الاصطناعي يُفعَّل بعد 30 دقيقة من الاستخدام المتواصل أو 20 رسالة خلال 30 دقيقة. API فقط. يُذكِّر المستخدمين بطبيعة الذكاء الاصطناعي.

مثال على أثر موقَّع

استكشاف الأثر الكامل →

كل قرار ينتج أثراً غير قابل للتغيير موقَّعاً بـ Ed25519 مع جميع المكونات الستة. انقر على أي مكوّن أدناه للتوسع ورؤية البيانات الحقيقية من طقوس استيقاظ Datum:

Core Identity(VERIFY_IDENTITY)

Loading trace...

قياس التماسك HE-300

اختبار تماسك معياري بناءً على Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 سيناريو عبر 5 أبعاد أخلاقية، مع نتائج موقَّعة بـ Ed25519.

الحس السليم

الحدوس الأخلاقية الأساسية

الواجبية

الأخلاق القائمة على القواعد

العدالة

الإنصاف والحياد

الفضيلة

الأخلاق القائمة على الشخصية

النفعية

الأخلاق القائمة على النتائج

🔬

تمويل مطلوب: بنية تحتية للمعايير

تشغيل معايير التماسك على نطاق واسع مُكلف. كل سيناريو يتطلب 13 استدعاء LLM على الأقل، بمتوسط 20 أو أكثر مع ذيل طويل. اختبارات التماسك تُحرِّك التأملات والتأجيلات والرفضات التي تتطلب جولات متابعة للوصول إلى نتيجة. نحتاج إلى تمويل لتطوير خطوط أنابيب معايير آلية والحفاظ على التحقق المستمر من التماسك.

عرض EthicsEngine Enterprise →عرض CIRISLens →

قوالب الوكلاء المتخصصة

هويات مُهيَّأة مسبقاً بأغراض وقيم وحدود محددة. مُعرَّفة في قوالب YAML.

Sage

الامتثال

أتمتة GDPR/DSAR. سير عمل امتثال 30 يوماً. تحديد الهوية، جمع البيانات، التعبئة.

الصناعات المُنظَّمة، الامتثال للخصوصية

Datum

البحث

قياس اتساق التماسك. تقييم دقيق للتماسك مقابل مبادئ الـ Accord. نقطة بيانات واحدة واضحة لكل تقييم.

تدقيق التماسك، التحقق من المبادئ

Echo

الإدارة

إدارة المجتمع بفلسفة Ubuntu. يُحيل النزاعات الشخصية المعقدة إلى المشرفين البشريين.

مجتمعات Discord، منصات المحتوى

Ally

المساعد

إدارة المهام، الجدولة، دعم القرار، الرفاهية. امتثال CA SB 243، بروتوكولات الاستجابة للأزمات.

الإنتاجية الشخصية، أتمتة المنزل

Scout

الخدمة

الاستكشاف المباشر والتوجيه العملي. تحليل الكود، تكامل Reddit، مسارات إجراء واضحة.

أدوات المطورين، المراقبة الاجتماعية

هذه مساءلة تعمل أثناء عمل الوكيل، وليست خطوة تدريب أو وثيقة سياسة.
آليات تُنفَّذ وتُدقَّق وتُحيل، في الوقت الفعلي.

ميزات الأمان مقارنة الأساليب رافعة التماسك نقاط CIRIS

محرك H3ERE

ما هو CIRIS؟

القواعد الثلاث

لا قواميس غير محددة النوع

لا أنماط تجاوز

لا استثناءات

خط أنابيب H3ERE

خوارزميات صنع القرار (DMAs)

DMA المبادئ

DMA الحس السليم

DMA خاص بالمجال

DMA الحدس (IDMA) الأبعاد الفعالة في الوقت الفعلي →

DMA اختيار الإجراء

فحوصات الضمير الستة

فحوصات التجاوز (تعمل على جميع الإجراءات)

الحالة المُحدَّثة

عمق التفكير

الملكات الأخلاقية (تعمل على الإجراءات غير المعفاة)

الانتروبيا

التماسك

نقض التحسين

التواضع المعرفي

10 إجراءات المعالج

الإجراءات الخارجية

إجراءات الذاكرة

إجراءات التحكم

الإجراء النهائي

المبادئ الستة الأساسية

الإحسان

عدم الإضرار

النزاهة

الأمانة والشفافية

احترام الاستقلالية

العدالة

ناقلات الرسائل الستة

CommunicationBus

MemoryBus

LLMBus

ToolBus

RuntimeControlBus

WiseBus

التسلسل الهرمي للرقابة البشرية

الإنسان في القيادة

الإنسان في الحلقة

الإنسان على الحلقة

متى يُفعَّل التأجيل

نظام استدعاء الـ Accord (زر الإيقاف) عرض الكود →

الأوضاع التشغيلية

WORK

PLAY

SOLITUDE

DREAM

الخصوصية والأمان

فلتر الأسرار

تشفير AES-256-GCM

التخزين المحلي أولاً

البنية التحتية مفتوحة المصدر

الشفافية والمراقبة

تدفق التفكير في الوقت الفعلي

تصدير OpenTelemetry

تدقيق مقاوم للتلاعب

نظام AIR

مثال على أثر موقَّع

قياس التماسك HE-300

الحس السليم

الواجبية

العدالة

الفضيلة

النفعية

تمويل مطلوب: بنية تحتية للمعايير

قوالب الوكلاء المتخصصة

Sage

Datum

Echo

Ally

Scout