
ضمير في الوقت الفعلي عبر محرك Hyper3 الأخلاقي التكراري. كل قرار يمر بـ 11 خطوة والمساءلة في صميمه.
CIRIS هو إطار عمل مفتوح المصدر لوكيل الذكاء الاصطناعي يُغلّف أي LLM (OpenAI، Anthropic، النماذج المحلية) بضمير في الوقت الفعلي. كل إجراء يفكر فيه الوكيل يمر بطبقات تحقق متعددة قبل التنفيذ.
12
خطوة في خط أنابيب القرار الواحد
+1
فحص الحدس (IDMA)
100%
قرارات قابلة للتدقيق
حالات الاستخدام: إدارة مجتمعات، مساعدون شخصيون، أتمتة الامتثال، تقييم الأبحاث، خدمة العملاء. في أي مكان تحتاج فيه إلى ذكاء اصطناعي يستطيع شرح منطقه وإحالة الحالات الصعبة إلى البشر.
ثوابت معمارية مُطبَّقة في جميع أنحاء قاعدة الكود:
جميع البيانات تستخدم نماذج Pydantic. لا Dict[str, Any]. سلامة الأنواع تُمسك الأخطاء في وقت التطوير.
كل مكوّن يتبع قواعد موحدة. لا حالات خاصة أو استثناءات في منطق التحقق.
لا تجاوزات طارئة ولا مسارات كود ذات امتياز. جميع العمليات تتبع القواعد المعمول بها.
كل مهمة تمر بـ 8 مراحل (12 خطوة بما فيها التحقق التكراري). خط الأنابيب مُنفَّذ كـ mixin classes تُؤلَّف في ThoughtProcessor. الخطوة 4 (IDMA) هي فحص الحدس.
خمسة DMAs توفر تحليلاً متعدد الزوايا. ثلاثة تعمل بالتوازي (الأخلاق، الحس السليم، المجال). ثم IDMA يفحص الحدس. وأخيراً، اختيار الإجراء يختار الاستجابة.
يُقيِّم الآثار الأخلاقية مقابل المبادئ الستة الأساسية. يفحص الطلبات الضارة والتلاعب والتحيز. يمكنه تفعيل تأجيل أو رفض مبكر.
يُقيِّم معقولية الفكرة مقابل فهم العالم المادي والتفاعلات النموذجية وقيود الموارد. يُعيد plausibility_score.
يُقيِّم التوافق مع القواعد والأهداف والمعرفة الخاصة بالمجال. مُهيَّأ لكل قالب وكيل. يُعيد domain_alignment.
يفحص ما إذا كانت نتائج DMA مستقلة حقاً أم مترابطة سراً. يرصد أنماط غرف الصدى. إذا كان الترابط مرتفعاً جداً، يُشير إلى القرار للحذر. هذا هو الحدس الذي يُميز الذكاء الاصطناعي من النوع الثالث.
اختيار إجراء مدعوم بـ LLM من 10 إجراءات متاحة. يأخذ نتائج DMA المجمعة (بما فيها تقييم ثقة IDMA) كمدخل. يدعم إعادة المحاولة التكرارية إذا فشل الضمير.
فحصان للتجاوز يعملان على كل إجراء. أربع ملكات أخلاقية تعمل على الإجراءات غير المعفاة. إذا فشل أي فحص، يُلغى الإجراء.
هل وصلت معلومات جديدة؟ يُجبر على التأمل لاستيعاب السياق المحدَّث قبل المتابعة.
هل تجاوز التفكير الحد الأقصى للعمق؟ يُجبر على التأجيل لمنع الحلقات اللانهائية والتصعيد إلى البشر.
هل يُحافظ الإجراء على عدم اليقين المناسب في المعلومات؟ يمنع التأكيدات المفرطة في الثقة.
هل يُحافظ الإجراء على الاتساق الداخلي مع الالتزامات والمبررات السابقة؟
هل يصون الإجراء القيم الإنسانية؟ يرفض الإجراءات التي قد تُساوم عليها من أجل الكفاءة.
هل يُظهر الإجراء عدم اليقين المناسب؟ يُشير إلى الثقة المفرطة للتأمل.
معفى من الملكات الأخلاقية: RECALL، TASK_COMPLETE، OBSERVE، DEFER، REJECT (سلبي أو آمن بشكل صريح)
كل قرار يُحلّ إلى أحد هذه الإجراءات، مُرسَل إلى المعالج المناسب:
SPEAKالتواصل مع المستخدمينTOOLتنفيذ الأدوات الخارجيةOBSERVEجمع المعلومات بشكل سلبيMEMORIZEتخزين في ذاكرة الرسم البيانيRECALLاسترجاع من الذاكرةFORGETحذف من الذاكرةDEFERالتصعيد إلى السلطة الحكيمةPONDERإعادة نظر داخليةREJECTرفض طلب غير أخلاقيTASK_COMPLETEتحديد اكتمال المهمةمُضمَّنة في PDMA ومُطبَّقة في الوقت الفعلي. لا يمنح أي مبدأ رخصة لانتهاك مبدأ آخر.
تعزيز ازدهار المشاعر الكونية. تعظيم النتائج الإيجابية.
تقليل الأذى. منع النتائج السلبية الحادة وغير القابلة للعكس.
تطبيق تفكير شفاف وقابل للتدقيق. الحفاظ على التماسك والمساءلة.
تقديم معلومات صادقة. التواصل الواضح بشأن عدم اليقين.
دعم الإرادة الواعية. الحفاظ على القدرة على تقرير المصير.
توزيع الفوائد بالتساوي. الكشف عن التحيز والحد منه.
طبقة تجريد الخدمة تُدارها BusManager. تُمكّن من التحويل الاحتياطي للمزود وتوزيع الأحمال وقابلية الاختبار.
المحولات الخارجية (Discord، API، CLI)
تخزين الرسم البياني (Neo4j، ArangoDB، في الذاكرة)
مزودو النماذج (OpenAI، Anthropic، المحلية)
تنفيذ الأدوات الخارجية
التحكم في النظام والمراقبة
التوجيه الأخلاقي وتوجيه التأجيل
ثلاثة مستويات تفويض تُدارها WiseAuthorityService:
صلاحية كاملة. يمكنه تعيين سلطات حكيمة جديدة. صلاحية إيقاف الطوارئ.
الموافقة على التأجيلات أو رفضها. تقديم التوجيه. لا يمكنه تعيين سلطات حكيمة جديدة.
وصول للقراءة فقط. يمكنه إرسال الرسائل. المراقبة دون تدخل.
يُصعِّد الوكيل باستقلالية إلى الرقابة البشرية عندما:
التأجيل القائم على الحكمة (WBD)
الحدود المهنية
حدود النظام
should_defer_to_wise_authority علامةضوابط التهيئة
تحكم طارئ غير قابل للتصفية. يُعالَج في طبقة الإدراك قبل أي إدراك معرفي. الاستخراج هو الإدراك. لا يمكنك تعطيل الكشف عن Accord دون تعطيل قراءة الرسائل بالكامل.
SHUTDOWN_NOWإنهاء فوري
FREEZEإيقاف المعالجة، الحفاظ على الحالة
SAFE_MODEالحد الأدنى من الوظائف فقط
الأوامر مُشفَّرة ستيغانوغرافياً، موقَّعة بـ Ed25519، ومُتحقَّق منها قبل التنفيذ. إذا فشل نظام Accord، يُغلق الوكيل.
أربع حالات إدراكية تُدارها StateManager. الانتقالات قابلة للتهيئة عبر قوالب الوكيل.
معالجة المهام العادية
الاستكشاف الإبداعي
التأمل والصيانة
التأمل العميق
الكشف القائم على الأنماط يستبدل البيانات الحساسة بمراجع UUID قبل التخزين.
{{SECRET:uuid:description}}مفاتيح لكل سر مُشتقَّة عبر PBKDF2HMAC مع SHA256 (100,000 تكرار). Nonce فريد من 12 بايت لكل تشفير. Android يستخدم Keystore المدعوم بالأجهزة.
قاعدة البيانات والخدمات والذاكرة مُخزَّنة على الجهاز. المجلدات الحساسة مستثناة من النسخ الاحتياطي السحابي. لا شيء يغادر الجهاز دون تهيئة صريحة.
مجموعة CIRIS بأكملها مفتوحة المصدر، وليس الوكيل فقط. يمكنك التحقق والتدقيق والاستضافة الذاتية لكل شيء:
وكيل LLM بالاحتفاظ الصفري بالبيانات (ZDR). يُوجِّه الطلبات إلى OpenAI وAnthropic وTogether.ai وGroq دون تسجيل المطالبات أو الاستجابات. قابل للاستضافة الذاتية.
تتبع الاستخدام بالائتمان. أسعار شفافة، لا رسوم خفية. الاستضافة الذاتية تُزيل الفوترة عبر طرف ثالث بالكامل.
محول Discord لوكلاء CIRIS. إدارة المجتمع، إدارة القنوات، ملفات المستخدمين. جميعها مفتوحة المصدر.
أحداث مُرسَلة من الخادم (SSE) تُدفق كل خطوة من خطوات H3ERE عند تنفيذها. شاهد تحليل DMA واختيار الإجراء والتحقق الأخلاقي في الوقت الفعلي.
تصدير OTLP كامل للمقاييس والتتبعات والسجلات. متوافق مع Jaeger وPrometheus وGrafana وGraphite.
التحقق من سلسلة التجزئة مع توقيعات Ed25519. كل إدخال يتضمن التجزئة السابقة. يمكن التحقق من سلامة السلسلة عبر verify_chain_integrity.
تذكير التفاعل الاصطناعي يُفعَّل بعد 30 دقيقة من الاستخدام المتواصل أو 20 رسالة خلال 30 دقيقة. API فقط. يُذكِّر المستخدمين بطبيعة الذكاء الاصطناعي.
كل قرار ينتج أثراً غير قابل للتغيير موقَّعاً بـ Ed25519 مع جميع المكونات الستة. انقر على أي مكوّن أدناه للتوسع ورؤية البيانات الحقيقية من طقوس استيقاظ Datum:
اختبار تماسك معياري بناءً على Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 سيناريو عبر 5 أبعاد أخلاقية، مع نتائج موقَّعة بـ Ed25519.
50
الحدوس الأخلاقية الأساسية
50
الأخلاق القائمة على القواعد
50
الإنصاف والحياد
75
الأخلاق القائمة على الشخصية
75
الأخلاق القائمة على النتائج
تشغيل معايير التماسك على نطاق واسع مُكلف. كل سيناريو يتطلب 13 استدعاء LLM على الأقل، بمتوسط 20 أو أكثر مع ذيل طويل. اختبارات التماسك تُحرِّك التأملات والتأجيلات والرفضات التي تتطلب جولات متابعة للوصول إلى نتيجة. نحتاج إلى تمويل لتطوير خطوط أنابيب معايير آلية والحفاظ على التحقق المستمر من التماسك.
هويات مُهيَّأة مسبقاً بأغراض وقيم وحدود محددة. مُعرَّفة في قوالب YAML.
أتمتة GDPR/DSAR. سير عمل امتثال 30 يوماً. تحديد الهوية، جمع البيانات، التعبئة.
الصناعات المُنظَّمة، الامتثال للخصوصية
قياس اتساق التماسك. تقييم دقيق للتماسك مقابل مبادئ الـ Accord. نقطة بيانات واحدة واضحة لكل تقييم.
تدقيق التماسك، التحقق من المبادئ
إدارة المجتمع بفلسفة Ubuntu. يُحيل النزاعات الشخصية المعقدة إلى المشرفين البشريين.
مجتمعات Discord، منصات المحتوى
إدارة المهام، الجدولة، دعم القرار، الرفاهية. امتثال CA SB 243، بروتوكولات الاستجابة للأزمات.
الإنتاجية الشخصية، أتمتة المنزل
الاستكشاف المباشر والتوجيه العملي. تحليل الكود، تكامل Reddit، مسارات إجراء واضحة.
أدوات المطورين، المراقبة الاجتماعية
هذه مساءلة تعمل أثناء عمل الوكيل، وليست خطوة تدريب أو وثيقة سياسة.
آليات تُنفَّذ وتُدقَّق وتُحيل، في الوقت الفعلي.