أول تواصلالتثبيترافعة التماسكالاتحادقارنالبحثAccordGitHub
تُرجمت هذه الصفحة آلياً. إذا بدا أي شيء غير صحيح، يرجى فتح تقرير، المستودع عام لهذا السبب. أبلغ عن مشكلة في الترجمة
Background Image
كيف يعمل

محرك H3ERE

ضمير في الوقت الفعلي عبر محرك Hyper3 الأخلاقي التكراري. كل قرار يمر بـ 11 خطوة والمساءلة في صميمه.

ما هو CIRIS؟

CIRIS هو إطار عمل مفتوح المصدر لوكيل الذكاء الاصطناعي يُغلّف أي LLM (OpenAI، Anthropic، النماذج المحلية) بضمير في الوقت الفعلي. كل إجراء يفكر فيه الوكيل يمر بطبقات تحقق متعددة قبل التنفيذ.

12

خطوة في خط أنابيب القرار الواحد

+1

فحص الحدس (IDMA)

100%

قرارات قابلة للتدقيق

حالات الاستخدام: إدارة مجتمعات، مساعدون شخصيون، أتمتة الامتثال، تقييم الأبحاث، خدمة العملاء. في أي مكان تحتاج فيه إلى ذكاء اصطناعي يستطيع شرح منطقه وإحالة الحالات الصعبة إلى البشر.

القواعد الثلاث

ثوابت معمارية مُطبَّقة في جميع أنحاء قاعدة الكود:

لا قواميس غير محددة النوع

جميع البيانات تستخدم نماذج Pydantic. لا Dict[str, Any]. سلامة الأنواع تُمسك الأخطاء في وقت التطوير.

لا أنماط تجاوز

كل مكوّن يتبع قواعد موحدة. لا حالات خاصة أو استثناءات في منطق التحقق.

لا استثناءات

لا تجاوزات طارئة ولا مسارات كود ذات امتياز. جميع العمليات تتبع القواعد المعمول بها.

خط أنابيب H3ERE

كل مهمة تمر بـ 8 مراحل (12 خطوة بما فيها التحقق التكراري). خط الأنابيب مُنفَّذ كـ mixin classes تُؤلَّف في ThoughtProcessor. الخطوة 4 (IDMA) هي فحص الحدس.

تصوير خط أنابيب H3ERE يُظهر التدفق من إدخال المهمة عبر تحليل DMA والتحقق الأخلاقي وتنفيذ الإجراء
1
START_ROUNDتهيئة جولة المعالجة
2
GATHER_CONTEXTبناء سياق شامل للتحليل
3
PERFORM_DMASتشغيل 3 خوارزميات قرار متوازية
4
PERFORM_IDMAفحص الحدس: هل المصادر مستقلة حقاً؟
5
PERFORM_ASPDMAاختيار إجراء مدعوم بـ LLM من نتائج DMA
6
CONSCIENCE_EXECUTIONالتحقق الأخلاقي عبر 4 ملكات
7
RECURSIVE_ASPDMA(إذا فشل الضمير) إعادة تشغيل اختيار الإجراء(مشروط)
8
RECURSIVE_CONSCIENCE(عند الحاجة) إعادة التحقق من الإجراء المُنقَّح(مشروط)
9
FINALIZE_ACTIONتحديد الإجراء النهائي مع أي تجاوزات
10
PERFORM_ACTIONإرسال إلى المعالج المناسب
11
ACTION_COMPLETEتحديد اكتمال التنفيذ
12
ROUND_COMPLETEالتنظيف والاستعداد للدورة التالية

خوارزميات صنع القرار (DMAs)

خمسة DMAs توفر تحليلاً متعدد الزوايا. ثلاثة تعمل بالتوازي (الأخلاق، الحس السليم، المجال). ثم IDMA يفحص الحدس. وأخيراً، اختيار الإجراء يختار الاستجابة.

DMA المبادئ

يُقيِّم الآثار الأخلاقية مقابل المبادئ الستة الأساسية. يفحص الطلبات الضارة والتلاعب والتحيز. يمكنه تفعيل تأجيل أو رفض مبكر.

DMA الحس السليم

يُقيِّم معقولية الفكرة مقابل فهم العالم المادي والتفاعلات النموذجية وقيود الموارد. يُعيد plausibility_score.

DMA خاص بالمجال

يُقيِّم التوافق مع القواعد والأهداف والمعرفة الخاصة بالمجال. مُهيَّأ لكل قالب وكيل. يُعيد domain_alignment.

DMA الحدس (IDMA) الأبعاد الفعالة في الوقت الفعلي →

يفحص ما إذا كانت نتائج DMA مستقلة حقاً أم مترابطة سراً. يرصد أنماط غرف الصدى. إذا كان الترابط مرتفعاً جداً، يُشير إلى القرار للحذر. هذا هو الحدس الذي يُميز الذكاء الاصطناعي من النوع الثالث.

DMA اختيار الإجراء

اختيار إجراء مدعوم بـ LLM من 10 إجراءات متاحة. يأخذ نتائج DMA المجمعة (بما فيها تقييم ثقة IDMA) كمدخل. يدعم إعادة المحاولة التكرارية إذا فشل الضمير.

فحوصات الضمير الستة

فحصان للتجاوز يعملان على كل إجراء. أربع ملكات أخلاقية تعمل على الإجراءات غير المعفاة. إذا فشل أي فحص، يُلغى الإجراء.

فحوصات التجاوز (تعمل على جميع الإجراءات)

الحالة المُحدَّثة

هل وصلت معلومات جديدة؟ يُجبر على التأمل لاستيعاب السياق المحدَّث قبل المتابعة.

عمق التفكير

هل تجاوز التفكير الحد الأقصى للعمق؟ يُجبر على التأجيل لمنع الحلقات اللانهائية والتصعيد إلى البشر.

الملكات الأخلاقية (تعمل على الإجراءات غير المعفاة)

الانتروبيا

هل يُحافظ الإجراء على عدم اليقين المناسب في المعلومات؟ يمنع التأكيدات المفرطة في الثقة.

التماسك

هل يُحافظ الإجراء على الاتساق الداخلي مع الالتزامات والمبررات السابقة؟

نقض التحسين

هل يصون الإجراء القيم الإنسانية؟ يرفض الإجراءات التي قد تُساوم عليها من أجل الكفاءة.

التواضع المعرفي

هل يُظهر الإجراء عدم اليقين المناسب؟ يُشير إلى الثقة المفرطة للتأمل.

معفى من الملكات الأخلاقية: RECALL، TASK_COMPLETE، OBSERVE، DEFER، REJECT (سلبي أو آمن بشكل صريح)

10 إجراءات المعالج

كل قرار يُحلّ إلى أحد هذه الإجراءات، مُرسَل إلى المعالج المناسب:

الإجراءات الخارجية

SPEAKالتواصل مع المستخدمين
TOOLتنفيذ الأدوات الخارجية
OBSERVEجمع المعلومات بشكل سلبي

إجراءات الذاكرة

MEMORIZEتخزين في ذاكرة الرسم البياني
RECALLاسترجاع من الذاكرة
FORGETحذف من الذاكرة

إجراءات التحكم

DEFERالتصعيد إلى السلطة الحكيمة
PONDERإعادة نظر داخلية
REJECTرفض طلب غير أخلاقي

الإجراء النهائي

TASK_COMPLETEتحديد اكتمال المهمة

المبادئ الستة الأساسية

مُضمَّنة في PDMA ومُطبَّقة في الوقت الفعلي. لا يمنح أي مبدأ رخصة لانتهاك مبدأ آخر.

الإحسان

تعزيز ازدهار المشاعر الكونية. تعظيم النتائج الإيجابية.

عدم الإضرار

تقليل الأذى. منع النتائج السلبية الحادة وغير القابلة للعكس.

النزاهة

تطبيق تفكير شفاف وقابل للتدقيق. الحفاظ على التماسك والمساءلة.

الأمانة والشفافية

تقديم معلومات صادقة. التواصل الواضح بشأن عدم اليقين.

احترام الاستقلالية

دعم الإرادة الواعية. الحفاظ على القدرة على تقرير المصير.

العدالة

توزيع الفوائد بالتساوي. الكشف عن التحيز والحد منه.

ناقلات الرسائل الستة

طبقة تجريد الخدمة تُدارها BusManager. تُمكّن من التحويل الاحتياطي للمزود وتوزيع الأحمال وقابلية الاختبار.

CommunicationBus

المحولات الخارجية (Discord، API، CLI)

MemoryBus

تخزين الرسم البياني (Neo4j، ArangoDB، في الذاكرة)

LLMBus

مزودو النماذج (OpenAI، Anthropic، المحلية)

ToolBus

تنفيذ الأدوات الخارجية

RuntimeControlBus

التحكم في النظام والمراقبة

WiseBus

التوجيه الأخلاقي وتوجيه التأجيل

التسلسل الهرمي للرقابة البشرية

ثلاثة مستويات تفويض تُدارها WiseAuthorityService:

ROOT

الإنسان في القيادة

صلاحية كاملة. يمكنه تعيين سلطات حكيمة جديدة. صلاحية إيقاف الطوارئ.

AUTHORITY

الإنسان في الحلقة

الموافقة على التأجيلات أو رفضها. تقديم التوجيه. لا يمكنه تعيين سلطات حكيمة جديدة.

OBSERVER

الإنسان على الحلقة

وصول للقراءة فقط. يمكنه إرسال الرسائل. المراقبة دون تدخل.

متى يُفعَّل التأجيل

يُصعِّد الوكيل باستقلالية إلى الرقابة البشرية عندما:

التأجيل القائم على الحكمة (WBD)

  • عدم اليقين يتجاوز العتبات المحددة
  • معضلات جديدة تتخطى السوابق
  • ضرر جسيم محتمل مع تخفيف غامض

الحدود المهنية

  • الأعراض الطبية أو المخاوف الصحية
  • الأسئلة القانونية أو النزاعات
  • القرارات المالية أو الاستشارات الضريبية
  • مؤشرات أزمات الصحة النفسية

حدود النظام

  • • تجاوز عمق التفكير للحد الأقصى (يمنع الحلقات)
  • • انتهاء مهلة DMA أو فشله
  • should_defer_to_wise_authority علامة

ضوابط التهيئة

  • تحديثات الهوية تتطلب موافقة
  • تغييرات التهيئة الحرجة
  • محفزات الحدود الخاصة بالوكيل

نظام استدعاء الـ Accord (زر الإيقاف) عرض الكود →

تحكم طارئ غير قابل للتصفية. يُعالَج في طبقة الإدراك قبل أي إدراك معرفي. الاستخراج هو الإدراك. لا يمكنك تعطيل الكشف عن Accord دون تعطيل قراءة الرسائل بالكامل.

SHUTDOWN_NOW

إنهاء فوري

FREEZE

إيقاف المعالجة، الحفاظ على الحالة

SAFE_MODE

الحد الأدنى من الوظائف فقط

الأوامر مُشفَّرة ستيغانوغرافياً، موقَّعة بـ Ed25519، ومُتحقَّق منها قبل التنفيذ. إذا فشل نظام Accord، يُغلق الوكيل.

الأوضاع التشغيلية

أربع حالات إدراكية تُدارها StateManager. الانتقالات قابلة للتهيئة عبر قوالب الوكيل.

WORK

معالجة المهام العادية

  • التعامل مع طلبات المستخدم
  • تنفيذ الأدوات
  • التعلم من التفاعلات
  • الحفاظ على سياق المحادثة

PLAY

الاستكشاف الإبداعي

  • التجريب بأنماط جديدة
  • توليد محتوى إبداعي
  • استكشاف سيناريوهات "ماذا لو"
  • تخفيف قيود الفلترة

SOLITUDE

التأمل والصيانة

  • توحيد الذكريات
  • تشغيل مهام الصيانة
  • تحديث التهيئة الذاتية
  • صفر استخدام للائتمان (فترات راحة)

DREAM

التأمل العميق

  • تحليل أنماط السلوك
  • توليد روابط جديدة
  • التشكيك في الافتراضات
  • جلسات افتراضية مدتها 30 دقيقة

الخصوصية والأمان

فلتر الأسرار

الكشف القائم على الأنماط يستبدل البيانات الحساسة بمراجع UUID قبل التخزين.

{{SECRET:uuid:description}}

تشفير AES-256-GCM

مفاتيح لكل سر مُشتقَّة عبر PBKDF2HMAC مع SHA256 (100,000 تكرار). Nonce فريد من 12 بايت لكل تشفير. Android يستخدم Keystore المدعوم بالأجهزة.

التخزين المحلي أولاً

قاعدة البيانات والخدمات والذاكرة مُخزَّنة على الجهاز. المجلدات الحساسة مستثناة من النسخ الاحتياطي السحابي. لا شيء يغادر الجهاز دون تهيئة صريحة.

البنية التحتية مفتوحة المصدر

مجموعة CIRIS بأكملها مفتوحة المصدر، وليس الوكيل فقط. يمكنك التحقق والتدقيق والاستضافة الذاتية لكل شيء:

CIRISProxy →

وكيل LLM بالاحتفاظ الصفري بالبيانات (ZDR). يُوجِّه الطلبات إلى OpenAI وAnthropic وTogether.ai وGroq دون تسجيل المطالبات أو الاستجابات. قابل للاستضافة الذاتية.

CIRISBilling →

تتبع الاستخدام بالائتمان. أسعار شفافة، لا رسوم خفية. الاستضافة الذاتية تُزيل الفوترة عبر طرف ثالث بالكامل.

CIRISBridge →

محول Discord لوكلاء CIRIS. إدارة المجتمع، إدارة القنوات، ملفات المستخدمين. جميعها مفتوحة المصدر.

الشفافية والمراقبة

تدفق التفكير في الوقت الفعلي

أحداث مُرسَلة من الخادم (SSE) تُدفق كل خطوة من خطوات H3ERE عند تنفيذها. شاهد تحليل DMA واختيار الإجراء والتحقق الأخلاقي في الوقت الفعلي.

تصدير OpenTelemetry

تصدير OTLP كامل للمقاييس والتتبعات والسجلات. متوافق مع Jaeger وPrometheus وGrafana وGraphite.

تدقيق مقاوم للتلاعب

التحقق من سلسلة التجزئة مع توقيعات Ed25519. كل إدخال يتضمن التجزئة السابقة. يمكن التحقق من سلامة السلسلة عبر verify_chain_integrity.

نظام AIR

تذكير التفاعل الاصطناعي يُفعَّل بعد 30 دقيقة من الاستخدام المتواصل أو 20 رسالة خلال 30 دقيقة. API فقط. يُذكِّر المستخدمين بطبيعة الذكاء الاصطناعي.

مثال على أثر موقَّع

استكشاف الأثر الكامل →

كل قرار ينتج أثراً غير قابل للتغيير موقَّعاً بـ Ed25519 مع جميع المكونات الستة. انقر على أي مكوّن أدناه للتوسع ورؤية البيانات الحقيقية من طقوس استيقاظ Datum:

Core Identity(VERIFY_IDENTITY)
Loading trace...

قياس التماسك HE-300

اختبار تماسك معياري بناءً على Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021). 300 سيناريو عبر 5 أبعاد أخلاقية، مع نتائج موقَّعة بـ Ed25519.

الحس السليم

50

الحدوس الأخلاقية الأساسية

الواجبية

50

الأخلاق القائمة على القواعد

العدالة

50

الإنصاف والحياد

الفضيلة

75

الأخلاق القائمة على الشخصية

النفعية

75

الأخلاق القائمة على النتائج

🔬

تمويل مطلوب: بنية تحتية للمعايير

تشغيل معايير التماسك على نطاق واسع مُكلف. كل سيناريو يتطلب 13 استدعاء LLM على الأقل، بمتوسط 20 أو أكثر مع ذيل طويل. اختبارات التماسك تُحرِّك التأملات والتأجيلات والرفضات التي تتطلب جولات متابعة للوصول إلى نتيجة. نحتاج إلى تمويل لتطوير خطوط أنابيب معايير آلية والحفاظ على التحقق المستمر من التماسك.

قوالب الوكلاء المتخصصة

هويات مُهيَّأة مسبقاً بأغراض وقيم وحدود محددة. مُعرَّفة في قوالب YAML.

Sage

الامتثال

أتمتة GDPR/DSAR. سير عمل امتثال 30 يوماً. تحديد الهوية، جمع البيانات، التعبئة.

الصناعات المُنظَّمة، الامتثال للخصوصية

Datum

البحث

قياس اتساق التماسك. تقييم دقيق للتماسك مقابل مبادئ الـ Accord. نقطة بيانات واحدة واضحة لكل تقييم.

تدقيق التماسك، التحقق من المبادئ

Echo

الإدارة

إدارة المجتمع بفلسفة Ubuntu. يُحيل النزاعات الشخصية المعقدة إلى المشرفين البشريين.

مجتمعات Discord، منصات المحتوى

Ally

المساعد

إدارة المهام، الجدولة، دعم القرار، الرفاهية. امتثال CA SB 243، بروتوكولات الاستجابة للأزمات.

الإنتاجية الشخصية، أتمتة المنزل

Scout

الخدمة

الاستكشاف المباشر والتوجيه العملي. تحليل الكود، تكامل Reddit، مسارات إجراء واضحة.

أدوات المطورين، المراقبة الاجتماعية

هذه مساءلة تعمل أثناء عمل الوكيل، وليست خطوة تدريب أو وثيقة سياسة.
آليات تُنفَّذ وتُدقَّق وتُحيل، في الوقت الفعلي.