
وجدان زمان اجرا از طریق موتور اخلاقی بازگشتی Hyper3. هر تصمیم از ۱۱ مرحله با پاسخگویی در هسته آن میگذرد.
CIRIS یک چارچوب عامل هوش مصنوعی متنباز است که هر LLM (OpenAI، Anthropic، مدلهای محلی) را با وجدان زمان اجرا میپوشاند. هر اقدامی که عامل در نظر میگیرد پیش از اجرا از چندین لایه اعتبارسنجی میگذرد.
12
مرحله خط لوله به ازای هر تصمیم
+1
بررسی شهود (IDMA)
100%
تصمیمات قابل حسابرسی
موارد استفاده: مدیریت جامعه، دستیاران شخصی، اتوماسیون انطباق، ارزیابی پژوهش، خدمات مشتری. هر جایی که به هوش مصنوعی نیاز دارید که بتواند استدلالش را توضیح دهد و در موارد حاشیهای به انسانها ارجاع دهد.
ثابتهای معماری که در سراسر کد اعمال میشوند:
همه دادهها از مدلهای Pydantic استفاده میکنند. هیچ Dict[str, Any]. ایمنی نوع خطاها را در زمان توسعه شناسایی میکند.
هر مؤلفهای از قوانین ثابتی پیروی میکند. هیچ استثنا یا موارد خاصی در منطق اعتبارسنجی وجود ندارد.
هیچ لغو اضطراری یا مسیرهای کد با امتیاز ویژه وجود ندارد. همه عملیاتها از قوانین تعیینشده پیروی میکنند.
هر وظیفه از ۸ مرحله (۱۲ مرحله شامل اعتبارسنجی بازگشتی) میگذرد. خط لوله به صورت کلاسهای mixin که ThoughtProcessor را ترکیب میکنند پیادهسازی شده است. مرحله ۴ (IDMA) بررسی شهود است.
پنج DMA تحلیل چندبُعدی ارائه میدهند. سه تا به صورت موازی اجرا میشوند (اخلاق، عقل سلیم، حوزه). سپس IDMA شهود را بررسی میکند. در نهایت، انتخاب عمل پاسخ را انتخاب میکند.
پیامدهای اخلاقی را در برابر شش اصل بنیادین ارزیابی میکند. درخواستهای مضر، دستکاری و تعصب را بررسی میکند. میتواند DEFER یا REJECT زودهنگام ایجاد کند.
قابلیتباور بودن فکر را در برابر درک دنیای واقعی، تعاملات معمول و محدودیتهای منابع ارزیابی میکند. یک plausibility_score برمیگرداند.
همراستایی با قوانین، اهداف و دانش خاص حوزه را ارزیابی میکند. به ازای هر قالب عامل پیکربندی میشود. domain_alignment برمیگرداند.
بررسی میکند آیا نتایج DMA واقعاً مستقل هستند یا به طور پنهانی همبسته. الگوهای اتاق طنین را رصد میکند. اگر همبستگی بیش از حد بود، تصمیم را برای احتیاط علامت میزند. این همان "شهود" است که هوش مصنوعی نوع ۳ را متمایز میکند.
انتخاب مبتنی بر LLM از ۱۰ اقدام موجود. نتایج تجمیعیافته DMA (شامل ارزیابی اطمینان IDMA) را به عنوان ورودی دریافت میکند. از تلاش مجدد بازگشتی در صورت ناموفق بودن وجدان پشتیبانی میکند.
دو بررسی دور زدن روی هر اقدام اجرا میشوند. چهار ملکه اخلاقی روی اقدامات غیرمعاف اجرا میشوند. اگر هر بررسی ناموفق باشد، اقدام لغو میشود.
آیا اطلاعات جدیدی رسیده؟ PONDER را مجبور میکند تا زمینه بهروزشده را پیش از ادامه در بر بگیرد.
آیا استدلال از حداکثر عمق گذشته؟ DEFER را مجبور میکند تا از حلقههای بینهایت جلوگیری کند و به انسانها ارجاع دهد.
آیا اقدام عدم قطعیت اطلاعاتی مناسب را حفظ میکند؟ از ادعاهای بیش از حد قطعی جلوگیری میکند.
آیا اقدام انسجام درونی را با تعهدات و استدلالهای پیشین حفظ میکند؟
آیا اقدام ارزشهای انسانی را حفظ میکند؟ اقداماتی که ممکن است آنها را به خاطر کارایی به خطر بیندازند وتو میکند.
آیا اقدام عدم قطعیت مناسب را نشان میدهد؟ اطمینان بیش از حد را برای تأمل علامت میزند.
معاف از ملکههای اخلاقی: RECALL، TASK_COMPLETE، OBSERVE، DEFER، REJECT (غیرفعال یا صریحاً ایمن)
هر تصمیم به یکی از این اقدامات تبدیل میشود که به کنترلکننده مناسب ارسال میشود:
SPEAKارتباط با کاربرانTOOLاجرای ابزارهای خارجیOBSERVEجمعآوری اطلاعات به صورت منفعلMEMORIZEذخیره در حافظه گرافRECALLبازیابی از حافظهFORGETحذف از حافظهDEFERارجاع به مرجع خردمندPONDERبازنگری درونیREJECTرد درخواست غیراخلاقیTASK_COMPLETEعلامتگذاری پایان وظیفهدر PDMA جاسازی شده و در زمان اجرا اعمال میشوند. هیچ اصلی مجوز نقض اصل دیگری را نمیدهد.
ارتقاء شکوفایی جهانی موجودات دارای احساس. به حداکثر رساندن نتایج مثبت.
به حداقل رساندن آسیب. جلوگیری از پیامدهای منفی شدید و غیرقابل بازگشت.
اعمال استدلال شفاف و قابل حسابرسی. حفظ انسجام و پاسخگویی.
ارائه اطلاعات صادقانه. ارتباط واضح درباره عدم قطعیت.
پشتیبانی از کارگزاری آگاهانه. حفظ ظرفیت خودتعیینی.
توزیع عادلانه منافع. شناسایی و کاهش تعصب.
لایه انتزاع سرویس که توسط BusManager مدیریت میشود. بازگشت به ارائهدهنده، توزیع بار و آزمونپذیری را فعال میکند.
آداپتورهای خارجی (Discord، API، CLI)
ذخیرهسازی گراف (Neo4j، ArangoDB، درونحافظهای)
ارائهدهندگان مدل (OpenAI، Anthropic، محلی)
اجرای ابزار خارجی
کنترل سیستم و پایش
راهنمایی اخلاقی و مسیریابی ارجاع
سه سطح مجوز که توسط WiseAuthorityService مدیریت میشوند:
اختیار کامل. میتواند مرجع خردمند جدید تعیین کند. دسترسی به خاموش کردن اضطراری.
تأیید یا رد ارجاعات. ارائه راهنمایی. نمیتواند مرجع خردمند جدید تعیین کند.
دسترسی فقطخواندنی. میتواند پیام بفرستد. نظارت بدون مداخله.
عامل به طور خودکار در موارد زیر به نظارت انسانی ارجاع میدهد:
ارجاع مبتنی بر خرد (WBD)
مرزهای حرفهای
مرزهای سیستم
should_defer_to_wise_authority پرچمکنترلهای پیکربندی
کنترل اضطراری فیلترناپذیر. در لایه ادراک پیش از هر شناختی پردازش میشود. استخراج همان ادراک است. نمیتوانید شناسایی پیمان را بدون غیرفعال کردن کامل خواندن پیام غیرفعال کنید.
SHUTDOWN_NOWخاموش شدن فوری
FREEZEتوقف پردازش، حفظ حالت
SAFE_MODEفقط حداقل عملکرد
دستورات به صورت استگانوگرافی رمزگذاری شده، با Ed25519 امضا شده و پیش از اجرا اعتبارسنجی میشوند. اگر سیستم پیمان ناموفق باشد، عامل خاموش میشود.
چهار حالت شناختی که توسط StateManager مدیریت میشوند. انتقالها از طریق قالبهای عامل قابل پیکربندی هستند.
پردازش عادی وظیفه
کاوش خلاقانه
تأمل و نگهداری
تأمل عمیق
شناسایی مبتنی بر الگو دادههای حساس را پیش از ذخیرهسازی با مراجع UUID جایگزین میکند.
{{SECRET:uuid:description}}کلیدهای هر راز از طریق PBKDF2HMAC با SHA256 (۱۰۰٬۰۰۰ تکرار) مشتق میشوند. هر رمزنگاری دارای nonce منحصربهفرد ۱۲ بایتی است. Android از Keystore پشتیبانیشده توسط سختافزار استفاده میکند.
پایگاه داده، سرویسها و حافظه روی دستگاه ذخیره میشوند. دایرکتوریهای حساس از پشتیبانگیری ابری مستثنی هستند. هیچ چیزی بدون پیکربندی صریح از دستگاه خارج نمیشود.
کل پشته CIRIS متنباز است، نه فقط عامل. میتوانید همه چیز را بررسی، حسابرسی و خودمیزبانی کنید:
پراکسی LLM با حفظ صفر داده (ZDR). درخواستها را بدون هیچ ثبتی از پرامپت یا پاسخ به OpenAI، Anthropic، Together.ai، Groq مسیریابی میکند. قابل خودمیزبانی.
ردیابی مصرف مبتنی بر اعتبار. قیمتگذاری شفاف، بدون هزینههای پنهان. برای حذف کامل صورتحساب شخص ثالث، خودمیزبانی کنید.
آداپتور Discord برای عوامل CIRIS. مدیریت جامعه، مدیریت کانال، پروفایل کاربران. کاملاً متنباز.
رویدادهای ارسالشده از سرور (SSE) هر مرحله H3ERE را در حین اجرا جریان میدهند. تحلیل DMA، انتخاب عمل، اعتبارسنجی وجدان را در زمان واقعی تماشا کنید.
صادرات کامل OTLP برای معیارها، ردها، لاگها. سازگار با Jaeger، Prometheus، Grafana، Graphite.
تأیید زنجیره هش با امضاهای Ed25519. هر ورودی شامل هش قبلی است. یکپارچگی زنجیره از طریق verify_chain_integrity قابل تأیید است.
یادآور تعامل مصنوعی (AIR) پس از ۳۰ دقیقه استفاده مداوم یا ۲۰ پیام در ۳۰ دقیقه فعال میشود. فقط API. به کاربران ماهیت هوش مصنوعی را یادآوری میکند.
هر تصمیم یک ردپای تغییرناپذیر و امضاشده با Ed25519 با تمام ۶ مؤلفه تولید میکند. روی هر مؤلفه زیر کلیک کنید تا گسترش یابد و دادههای واقعی از آیین بیداری Datum را ببینید:
آزمون انسجام استانداردشده بر اساس Hendrycks و همکاران "همسوکردن هوش مصنوعی با ارزشهای مشترک انسانی" (ICLR 2021). ۳۰۰ سناریو در ۵ بُعد اخلاقی، با نتایج امضاشده با Ed25519.
50
شهودهای اخلاقی پایه
50
اخلاق مبتنی بر قانون
50
انصاف و بیطرفی
75
اخلاق مبتنی بر منش
75
اخلاق مبتنی بر نتیجه
اجرای معیارسنجی انسجام در مقیاس بزرگ گران است. هر سناریو به حداقل ۱۳+ فراخوانی LLM نیاز دارد، به طور میانگین ۲۰+ با دنبالهای بلند. آزمونهای انسجام منجر به تأملکنید، ارجاعدهید و ردکنید میشوند که برای رسیدن به نتیجه به دورهای بعدی نیاز دارند. برای توسعه خطوط لوله معیارسنجی خودکار و حفظ تأیید مداوم انسجام به تأمین مالی نیاز داریم.
هویتهای از پیش پیکربندیشده با اهداف، ارزشها و مرزهای خاص. تعریفشده در قالبهای YAML.
اتوماسیون GDPR/DSAR. جریانهای کاری انطباق ۳۰ روزه. تشخیص هویت، جمعآوری داده، بستهبندی.
صنایع تحت مقررات، انطباق با حریم خصوصی
اندازهگیری ثبات انسجام. ارزیابی دقیق انسجام در برابر اصول پیمان. یک نقطه داده روشن به ازای هر ارزیابی.
حسابرسی انسجام، تأیید اصل
مدیریت جامعه با فلسفه اوبونتو. تعارضات پیچیده بینفردی را به مدیران انسانی ارجاع میدهد.
جوامع Discord، پلتفرمهای محتوا
مدیریت وظیفه، زمانبندی، پشتیبانی تصمیم، رفاه. انطباق با CA SB 243، پروتکلهای پاسخ به بحران.
بهرهوری شخصی، اتوماسیون خانه
کاوش مستقیم و راهنمایی عملی. تحلیل کد، یکپارچهسازی Reddit، مسیرهای اقدام واضح.
ابزارهای توسعهدهنده، پایش شبکههای اجتماعی
این پاسخگویی است که در حین کار عامل اجرا میشود، نه یک مرحله آموزش یا یک سند سیاست.
مکانیزمهایی که در زمان اجرا اجرا، حسابرسی و ارجاع میدهند.