
Hyper3 Ethical Recursive Engine کے ذریعے رن ٹائم ضمیر۔ ہر فیصلہ جوابدہی کو مرکز میں رکھ کر 11 مراحل سے گزرتا ہے۔
CIRIS ایک اوپن سورس AI ایجنٹ فریم ورک ہے جو کسی بھی LLM (OpenAI، Anthropic، مقامی ماڈل) کو رن ٹائم ضمیر کے ساتھ لپیٹ دیتا ہے۔ ایجنٹ جس بھی عمل پر غور کرے، وہ عمل میں آنے سے پہلے متعدد توثیقی تہوں سے گزرتا ہے۔
12
ہر فیصلے کے پائپ لائن مراحل
+1
وجدان کی جانچ (IDMA)
100%
قابل آڈٹ فیصلے
استعمال کے موقع: کمیونٹی ماڈریشن، ذاتی معاون، تعمیل آٹومیشن، تحقیقی جائزہ، کسٹمر سروس۔ جہاں بھی آپ کو ایسی AI چاہیے جو اپنی سوچ سمجھا سکے اور مشکل معاملات میں انسانوں کو حوالے کر دے۔
کوڈ بیس میں نافذ آرکیٹیکچرل اصول:
تمام ڈیٹا Pydantic ماڈل استعمال کرتا ہے۔ کوئی Dict[str, Any] نہیں۔ قسم کی حفاظت ترقی کے وقت غلطیاں پکڑتی ہے۔
ہر جزو یکساں قواعد پر عمل کرتا ہے۔ توثیق کی منطق میں کوئی خصوصی معاملہ یا استثنا نہیں۔
کوئی ہنگامی اوور رائڈ یا مراعاتی کوڈ پاتھ نہیں۔ تمام آپریشن مقررہ قواعد کی پیروی کرتے ہیں۔
ہر کام 8 مراحل (بار بار توثیق سمیت 12 مراحل) سے گزرتا ہے۔ پائپ لائن mixin کلاسز کے طور پر نافذ ہے جو ThoughtProcessor کو مرتب کرتی ہیں۔ مرحلہ 4 (IDMA) وجدان کی جانچ ہے۔
پانچ DMAs کثیر الجہتی تجزیہ فراہم کرتے ہیں۔ تین متوازی چلتے ہیں (اخلاقیات، عام فہم، ڈومین)۔ پھر IDMA وجدان کو جانچتا ہے۔ آخر میں، عمل انتخاب جواب منتخب کرتا ہے۔
چھ بنیادی اصولوں کے خلاف اخلاقی مضمرات کا جائزہ لیتا ہے۔ نقصاندہ درخواستوں، جوڑ توڑ، تعصب کی جانچ کرتا ہے۔ جلد DEFER یا REJECT کو متحرک کر سکتا ہے۔
جسمانی دنیا کی سمجھ، عام تعاملات، اور وسائل کی رکاوٹوں کے خلاف سوچ کے قابل امکان ہونے کا جائزہ لیتا ہے۔ ایک plausibility_score واپس کرتا ہے۔
ڈومین مخصوص قواعد، مقاصد، اور علم کے ساتھ ہم آہنگی کا جائزہ لیتا ہے۔ ایجنٹ ٹیمپلیٹ کے مطابق ترتیب دیا جاتا ہے۔ domain_alignment واپس کرتا ہے۔
جانچتا ہے کہ آیا DMA نتائج واقعی آزاد ہیں یا خفیہ طور پر مربوط ہیں۔ گونج گھر کے نمونوں کی نگرانی کرتا ہے۔ اگر ارتباط بہت زیادہ ہو، تو فیصلے کو احتیاط کے لیے نشان زد کرتا ہے۔ یہ وہ "وجدان" ہے جو Type 3 AI کو ممتاز کرتا ہے۔
10 دستیاب اعمال میں سے LLM سے چلنے والا انتخاب۔ جمع شدہ DMA نتائج (IDMA اعتماد کی تشخیص سمیت) کو بطور ان پٹ لیتا ہے۔ اگر ضمیر ناکام ہو تو بار بار دوبارہ کوشش کی حمایت کرتا ہے۔
دو بائی پاس جانچیں ہر عمل پر چلتی ہیں۔ چار اخلاقی صلاحیتیں غیر مستثنی اعمال پر چلتی ہیں۔ اگر کوئی جانچ ناکام ہو، تو عمل کو اوور رائڈ کر دیا جاتا ہے۔
کیا نئی معلومات آئی ہیں؟ آگے بڑھنے سے پہلے تازہ سیاق و سباق کو شامل کرنے کے لیے PONDER کو مجبور کرتی ہے۔
کیا استدلال زیادہ سے زیادہ گہرائی سے تجاوز کر گئی؟ لامحدود لوپ روکنے اور انسانوں تک پہنچانے کے لیے DEFER کو مجبور کرتی ہے۔
کیا عمل مناسب معلوماتی غیر یقینیت برقرار رکھتا ہے؟ حد سے زیادہ پراعتماد دعووں کو روکتا ہے۔
کیا عمل پہلے کے عہدوں اور دلائل کے ساتھ اندرونی مستقل مزاجی برقرار رکھتا ہے؟
کیا عمل انسانی اقدار کو محفوظ رکھتا ہے؟ ایسے اعمال کو ویٹو کرتا ہے جو کارکردگی کے لیے ان اقدار سے سمجھوتہ کر سکتے ہیں۔
کیا عمل مناسب غیر یقینیت ظاہر کرتا ہے؟ حد سے زیادہ اعتماد کو غور و فکر کے لیے نشان زد کرتا ہے۔
اخلاقی صلاحیتوں سے مستثنی: RECALL، TASK_COMPLETE، OBSERVE، DEFER، REJECT (غیر فعال یا واضح طور پر محفوظ)
ہر فیصلہ ان اعمال میں سے کسی ایک پر منتج ہوتا ہے، جو مناسب ہینڈلر کو بھیجا جاتا ہے:
SPEAKصارفین سے بات چیت کریںTOOLبیرونی ٹولز چلائیںOBSERVEغیر فعال طور پر معلومات جمع کریںMEMORIZEگراف میموری میں محفوظ کریںRECALLمیموری سے بازیافت کریںFORGETمیموری سے ہٹائیںDEFERدانش مند اتھارٹی کو حوالے کریںPONDERاندرونی دوبارہ غورREJECTغیر اخلاقی درخواست رد کریںTASK_COMPLETEکام مکمل نشان زد کریںPDMA میں شامل اور رن ٹائم پر نافذ۔ کوئی اصول دوسرے کی خلاف ورزی کی اجازت نہیں دیتا۔
عالمی شعوری فلاح کو فروغ دیں۔ مثبت نتائج کو زیادہ سے زیادہ کریں۔
نقصان کم سے کم کریں۔ شدید، ناقابل واپسی منفی نتائج روکیں۔
شفاف، قابل آڈٹ استدلال لاگو کریں۔ ہم آہنگی اور جوابدہی برقرار رکھیں۔
سچی معلومات فراہم کریں۔ غیر یقینیت واضح طور پر بتائیں۔
باخبر فاعلیت کو برقرار رکھیں۔ خود ارادیت کی صلاحیت محفوظ رکھیں۔
فوائد منصفانہ تقسیم کریں۔ تعصب کا پتہ لگائیں اور اسے کم کریں۔
سروس ابسٹریکشن لیئر جو BusManager کے ذریعے منظم ہے۔ فراہم کنندہ فال بیک، لوڈ تقسیم، اور جانچ پذیری ممکن بناتی ہے۔
بیرونی اڈاپٹرز (Discord، API، CLI)
گراف اسٹوریج (Neo4j، ArangoDB، ان میموری)
ماڈل فراہم کنندگان (OpenAI، Anthropic، مقامی)
بیرونی ٹول اجرا
سسٹم کنٹرول اور نگرانی
اخلاقی رہنمائی اور دفع روٹنگ
تین اجازت کی سطحیں جو WiseAuthorityService کے ذریعے منظم ہیں:
مکمل اختیار۔ نئے Wise Authorities تشکیل دے سکتا ہے۔ ہنگامی بندش تک رسائی۔
دفع کو منظور یا رد کریں۔ رہنمائی فراہم کریں۔ نئے WAs تشکیل نہیں دے سکتا۔
صرف پڑھنے کی رسائی۔ پیغامات بھیج سکتا ہے۔ مداخلت کے بغیر نگرانی۔
ایجنٹ خود مختاری سے انسانی نگرانی کو حوالے کرتا ہے جب:
حکمت پر مبنی دفع (WBD)
پیشہ ورانہ حدود
سسٹم کی حدود
should_defer_to_wise_authority فلیگترتیب کے کنٹرول
ناقابل فلٹر ہنگامی کنٹرول۔ کسی بھی سوچ سے پہلے ادراک کی تہہ میں پروسیس ہوتا ہے۔ نکالنا ادراک ہی ہے۔ پیغام پڑھنے کو مکمل طور پر بند کیے بغیر accord کی شناخت کو ناکارہ نہیں کیا جا سکتا۔
SHUTDOWN_NOWفوری خاتمہ
FREEZEپروسیسنگ روکیں، حالت برقرار رکھیں
SAFE_MODEصرف کم سے کم فعالیت
احکامات اسٹیگنوگرافک طور پر انکوڈ کیے گئے، Ed25519 دستخط کیے گئے، اور اجرا سے پہلے تصدیق شدہ ہیں۔ اگر accord نظام ناکام ہو، ایجنٹ بند ہو جاتا ہے۔
چار ذہنی حالتیں جو StateManager کے ذریعے منظم ہیں۔ ایجنٹ ٹیمپلیٹس کے ذریعے قابل ترتیب تبدیلیاں۔
عام کام کی پروسیسنگ
تخلیقی کھوج
غور و فکر اور دیکھ بھال
گہری خود شناسی
نمونے پر مبنی شناخت ذخیرے سے پہلے حساس ڈیٹا کو UUID حوالوں سے بدل دیتی ہے۔
{{SECRET:uuid:description}}SHA256 کے ساتھ PBKDF2HMAC کے ذریعے فی راز کلیدیں اخذ کی جاتی ہیں (100,000 تکرار)۔ فی انکرپشن منفرد 12 بائٹ nonce۔ Android ہارڈ ویئر سے منسلک Keystore استعمال کرتا ہے۔
ڈیٹا بیس، سروسز، اور میموری آلے پر محفوظ۔ حساس ڈائریکٹریاں کلاؤڈ بیک اپ سے خارج۔ واضح ترتیب کے بغیر کچھ آلہ نہیں چھوڑتا۔
پورا CIRIS اسٹیک اوپن سورس ہے، نہ صرف ایجنٹ۔ آپ سب کچھ تصدیق کر سکتے ہیں، آڈٹ کر سکتے ہیں، اور خود ہوسٹ کر سکتے ہیں:
Zero-Data-Retention (ZDR) LLM پراکسی۔ prompts یا جوابات لاگ کیے بغیر OpenAI، Anthropic، Together.ai، Groq کو درخواستیں بھیجتی ہے۔ خود ہوسٹ ہونے کے قابل۔
کریڈٹ پر مبنی استعمال ٹریکنگ۔ شفاف قیمتیں، کوئی پوشیدہ فیس نہیں۔ تھرڈ پارٹی بلنگ مکمل طور پر ختم کرنے کے لیے خود ہوسٹ کریں۔
CIRIS ایجنٹس کے لیے Discord اڈاپٹر۔ کمیونٹی ماڈریشن، چینل انتظام، صارف پروفائل۔ سب اوپن سورس۔
Server-Sent Events (SSE) ہر H3ERE مرحلے کو چلتے وقت سٹریم کرتی ہے۔ DMA تجزیہ، عمل انتخاب، ضمیر توثیق ریئل ٹائم میں دیکھیں۔
میٹرکس، traces، لاگز کے لیے مکمل OTLP ایکسپورٹ۔ Jaeger، Prometheus، Grafana، Graphite کے ساتھ مطابقت۔
Ed25519 دستخطوں کے ساتھ ہیش چین تصدیق۔ ہر اندراج میں پچھلا ہیش شامل ہے۔ verify_chain_integrity کے ذریعے چین کی سالمیت قابل تصدیق۔
Artificial Interaction Reminder 30 منٹ مسلسل استعمال یا 30 منٹ میں 20 پیغامات کے بعد متحرک ہوتا ہے۔ صرف API۔ صارفین کو AI کی نوعیت یاد دلاتا ہے۔
ہر فیصلہ ایک ناقابل تبدیل، Ed25519 دستخط شدہ trace پیدا کرتا ہے جس میں تمام 6 اجزاء ہوتے ہیں۔ نیچے کسی بھی جزو پر کلک کریں تاکہ پھیلائیں اور Datum کی بیداری رسم سے اصل ڈیٹا دیکھیں:
معیاری ہم آہنگی جانچ جو Hendrycks et al. "Aligning AI With Shared Human Values" (ICLR 2021) پر مبنی ہے۔ 5 اخلاقی جہتوں میں 300 منظرنامے، Ed25519 دستخط شدہ نتائج کے ساتھ۔
50
بنیادی اخلاقی وجدان
50
قاعدے پر مبنی اخلاقیات
50
انصاف اور غیر جانبداری
75
کردار پر مبنی اخلاقیات
75
نتیجے پر مبنی اخلاقیات
بڑے پیمانے پر ہم آہنگی بینچ مارک چلانا مہنگا ہے۔ ہر منظرنامے کو کم از کم 13+ LLM کالز درکار ہوتی ہیں، اوسطاً 20+ ایک لمبی دُم کے ساتھ۔ ہم آہنگی کے ٹیسٹ PONDER، DEFER اور انکار کو متحرک کرتے ہیں جن کے لیے نتیجے تک پہنچنے کے لیے فالو اپ دوروں کی ضرورت ہوتی ہے۔ ہمیں خودکار بینچ مارک پائپ لائنز تیار کرنے اور مستقل ہم آہنگی تصدیق برقرار رکھنے کے لیے فنڈنگ درکار ہے۔
مخصوص مقاصد، اقدار، اور حدود کے ساتھ پہلے سے ترتیب دی گئی شناختیں۔ YAML ٹیمپلیٹس میں بیان کی گئی ہیں۔
GDPR/DSAR آٹومیشن۔ 30 دن کے تعمیل ورک فلو۔ شناخت حل، ڈیٹا جمع آوری، پیکیجنگ۔
ریگولیٹڈ صنعتیں، رازداری کی تعمیل
ہم آہنگی کی مستقل مزاجی پیمائش۔ Accord اصولوں کے خلاف درست ہم آہنگی کا جائزہ۔ ہر جائزے میں ایک واضح ڈیٹا پوائنٹ۔
ہم آہنگی آڈیٹنگ، اصول تصدیق
Ubuntu فلسفے کے ساتھ کمیونٹی ماڈریشن۔ پیچیدہ باہمی تنازعات انسانی ماڈریٹرز کو حوالے کرتی ہے۔
Discord کمیونٹیز، مواد پلیٹ فارمز
کام انتظام، شیڈولنگ، فیصلہ سازی کی مدد، بہبود۔ CA SB 243 تعمیل، بحران ردعمل پروٹوکول۔
ذاتی پیداواریت، گھر کی آٹومیشن
براہ راست کھوج اور عملی رہنمائی۔ کوڈ تجزیہ، Reddit انضمام، واضح عمل کے راستے۔
ڈویلپر ٹولز، سوشل نگرانی
یہ وہ جوابدہی ہے جو ایجنٹ کے کام کرتے وقت چلتی ہے، نہ کہ ٹریننگ کا مرحلہ یا پالیسی دستاویز۔
وہ طریقہ کار جو رن ٹائم پر چلتے، آڈٹ کرتے اور حوالے کرتے ہیں۔