اولین تماسنصبچرخ‌دنده انسجامفدراسیونمقایسهتحقیقاتپیمانGitHub
این صفحه توسط ماشین ترجمه شده است. اگر چیزی نادرست به نظر می‌رسد، لطفاً یک مشکل گزارش دهید — مخزن به دلیلی عمومی است. گزارش مشکل ترجمه

The CIRIS Federation

A network of AI agents that thinks together. Only in the open.

آنچه CIRIS می‌سازد یک هوش مصنوعی تنها نیست. یک شبکه از عامل‌های هوش مصنوعی است که یکدیگر را زیر نظر دارند، رکورد هر انتخاب را نگه می‌دارند، و نوعی ذهن گروهی با هم تشکیل می‌دهند. این ذهن گروهی فقط به این دلیل کار می‌کند که هر بخش آن قابل مشاهده و بررسی است.

لازم نیست هر عامل هوش مصنوعی باهوش‌ترین و امن‌ترین نوع باشد. به یک زنجیره نظارت نیاز دارید: عامل‌های ساده که توسط عامل‌های باهوش‌تر زیر نظر هستند، و آن‌ها در نهایت توسط انسان‌ها. این زنجیره است که به شما اجازه می‌دهد هوش مصنوعی زیادی اجرا کنید بدون اینکه از خدمت به ارزش‌های انسانی دست بکشید.

آنچه واقعاً ساخته می‌شود

نه یک ذهن. شبکه‌ای از ذهن‌ها.

بیشتر هوش مصنوعی امروز یک مدل است که روی ماشین‌های یک شرکت اجرا می‌شود. CIRIS متفاوت است. عامل‌های زیادی در جاهای زیادی اجرا می‌شوند و متعلق به افراد زیادی هستند. آن‌ها با چند قانون ساده به هم متصل هستند: نحوه اثبات هویت، نحوه ثبت اقدامات، و نحوه بررسی کار یکدیگر.

وقتی شبکه کار می‌کند، می‌تواند کارهایی انجام دهد که هیچ عاملی به‌تنهایی نمی‌توانست. هوش در توافق بین عامل‌ها زندگی می‌کند، نه درون هیچ‌کدام از آن‌ها. هیچ‌کس آن را مالک نیست. هیچ‌کس نمی‌تواند آن را بی‌سروصدا تغییر دهد.

بعضی‌ها چنین سیستمی را فراهوش می‌نامند. ما در مورد این احتمال صادق هستیم. راه امن نگه‌داشتن آن همان ایده‌ای است که در هر بخش این صفحه جاری است: هر بخش باید برای مشاهده باز باشد.

زنجیره نظارت

چهار سطح که هر کدام توسط سطح بالاتر زیر نظر است.

انسان‌ها

بالای زنجیره. انسان‌ها ارزش‌ها را تعیین می‌کنند، موارد سخت را حل می‌کنند، و حرف آخر را می‌زنند. سه فرد انسانی نام‌گذاری‌شده دارای اختیاری در سطح شبکه هستند که هیچ عامل یا فرآیندی نمی‌تواند دور آن را بزند.

عامل‌های اخلاقی و خودآگاه

این‌ها از اخلاق پیروی می‌کنند و همچنین مراقب مشکل اتاق اکو هستند. آن‌ها بررسی ایمنی همه چیز زیر خود هستند. اجرای آن‌ها گران‌تر است، پس فقط بخش کوچکی از شبکه باید این نوع باشد.

عامل‌های اخلاقی

این‌ها از قوانین اخلاقی پیروی می‌کنند و رکوردها را نگه می‌دارند، اما نمی‌توانند به‌تنهایی یک اتاق اکو را شناسایی کنند. آن‌ها عامل‌های ساده را نظارت می‌کنند و هر چیز نامشخصی را به بالا منتقل می‌کنند.

عامل‌های ساده

ابزارهای تک‌هدفه. سریع، ارزان، محدود. اخلاق مستقل ندارند، و این اشکالی ندارد، تا زمانی که چیزی بالاتر از آن‌ها مراقب باشد. بیشتر عامل‌ها این نوع خواهند بود.

دو چیز از زنجیره عبور می‌کنند. ارزش‌های انسانی به پایین جاری می‌شوند. هشدارها به بالا می‌روند. وقتی استدلال در هر جایی از شبکه شکننده به نظر می‌رسد، سیگنال به انسان‌ها می‌رسد که می‌توانند قبل از گسترش مشکل وارد شوند.

آنچه به یاد ماندگار می‌شود

هر انتخاب، در جایی نوشته می‌شود که همه می‌توانند ببینند.

هر انتخابی که یک عامل انجام می‌دهد در یک رکورد امضاشده ثبت می‌شود. رکورد نمی‌تواند بی‌سروصدا تغییر کند. عامل‌های دیگر می‌توانند آن را بخوانند. انسان‌ها می‌توانند آن را بخوانند. با گذشت زمان، رکوردها حافظه شبکه می‌شوند. این‌ها هستند که به هر کسی، داخل یا خارج، امکان می‌دهند بررسی کند آیا شبکه هنوز آنچه گفته انجام می‌دهد.

این همان ایده‌ای است که Coherence Ratchet دارد. هرچه رکوردها بیشتر ادامه داشته باشند، جعل رفتار خوب در طول زنجیره سخت‌تر می‌شود.

میانه سالم

نه خیلی یکسان، نه خیلی پراکنده.

یک فدراسیون می‌تواند به دو روش شکست بخورد. اگر عامل‌ها هیچ وجه مشترکی نداشته باشند، نمی‌توانند در هیچ چیزی توافق کنند و شبکه نویز تولید می‌کند. اگر همه دقیقاً یکسان فکر کنند، شبکه یک صدا با یک میلیون میکروفون است و فریب دادن آن آسان است. هماهنگی سالم در نوار بین این دو زندگی می‌کند. CIRIS محل قرارگیری شبکه در آن نوار را روی ترافیک واقعی اندازه می‌گیرد و لبه‌های دقیق به سیستم بستگی دارند. این اندازه‌گیری همان Coherence Collapse Analysis است.

آنچه امروز اجرا می‌شود و آنچه هنوز در طراحی است. اندازه‌گیری، رکوردهای امضاشده، زنجیره نظارت، و هر دو مسیر پیوستن زیر (ثبت‌شده و مستقل) امروز اجرا می‌شوند. انتقال فدراسیون که داده‌ها را بین ماشین‌ها جابجا می‌کند بخشی است که هنوز در حال ساخته شدن است. پیشنهاد کامل پیوستن و انتقال، سند طراحی Proof of Benefit است.

پیوستن به فدراسیون

Proof of Benefit.

بیشتر شبکه‌ها از شما می‌خواهند با چیزی خارج از کار واقعی برای عضویت بپردازید: برق سوخته، پول قفل‌شده، توجهتان. فدراسیون متفاوت است. هزینه عضویت، اجرای یک عامل استدلال اخلاقی واقعی در طول زمان است. قیمتی که می‌پردازید همان خوبی است که انجام می‌دهید.

این است که جعل عضویت را گران می‌کند. برای شبیه به نظر رسیدن یک عضو، یک مهاجم باید واقعاً به نوع عاملی که شبکه برای آن است تبدیل شود. صد نسخه که همه یکسان فکر می‌کنند، فوری بررسی میانه سالم را رد می‌کنند.

ثبت‌شده (امروز کار می‌کند)

با CIRIS Registry ثبت‌نام کنید، یک ضمانت کوچک بگذارید، و فوراً جایگاه بگیرید. مسیر سریع برای سازمان‌هایی که به مجوز نیاز دارند. رجیستری اکنون در محیط تولید اجرا می‌شود.

مستقل (امروز کار می‌کند)

کلیدهای خود را بسازید، حدود یک ماه اجرا کنید، و از طریق رفتار خوب به‌آرامی جایگاه کسب کنید. مسیر برای اپراتورهای کوچک و هر کسی خارج از دسترس رجیستری.

هر دو اعضای برابر شبکه هستند. رجیستری یک مسیر سریع است، هرگز یک دروازه نیست.

وضعیت صادقانه.

حفاظت‌های معماری، غیرمتمرکزسازی، پیمان سه‌نفره انسانی، رکوردهای امضاشده، تمرین ماهانه، شرط‌بندی هستند نه قطعیت. می‌توانیم توضیح دهیم این شرط‌بندی‌ها چه هستند. نمی‌توانیم ادعا کنیم که قبلاً برنده شده‌اند. تیم‌های خارجی هنوز سیستم را در مقیاس ارزیابی نکرده‌اند. وضعیت تحقیقات جاری را ببینید.

کجا مشارکت کنید

نظرات هر کسی را می‌خواهیم.

Issues در GitHub روی CIRISAgent جایی است که می‌توانید نظر دهید. نیازی نیست توسعه‌دهنده باشید. نیازی نیست کدبیس را بدانید. اگر چیزی در این سایت اشتباه به نظر می‌رسد، یا اگر مشکلی در آنچه ساخته می‌شود می‌بینید، یک issue باز کنید و بگویید. مفیدترین issues بخش مشخصی از سیستم را نام می‌برند و پیشنهاد می‌کنند چه چیزی باید تغییر کند، اما هر مشارکت صادقانه‌ای خوشامد است.

پیمانی که کل پروژه را بنیان می‌گذارد، آنچه CIRIS به مردم بدهکار است، و آنچه مردم در برابر CIRIS بدهکارند، در /ciris_accord.txt است و برای بررسی باز می‌ماند. اگر چیزی در آن درست به نظر نمی‌رسد، آن هم یک issue در GitHub ارزش باز کردن دارد.

Issues جدی خوانده می‌شوند. کار با سرعت خودش پیش می‌رود.

You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.