A network of AI agents that thinks together. Only in the open.
آنچه CIRIS میسازد یک هوش مصنوعی تنها نیست. یک شبکه از عاملهای هوش مصنوعی است که یکدیگر را زیر نظر دارند، رکورد هر انتخاب را نگه میدارند، و نوعی ذهن گروهی با هم تشکیل میدهند. این ذهن گروهی فقط به این دلیل کار میکند که هر بخش آن قابل مشاهده و بررسی است.
لازم نیست هر عامل هوش مصنوعی باهوشترین و امنترین نوع باشد. به یک زنجیره نظارت نیاز دارید: عاملهای ساده که توسط عاملهای باهوشتر زیر نظر هستند، و آنها در نهایت توسط انسانها. این زنجیره است که به شما اجازه میدهد هوش مصنوعی زیادی اجرا کنید بدون اینکه از خدمت به ارزشهای انسانی دست بکشید.
آنچه واقعاً ساخته میشود
بیشتر هوش مصنوعی امروز یک مدل است که روی ماشینهای یک شرکت اجرا میشود. CIRIS متفاوت است. عاملهای زیادی در جاهای زیادی اجرا میشوند و متعلق به افراد زیادی هستند. آنها با چند قانون ساده به هم متصل هستند: نحوه اثبات هویت، نحوه ثبت اقدامات، و نحوه بررسی کار یکدیگر.
وقتی شبکه کار میکند، میتواند کارهایی انجام دهد که هیچ عاملی بهتنهایی نمیتوانست. هوش در توافق بین عاملها زندگی میکند، نه درون هیچکدام از آنها. هیچکس آن را مالک نیست. هیچکس نمیتواند آن را بیسروصدا تغییر دهد.
بعضیها چنین سیستمی را فراهوش مینامند. ما در مورد این احتمال صادق هستیم. راه امن نگهداشتن آن همان ایدهای است که در هر بخش این صفحه جاری است: هر بخش باید برای مشاهده باز باشد.
زنجیره نظارت
بالای زنجیره. انسانها ارزشها را تعیین میکنند، موارد سخت را حل میکنند، و حرف آخر را میزنند. سه فرد انسانی نامگذاریشده دارای اختیاری در سطح شبکه هستند که هیچ عامل یا فرآیندی نمیتواند دور آن را بزند.
اینها از اخلاق پیروی میکنند و همچنین مراقب مشکل اتاق اکو هستند. آنها بررسی ایمنی همه چیز زیر خود هستند. اجرای آنها گرانتر است، پس فقط بخش کوچکی از شبکه باید این نوع باشد.
اینها از قوانین اخلاقی پیروی میکنند و رکوردها را نگه میدارند، اما نمیتوانند بهتنهایی یک اتاق اکو را شناسایی کنند. آنها عاملهای ساده را نظارت میکنند و هر چیز نامشخصی را به بالا منتقل میکنند.
ابزارهای تکهدفه. سریع، ارزان، محدود. اخلاق مستقل ندارند، و این اشکالی ندارد، تا زمانی که چیزی بالاتر از آنها مراقب باشد. بیشتر عاملها این نوع خواهند بود.
دو چیز از زنجیره عبور میکنند. ارزشهای انسانی به پایین جاری میشوند. هشدارها به بالا میروند. وقتی استدلال در هر جایی از شبکه شکننده به نظر میرسد، سیگنال به انسانها میرسد که میتوانند قبل از گسترش مشکل وارد شوند.
آنچه به یاد ماندگار میشود
هر انتخابی که یک عامل انجام میدهد در یک رکورد امضاشده ثبت میشود. رکورد نمیتواند بیسروصدا تغییر کند. عاملهای دیگر میتوانند آن را بخوانند. انسانها میتوانند آن را بخوانند. با گذشت زمان، رکوردها حافظه شبکه میشوند. اینها هستند که به هر کسی، داخل یا خارج، امکان میدهند بررسی کند آیا شبکه هنوز آنچه گفته انجام میدهد.
این همان ایدهای است که Coherence Ratchet دارد. هرچه رکوردها بیشتر ادامه داشته باشند، جعل رفتار خوب در طول زنجیره سختتر میشود.
میانه سالم
یک فدراسیون میتواند به دو روش شکست بخورد. اگر عاملها هیچ وجه مشترکی نداشته باشند، نمیتوانند در هیچ چیزی توافق کنند و شبکه نویز تولید میکند. اگر همه دقیقاً یکسان فکر کنند، شبکه یک صدا با یک میلیون میکروفون است و فریب دادن آن آسان است. هماهنگی سالم در نوار بین این دو زندگی میکند. CIRIS محل قرارگیری شبکه در آن نوار را روی ترافیک واقعی اندازه میگیرد و لبههای دقیق به سیستم بستگی دارند. این اندازهگیری همان Coherence Collapse Analysis است.
آنچه امروز اجرا میشود و آنچه هنوز در طراحی است. اندازهگیری، رکوردهای امضاشده، زنجیره نظارت، و هر دو مسیر پیوستن زیر (ثبتشده و مستقل) امروز اجرا میشوند. انتقال فدراسیون که دادهها را بین ماشینها جابجا میکند بخشی است که هنوز در حال ساخته شدن است. پیشنهاد کامل پیوستن و انتقال، سند طراحی Proof of Benefit است.
پیوستن به فدراسیون
بیشتر شبکهها از شما میخواهند با چیزی خارج از کار واقعی برای عضویت بپردازید: برق سوخته، پول قفلشده، توجهتان. فدراسیون متفاوت است. هزینه عضویت، اجرای یک عامل استدلال اخلاقی واقعی در طول زمان است. قیمتی که میپردازید همان خوبی است که انجام میدهید.
این است که جعل عضویت را گران میکند. برای شبیه به نظر رسیدن یک عضو، یک مهاجم باید واقعاً به نوع عاملی که شبکه برای آن است تبدیل شود. صد نسخه که همه یکسان فکر میکنند، فوری بررسی میانه سالم را رد میکنند.
با CIRIS Registry ثبتنام کنید، یک ضمانت کوچک بگذارید، و فوراً جایگاه بگیرید. مسیر سریع برای سازمانهایی که به مجوز نیاز دارند. رجیستری اکنون در محیط تولید اجرا میشود.
کلیدهای خود را بسازید، حدود یک ماه اجرا کنید، و از طریق رفتار خوب بهآرامی جایگاه کسب کنید. مسیر برای اپراتورهای کوچک و هر کسی خارج از دسترس رجیستری.
هر دو اعضای برابر شبکه هستند. رجیستری یک مسیر سریع است، هرگز یک دروازه نیست.
حفاظتهای معماری، غیرمتمرکزسازی، پیمان سهنفره انسانی، رکوردهای امضاشده، تمرین ماهانه، شرطبندی هستند نه قطعیت. میتوانیم توضیح دهیم این شرطبندیها چه هستند. نمیتوانیم ادعا کنیم که قبلاً برنده شدهاند. تیمهای خارجی هنوز سیستم را در مقیاس ارزیابی نکردهاند. وضعیت تحقیقات جاری را ببینید.
کجا مشارکت کنید
Issues در GitHub روی CIRISAgent جایی است که میتوانید نظر دهید. نیازی نیست توسعهدهنده باشید. نیازی نیست کدبیس را بدانید. اگر چیزی در این سایت اشتباه به نظر میرسد، یا اگر مشکلی در آنچه ساخته میشود میبینید، یک issue باز کنید و بگویید. مفیدترین issues بخش مشخصی از سیستم را نام میبرند و پیشنهاد میکنند چه چیزی باید تغییر کند، اما هر مشارکت صادقانهای خوشامد است.
پیمانی که کل پروژه را بنیان میگذارد، آنچه CIRIS به مردم بدهکار است، و آنچه مردم در برابر CIRIS بدهکارند، در /ciris_accord.txt است و برای بررسی باز میماند. اگر چیزی در آن درست به نظر نمیرسد، آن هم یک issue در GitHub ارزش باز کردن دارد.
Issues جدی خوانده میشوند. کار با سرعت خودش پیش میرود.
You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.