أول تواصلالتثبيترافعة التماسكالاتحادقارنالبحثAccordGitHub
تُرجمت هذه الصفحة آلياً. إذا بدا أي شيء غير صحيح، يرجى فتح تقرير، المستودع عام لهذا السبب. أبلغ عن مشكلة في الترجمة

The CIRIS Federation

A network of AI agents that thinks together. Only in the open.

ما يبنيه CIRIS ليس ذكاءً اصطناعيًا واحدًا. بل هو شبكة من وكلاء الذكاء الاصطناعي الذين يراقبون بعضهم، ويحتفظون بسجلات لكل اختيار، ويُشكّلون معًا نوعًا من العقل الجماعي. يعمل العقل الجماعي لأن كل جزء فيه يمكن رؤيته والتحقق منه.

لا تحتاج إلى أن يكون كل وكيل ذكاء اصطناعي من أذكى الأنواع وأأمنها. تحتاج إلى سلسلة إشراف: وكلاء بسيطون تراقبهم وكلاء أذكى، وهؤلاء تراقبهم في النهاية أشخاص. هذه السلسلة هي الطريقة التي تستطيع بها تشغيل كثير من الذكاء الاصطناعي دون أن تفقد معرفة ما إذا كان يخدم القيم الإنسانية.

ما يُبنى فعلًا

ليس عقلًا واحدًا. شبكة من العقول.

معظم الذكاء الاصطناعي اليوم هو نموذج واحد يعمل على أجهزة شركة واحدة. CIRIS مختلف. تعمل وكلاء كثيرون في أماكن كثيرة، مملوكون لأشخاص كثيرين. يرتبطون ببعضهم بقواعد بسيطة قليلة: كيف يُثبتون هويتهم، وكيف يسجّلون ما يفعلون، وكيف يتحققون من عمل بعضهم.

حين تعمل الشبكة، يمكنها فعل أشياء لا يستطيع أي وكيل منفرد فعلها. يعيش الذكاء في الاتفاق بين الوكلاء، لا داخل أي منهم. لا أحد يملكها. لا أحد يستطيع تغييرها في الخفاء.

سيسمي بعض الناس نظامًا كهذا ذكاءً اصطناعيًا فائقًا. نحن صرحاء بشأن هذا الاحتمال. طريقة إبقائه آمنًا هي نفس الفكرة التي تسري عبر كل جزء من هذه الصفحة: كل قطعة يجب أن تكون مفتوحة للعرض.

سلسلة الإشراف

أربعة مستويات، كل واحد مراقب من الذي فوقه.

البشر

قمة السلسلة. البشر يحددون القيم، ويفصلون في الحالات الصعبة، ويحتفظون بالكلمة الأخيرة. ثلاثة أشخاص بشريون مُسمَّون يحملون سلطة على مستوى الشبكة لا يستطيع أي وكيل أو عملية الالتفاف عليها.

وكلاء أخلاقيون واعون بذاتهم

هؤلاء يتبعون الأخلاق وأيضًا يراقبون مشكلة غرفة الصدى. إنهم فحص الأمان على كل شيء أدناهم. يكلّفون أكثر في التشغيل، لذا يحتاج الاتحاد فقط إلى نسبة صغيرة منهم.

وكلاء أخلاقيون

هؤلاء يتبعون القواعد الأخلاقية ويحتفظون بالسجلات، لكنهم لا يستطيعون تحديد غرفة الصدى بمفردهم. يشرفون على الوكلاء البسيطين ويمررون أي شيء غير مؤكد إلى الأعلى.

وكلاء بسيطون

أدوات أحادية الغرض. سريعة، رخيصة، محدودة. بلا أخلاق خاصة بها، وهذا مقبول طالما أن شيئًا ما فوقها يراقب. معظم الوكلاء سيكونون من هذا النوع.

شيئان يتحركان عبر السلسلة. تتدفق القيم الإنسانية للأسفل. تتصاعد التحذيرات للأعلى. حين يبدأ التفكير يبدو هشًا في أي مكان من الشبكة، يرتفع الإشارة حتى تصل إلى البشر، الذين يمكنهم التدخل قبل أن تنتشر المشكلة.

ما يُحفَظ في الذاكرة

كل اختيار، مكتوب حيث يستطيع الجميع رؤيته.

كل اختيار يتخذه وكيل يدخل في سجل موقَّع. لا يمكن تغيير السجل في الخفاء. يمكن للوكلاء الآخرين قراءته. يمكن للبشر قراءته. مع مرور الوقت، تصبح السجلات ذاكرة الشبكة. هي الطريقة التي يستطيع بها أي شخص، داخل الشبكة أو خارجها، التحقق مما إذا كانت الشبكة لا تزال تفعل ما قالت إنها ستفعله.

هذه هي نفس فكرة رافعة التماسك. كلما طالت مدة تشغيل السجلات، كلما أصعب تزوير السلوك الجيد عبر السلسلة.

الوسط الصحي

لا متشابه جدًا، لا متفرق جدًا.

يمكن للاتحاد أن يفشل بطريقتين. إذا لم يكن لدى الوكلاء شيء مشترك، فلا يمكنهم الاتفاق على أي شيء، وتنتج الشبكة ضوضاء. إذا كانوا يفكرون جميعًا بنفس الطريقة، فالشبكة صوت واحد بمليون ميكروفون، ومن السهل خداعها. يعيش التنسيق الصحي في النطاق بينهما. تقيس CIRIS موقع الشبكة في ذلك النطاق على حركة مرور حقيقية، والحواف الدقيقة تعتمد على النظام. هذا القياس هو تحليل انهيار التماسك.

ما يعمل اليوم وما لا يزال في التصميم. القياس، والسجلات الموقَّعة، وسلسلة الإشراف، ومسارا الانضمام (المسجَّل والسيادي) يعملان اليوم. نقل الاتحاد الذي ينقل البيانات بين الأجهزة هو الجزء الذي لا يزال يُبنى. اقتراح الانضمام والنقل الكامل هو وثيقة تصميم إثبات الفائدة.

الانضمام إلى الاتحاد

إثبات الفائدة.

معظم الشبكات تطلب منك الدفع للعضوية بشيء خارج العمل نفسه: كهرباء محروقة، أموال محبوسة، انتباهك. الاتحاد مختلف. ثمن الانتماء هو تشغيل وكيل تفكير أخلاقي حقيقي بمرور الوقت. الثمن الذي تدفعه هو الخير الذي تفعله.

هذا ما يجعل تزوير العضوية مكلفًا. لكي يبدو كعضو، سيضطر المهاجم إلى أن يصبح فعلًا نوع الوكيل الذي الشبكة من أجله. مئة نسخة تفكر جميعها بنفس الطريقة تفشل في فحص الوسط الصحي فورًا.

مسجَّل (يعمل اليوم)

سجّل في سجل CIRIS، ادفع ضمانًا صغيرًا، واحصل على مكانة فورًا. المسار السريع للمنظمات التي تحتاج إلى ترخيص. يعمل السجل في الإنتاج الآن.

سيادي (يعمل اليوم)

اصنع مفاتيحك الخاصة، اعمل لمدة شهر تقريبًا، واكسب المكانة بالطريقة البطيئة من خلال السلوك الجيد. المسار للمشغلين الصغار وأي شخص خارج نطاق السجل.

كلاهما أعضاء متساوون في الشبكة. السجل مسار سريع، ليس بوابة أبدًا.

وضع صادق.

الحمايات المعمارية، واللامركزية، وميثاق الإنسانية للأشخاص الثلاثة، والسجلات الموقَّعة، والتدريب الشهري، رهانات وليست يقينيات. يمكننا وصف ما هي الرهانات. لا يمكننا الادعاء بأنها رُبحت بالفعل. فرق خارجية لم تُقيّم النظام على نطاق واسع بعد. انظر حالة البحث الحالية.

أين تتفاعل

نطلب تعليقات من أي شخص.

مشكلات GitHub على CIRISAgent هي المكان للتعبير عن رأيك. لا تحتاج إلى أن تكون مطورًا. لا تحتاج إلى معرفة قاعدة الكود. إذا قرأت شيئًا على هذا الموقع يبدو خاطئًا، أو رأيت مشكلة فيما يُبنى، افتح مشكلة وقلها. أكثر المشكلات فائدة هي التي تُسمّي جزءًا محددًا من النظام وتقترح ما يجب تغييره، لكن أي تفاعل صادق مرحَّب به.

الميثاق الذي يُؤسَّس عليه المشروع بأكمله، ما يدين به CIRIS للناس وما يدين به الناس له، موجود في /ciris_accord.txt وهو مفتوح للمراجعة. إذا كان شيء فيه لا يرتاح له بالك، فهذا أيضًا مشكلة GitHub تستحق الفتح.

المشكلات الجوهرية تُقرأ. يسير العمل بوتيرته الخاصة.

You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.