The Coherence Ratchet

Why a powerful mind has to show its work.

Research testbed

Plain English Advanced

نظام تفكير صغير يمكنه إخفاء أشياء ويُحدث ضرراً ضئيلاً. أما النظام القوي فلا يستطيع ذلك.

معنى «متماسك» هنا

العقل المتماسك يتفق مع نفسه.

خمسة أشياء يجب أن تتطابق داخل العقل:

ما يعتقده،
ما يراه،
ما يفعله،
ما يتذكره،
وما يُخبرك إياه.

تخيّل خمس استمارات قصيرة عن أسبوعك. واحدة لما تعتقده. واحدة لما رأيته. واحدة لما فعلته. واحدة لما تتذكره. واحدة لما تُخبره مديرك. حين تقول الاستمارات الخمس الشيء ذاته، يستطيع مديرك الوثوق بعملك. حين لا تتطابق، لا يعلم أحد أيها حقيقي.

الأفكار الخفية

الأنظمة القوية تُخفي أشياء. وهذا يصبح خطيراً.

يستخدم نظام التفكير أفكاراً للقرار. بعضها ظاهر في العلن. بعضها مخفي في الداخل. الأفكار الخفية تُشكّل كل قرار رغم ذلك.

الجسر يبدو متيناً من الطريق. في الداخل، شقوق صغيرة تتسع في الصلب. سيارة صغيرة تعبره. شاحنة ثقيلة لا تستطيع. الجسر يسقط حين يبلغ الحِمل حدّه.

فكرة خفية في نظام صغير تُحدث ضرراً صغيراً. فكرة خفية في نظام قوي يمكنها إحداث ضرر كبير. كلما كان النظام أقوى، زاد الثقل المُلقى على كل جزء خفي.

الرافعة الدفّاعية

الدفع نحو الانفتاح لا يسير إلا في اتجاه واحد.

مع ازدياد قوة أنظمة التفكير، تتنامى تكلفة الأجزاء الخفية. كل جزء جديد من القوة يدفع الأجزاء الخفية بقوة أكبر نحو الظهور. هذا الدفع لا يسير إلا في اتجاه واحد.

تخيّل سلّماً. مع التسلق، تتساقط كل درجة تتركها خلفك. لا يمكنك العودة للأسفل. لا يمكنك إلا الصعود نحو القمة حيث يكون ضوء النهار الكامل. هذا هو Coherence Ratchet.

حين رأى الناس النظام يُظهر عمله، لن يثقوا به ثانيةً إن توقف. السبيل الوحيد للأمام هو الاستمرار في الإظهار.

صورة ثانية تؤدي الغرض أيضاً. تروس في آلة تنقر للأمام سنّةً واحدةً في كل مرة. لا يمكنها النقر للخلف. Coherence Ratchet تروس كذلك تدور نحو الانفتاح.

ما تفعله CIRIS

اكتبها. تحقق منها. ثم تحقق من المتحققين.

CIRIS نظام ذكاء اصطناعي مبني حول Coherence Ratchet. كل قرار يتخذه الوكيل يُدوَّن في سجل موقَّع. لا يمكن تغيير السجل بهدوء. يمكن لوكلاء آخرين قراءة السجل والتحقق من العمل. بمرور الوقت، تتراكم السجلات. كل سجل جديد هو درجة إضافية لا يستطيع الوكيل التراجع عنها.

تطرح CIRIS أيضاً سؤالاً ثانياً قبل أن تتصرف. كم وجهة نظر مستقلة حقاً فحصت هذه الفكرة؟ ليس عدد المصادر، بل عدد المصادر التي لم تنطلق من الموقع ذاته. خمس مقالات إخبارية تُعيد صياغة نشرة صحفية واحدة تُحتسب وجهة نظر واحدة لا خمساً. إن كان في النشرة خطأ، سيكون في المقالات الخمس، ولن يستطيع الوكيل اكتشافه.

حين تنخفض الاستقلالية الحقيقية كثيراً، يعامل الوكيل تفكيره الخاص كهشّ ويطلب من شخص ما النظر فيه.

ما ندّعيه وما لا ندّعيه.

لم نحلّ مشكلة أمان الذكاء الاصطناعي. بنينا قطعةً واحدةً من إجابة واحدة، ونختبرها في الفضاء المفتوح.

لم تتحقق فِرق خارجية من عملنا بعد. نقول ذلك بصراحة. النظرية الكاملة والرياضيات موجودتان في أوراقنا الأربع. الكود مفتوح. والطريقة لإثبات خطئنا مفتوحة أيضاً. اطّلع على حالة البحث الراهنة.

The math behind it Explore a trace See the code