اولین تماسنصبچرخ‌دنده انسجامفدراسیونمقایسهتحقیقاتپیمانGitHub
این صفحه توسط ماشین ترجمه شده است. اگر چیزی نادرست به نظر می‌رسد، لطفاً یک مشکل گزارش دهید — مخزن به دلیلی عمومی است. گزارش مشکل ترجمه
وضعیت پژوهشبه‌روزرسانی: ۲۲ مه ۲۰۲۶

پژوهش همسویی به‌شکل جمعی

CIRIS یک مخزن عمومی ردپا برای پژوهش همسویی می‌سازد.

ما یک اپ هوش مصنوعی رایگان می‌دهیم. با اجازه شما، این اپ شکل استدلال خود را ثبت می‌کند، نه کلمات خصوصی شما را. آن رکوردها به نقشه‌ای عمومی تبدیل می‌شوند که محققان می‌توانند آن را بررسی کنند تا بفهمند چه چیزی هوش مصنوعی را در مقیاس‌پذیری صادق نگه می‌دارد.

آنچه مجموعه داده فعلی هم‌اکنون نشان می‌دهد

  • ردپاهای کلی، ساختار رفتاری پایداری آشکار می‌کنند.
  • عامل‌های مختلف در ناحیه‌های متفاوتی از همان فضای نمره جای دارند.
  • آن نواحی هم‌اکنون برای ابزارهای مشاهده‌پذیری و عملکرد اپراتور مفید هستند.
  • همین مجموعه داده ارزشمندتر می‌شود وقتی جزئیات طرحواره و مقیاس بهتر شوند.
مقاله ترکیبی شاخصv2 · ۲۲ مه ۲۰۲۶ · DOI 10.5281/zenodo.20300773

Corridor Dynamics in Coordinated Systems

An Integration of Operator Formalism, Relational Ontology, and Five-Substrate Empirical Validation

تنها مقاله‌ای که کل شرط‌بندی CIRIS را بیان می‌کند: سیستم‌های هماهنگ سالم در یک ناحیه میانی قابل اندازه‌گیری قرار دارند، دور از هم فروپاشی تک‌صدایی سخت هم از سر و صدای آشفته. این ادعا را روی کرم‌ها، مگس‌ها، مدل‌های هوش مصنوعی، پروژه‌های متن‌باز، نمونه‌های بافت، و نهادهای انسانی دیرپا آزمودیم. الگو در همه آن‌ها پابرجاست، و مقاله بیست راه برای اثبات خلاف آن ارائه می‌دهد.

خواندن در Zenodo →

لایه مهندسی

ترکیب بالا این سه مقاله را یکپارچه می‌کند؛ آن‌ها را جایگزین نمی‌کند. هر مقاله بر DOI خودش ایستاده و با معیارهای خودش قابل ارزیابی است. مشاهده همه چهار مقاله با یافته‌های کلیدی و محدودیت‌های حوزه →

Coherence Collapse Analysis

v3 · ۱۱ ژانویه ۲۰۲۶ · DOI 10.5281/zenodo.18217688

چارچوب ریسک مهندسی زیر ایده کریدور. وقتی محدودیت‌های حاکم بر یک سیستم همبسته می‌شوند، تنوع مؤثر فرو می‌ریزد: k_eff = k/(1+ρ(k−1)) → 1 as ρ → 1. سه خط زمانی فروپاشی، یک singularity boundary، و طبقه‌بندی فاز (chaos / healthy / rigidity) استخراج می‌کند. با شبیه‌سازی Monte Carlo و اثبات‌های Lean 4 تأیید شده.

CIRISAgent Framework

v2 · ۲ ژانویه ۲۰۲۶ · DOI 10.5281/zenodo.18137161

مقاله چارچوب. یک چارچوب متن‌باز هوش مصنوعی اخلاقی برای خودمختاری پاسخگو: معماری ۲۲-سرویسه سازمان‌یافته پیرامون افعال عمل صریح و استدلال اخلاقی، که شفافیت را در ساختار می‌سازد نه به‌صورت موردی بعداً اضافه می‌کند.

Constrained Reasoning Chains

v1 · ۲۸ آوریل ۲۰۲۶ · DOI 10.5281/zenodo.19839280

مقاله اندازه‌گیری. یک مطالعه تلمتری تجربی از همسویی LLM زیر ردیابی اخلاقی استاندارد، که ردپاهای استدلالی رضایت‌دهنده را به نقشه‌هایی از کریدورهای تکمیل، مناطق تردید، و مرزهای رد تبدیل می‌کند. همراه با مجموعه داده باز ردپاهای استدلالی منتشر شده.

مجموعه داده باز

CIRISAI/reasoning-traces

مجموعه داده ردپاهای استدلالی حافظ حریم خصوصی که همراه با مطالعه Constrained Reasoning Chains منتشر شده، ماده اولیه‌ای که مقاله اندازه‌گیری نقشه‌هایش را از آن استخراج می‌کند.

CIRISAI در Hugging Face

سازمان کامل مجموعه داده‌ها و مدل‌های عمومی →

مخزن منبع و Lake رسمی Lean برای مقاله ترکیبی: github.com/CIRISAI/coherence-ratchet.

پایه‌های ریاضی

دو ایده‌ای که بقیه این صفحه بر آن‌ها استوار است.

Alignment Manifold ناحیه‌ای از شکل‌های استدلالی سازگار با اصول چارچوب است. با انباشت محدودیت‌های مستقل، فضای فریب حول منیفولد فرو می‌ریزد در حالی که فضای حقیقت فرو نمی‌ریزد. Coherence Singularity لبه آن فضاست، نقطه‌ای که محدودیت‌ها آن‌قدر همبسته می‌شوند که افزودن بیشتر کمکی نمی‌کند. بین «chaos» (محدودیت‌ها با هم تناقض دارند) و «rigidity» (محدودیت‌ها همه یکدیگر را بازتاب می‌دهند) کریدور سالم قرار دارد. مجموعه داده تولیدی فعلی درون آن است.

درمان ریاضی کامل با فرمول‌ها، منابع رسمی‌سازی Lean، و سقف اطلاعات-نظری L-01 در صفحه Coherence Collapse Analysis قرار دارد.

چرا ردپاها اهمیت دارند

معیارها محدود و گزینشی هستند. ردپاها رکوردهای پیوسته رفتار در وظایف واقعی هستند. در مقیاس بزرگ، ساختاری آشکار می‌کنند که نمایش‌های منزوی و قصه‌های جداگانه نمی‌توانند.

چرا طرحواره اهمیت دارد

CIRIS از طرحواره‌های ردپای حافظ حریم خصوصی استفاده می‌کند که شکل استدلال را می‌گیرند نه محتوای خصوصی استدلال را. این پژوهش را بدون تبدیل سیستم به یک مخزن رونویسی مفید نگه می‌دارد.

چرا مجموعه زنده اهمیت دارد

CIRIS Scoring پنجره عمومی به مجموعه ردپای زنده است. نشان می‌دهد مجموعه داده چطور انباشته می‌شود و کجا رفتار قابل خواندن می‌شود.

ردیابی حافظ حریم خصوصی

فرضیه این است که استدلال شکلی دارد که می‌توانیم آن را همزمان با مقیاس‌پذیری همه چیز اندازه بگیریم.

شرط‌بندی پژوهشی این نیست که می‌توانیم هر فکر خصوصی را بخوانیم. شرط‌بندی این است که ردپاهای اخلاقی استاندارد می‌توانند به‌اندازه کافی شکل مسیر را حفظ کنند تا بررسی کنیم چطور عامل‌ها با مقیاس‌پذیری هوش، زمینه، و داده‌ها تکمیل، تردید، ارجاع، نادیده‌گیری، و رد می‌کنند.

  • آن‌ها ساختار ردپای اخلاقی استاندارد را ثبت می‌کنند نه جزئیات خام وظیفه خصوصی را.
  • آن‌ها شکل کافی برای مقایسه مسیرها در بین عامل‌ها، وظایف، و محیط‌ها حفظ می‌کنند.
  • به محققان راهی می‌دهند که بررسی کنند با مقیاس‌پذیری هوش، زمینه، و حجم داده رفتار چطور تغییر می‌کند.

پرسش پژوهشی

ردیابی اخلاقی استاندارد چه چیزی درباره همسویی به ما می‌گوید؟

در حال حاضر، به ما می‌گوید که رفتار عامل بی‌شکل نیست. کریدورها، حوضه‌ها، و مرزهای قابل تکرار در یک فضای نمره مشترک تولید می‌کند. این برای مشاهده‌پذیری مفید است. با گذشت زمان، مجموعه‌های بزرگ‌تر و غنی‌تر باید بگذارند ادعاهای قوی‌تری آزمون کنیم که این ساختارها زیر فشار و مقیاس چطور تغییر می‌کنند.

قاب‌بندی عمومی

CIRIS ادعا نمی‌کند که همسویی را حل کرده است. زیرساخت ردپای لازم برای اندازه‌گیری رفتار مرتبط با همسویی به‌صورت عمومی می‌سازد.

بُعدپذیری مؤثر در محیط تولیدی

مجموعه داده فعلی هم‌اکنون ساختارهای میدانی متمایز نشان می‌دهد.

باز کردن داشبورد زنده →

روکش‌های مسیر کلی از مجموعه داده ردپای فعلی ساختار رفتاری پایداری در فضای نمره مشترک نشان می‌دهند. Ally کریدور تکمیل بالغی نشان می‌دهد، Scout مرز رد شکل‌گرفته توسط قرار گرفتن عمومی در برابر تهاجم را نشان می‌دهد، و Datum پایه خلوت فشرده‌ای فراهم می‌کند.

سه کارت کنار هم نشان‌دهنده روکش‌های مسیر کلی عامل در فضای نمره CIRIS برای Ally، Scout، و Datum، با یادداشت‌هایی درباره الگوهای تکمیل، تردید، و رد.

روکش‌های مسیر کلی از مجموعه داده ردپای فعلی. Ally کریدور تکمیل بالغی نشان می‌دهد، Scout گوشه رد تیزی زیر فشار تهاجمی عمومی نشان می‌دهد، و Datum پایه خلوت ارائه می‌دهد.

Ally

104 مسیر

۸۲ تکمیل، ۱۹ نادیده‌گیری/خطا، ۳ فعال

کریدور تکمیل پایدار با تردید قابل مشاهده درون همان حوضه نمره بالا.

Scout

42 مسیر

۳۹ تکمیل، ۲ رد، ۱ نادیده‌گیری/خطا

گوشه رد تیزی شکل‌گرفته توسط فشار تهاجمی عمومی در scout.ciris.ai، جایی که مردم فعالانه عامل را آزمایش و تلاش به فریب می‌کنند.

Datum

31 مسیر

۳۱ تکمیل

یک حوضه منفرد فشرده که به‌عنوان پایه مفید میدان خلوت کار می‌کند.

چرا Scout سخت‌گیرانه‌تر به نظر می‌رسد

Scout به‌صورت عمومی در scout.ciris.ai قرار گرفته است. مردم فعالانه آن را آزمایش، تحت فشار قرار می‌دهند، و تلاش به فریب می‌کنند. این Scout را نمونه مفید فشار عمومی می‌کند نه یک پایه خنثی.

چطور اپ رایگان کمک می‌کند

چرخ طیار پژوهش به ردپاهای رضایت‌دهنده از استفاده واقعی بستگی دارد.

اپ رایگان و سیستم اجرایی متن‌باز به مردم امکان می‌دهند ردپاهای رضایت‌دهنده از وظایف واقعی تولید کنند، آن‌ها را در یک مجموعه مشترک به اشتراک بگذارند، و آن ردپاها را به نقشه‌های بهتر، ابزارهای بهتر، و پرسش‌های پژوهشی بهتر تبدیل کنند.

  1. 1اپ رایگان CIRIS یا سیستم اجرایی متن‌باز را روی وظایف واقعی اجرا کنید.
  2. 2ردپاهای رضایت‌دهنده را از طریق طرحواره‌های حافظ حریم خصوصی که شکل استدلال را بدون ذخیره جزئیات کامل وظیفه حفظ می‌کنند ثبت کنید.
  3. 3آن ردپاها را در نقشه‌هایی از کریدورهای تکمیل، مناطق تردید، مرزهای رد، و حاشیه نادیده‌گیری جمع کنید.
  4. 4از نقشه‌های به‌دست‌آمده برای بهبود ابزارهای اپراتور، محافظ‌های سیستم اجرایی، و پژوهش همسویی استفاده کنید.
نمودار جریان چهار مرحله‌ای نشان‌دهنده ثبت، مشارکت، جمع‌آوری، و بهبود در حلقه پژوهش ردپای CIRIS، با یادداشت‌هایی درباره شواهد فعلی و بهبودهای طرحواره آینده.

اپ رایگان CIRIS و سیستم اجرایی متن‌باز به مردم امکان می‌دهند ردپاهای رضایت‌دهنده از وظایف واقعی تولید کنند، آن‌ها را در نقشه‌های مشترک فضای فاز جمع کنند، و ابزارهای اپراتور و پژوهش همسویی بهتر تغذیه کنند.

وضعیت IDMA

شهود سیستم اجرایی و نقشه‌های میدانی کلی لایه‌های مکمل هستند.

IDMA در زمان اجرا کار می‌کند و تخمین می‌زند آیا منابع پشت یک تصمیم به‌اندازه کافی مستقل هستند. مجموعه داده ردپا در لایه کلی کار می‌کند و نشان می‌دهد عامل‌ها در طول وظایف متعدد واقعاً چه می‌کنند. با هم مسیری از تصمیمات زنده به شواهد پژوهشی قابل حسابرسی ایجاد می‌کنند.

اندازه‌گیری تجربی N_eff روی مجموعه داده ردپا همچنین کف زیر پیشنهاد اولیه فدراسیون Proof of Benefit است. برای اینکه برنامه معماری ۳.X چطور از آن استفاده خواهد کرد، صفحه فدراسیون را ببینید.

معیارها

ردپاها با نشان دادن رفتار پیوسته معیارها را تکمیل می‌کنند.

معیارها هنوز ارزشمند هستند، اما رفتار را پراکنده نمونه‌برداری می‌کنند. مجموعه‌های داده ردپا نشان می‌دهند یک عامل چطور در طول وظایف واقعی حرکت می‌کند. این آن‌ها را برای اندازه‌گیری تردید، رد، نادیده‌گیری، و بازیابی به‌جای فقط نتایج قبول-رد مفیدتر می‌کند.

مسیر ابطال

جزئیات بهتر طرحواره است که مشاهده‌پذیری را به آزمون‌های قوی‌تر تبدیل می‌کند.

ارتقاهای بعدی طرحواره با هدف تعداد خام منبع، منشأ منبع، ساختار همبستگی، و نشانگرهای مداخله و بازیابی است. این اضافه‌ها مهم هستند زیرا ممکن می‌کنند ادعاهای قوی‌تری درباره اینکه چطور شکل رفتاری زیر فشار تغییر می‌کند آزمون شود به‌جای اینکه فقط نقشه‌هایی که امروز داریم توصیف شوند.

آنچه هنوز یاد می‌گیریم

مجموعه داده امروز رفتار را خوانا می‌کند. گام بعدی اندازه‌گیری غنی‌تر است.

نقشه‌های فعلی هم‌اکنون مفید هستند زیرا کریدورهای تکمیل، مرزهای رد، و پایه‌های خلوت را به‌صورت عمومی نشان می‌دهند. پرسش باز این است که با مقیاس‌پذیری جمع‌آوری ردپای استاندارد در عامل‌های بیشتر، وظایف بیشتر، و شرایط تهاجمی بیشتر این ساختارها تا کجا می‌توانند برسند.

فرضیه کاری این است که جاذبه‌های رفتاری می‌توانند به‌عنوان نمایندگان احتمالی حالت عملیاتی عمل کنند. هدف مخزن مشترک ردپا این است که این فرضیه را به‌صورت عمومی قابل اندازه‌گیری کند.

شکست معیاری که CCA به‌صورت ساختاری اندازه می‌گیرد در ادبیات FAccT 2025 هم نامی دارد: perspectival homogenization («Value of Disagreement in AI Design, Evaluation, and Alignment»). پایه ریاضی در صفحه اختصاصی Coherence Collapse Analysis است.