پژوهش همسویی بهشکل جمعی
CIRIS یک مخزن عمومی ردپا برای پژوهش همسویی میسازد.
ما یک اپ هوش مصنوعی رایگان میدهیم. با اجازه شما، این اپ شکل استدلال خود را ثبت میکند، نه کلمات خصوصی شما را. آن رکوردها به نقشهای عمومی تبدیل میشوند که محققان میتوانند آن را بررسی کنند تا بفهمند چه چیزی هوش مصنوعی را در مقیاسپذیری صادق نگه میدارد.
آنچه مجموعه داده فعلی هماکنون نشان میدهد
- ردپاهای کلی، ساختار رفتاری پایداری آشکار میکنند.
- عاملهای مختلف در ناحیههای متفاوتی از همان فضای نمره جای دارند.
- آن نواحی هماکنون برای ابزارهای مشاهدهپذیری و عملکرد اپراتور مفید هستند.
- همین مجموعه داده ارزشمندتر میشود وقتی جزئیات طرحواره و مقیاس بهتر شوند.
Corridor Dynamics in Coordinated Systems
An Integration of Operator Formalism, Relational Ontology, and Five-Substrate Empirical Validation
تنها مقالهای که کل شرطبندی CIRIS را بیان میکند: سیستمهای هماهنگ سالم در یک ناحیه میانی قابل اندازهگیری قرار دارند، دور از هم فروپاشی تکصدایی سخت هم از سر و صدای آشفته. این ادعا را روی کرمها، مگسها، مدلهای هوش مصنوعی، پروژههای متنباز، نمونههای بافت، و نهادهای انسانی دیرپا آزمودیم. الگو در همه آنها پابرجاست، و مقاله بیست راه برای اثبات خلاف آن ارائه میدهد.
خواندن در Zenodo →لایه مهندسی
ترکیب بالا این سه مقاله را یکپارچه میکند؛ آنها را جایگزین نمیکند. هر مقاله بر DOI خودش ایستاده و با معیارهای خودش قابل ارزیابی است. مشاهده همه چهار مقاله با یافتههای کلیدی و محدودیتهای حوزه →
Coherence Collapse Analysis
v3 · ۱۱ ژانویه ۲۰۲۶ · DOI 10.5281/zenodo.18217688
چارچوب ریسک مهندسی زیر ایده کریدور. وقتی محدودیتهای حاکم بر یک سیستم همبسته میشوند، تنوع مؤثر فرو میریزد: k_eff = k/(1+ρ(k−1)) → 1 as ρ → 1. سه خط زمانی فروپاشی، یک singularity boundary، و طبقهبندی فاز (chaos / healthy / rigidity) استخراج میکند. با شبیهسازی Monte Carlo و اثباتهای Lean 4 تأیید شده.
CIRISAgent Framework
v2 · ۲ ژانویه ۲۰۲۶ · DOI 10.5281/zenodo.18137161
مقاله چارچوب. یک چارچوب متنباز هوش مصنوعی اخلاقی برای خودمختاری پاسخگو: معماری ۲۲-سرویسه سازمانیافته پیرامون افعال عمل صریح و استدلال اخلاقی، که شفافیت را در ساختار میسازد نه بهصورت موردی بعداً اضافه میکند.
Constrained Reasoning Chains
v1 · ۲۸ آوریل ۲۰۲۶ · DOI 10.5281/zenodo.19839280
مقاله اندازهگیری. یک مطالعه تلمتری تجربی از همسویی LLM زیر ردیابی اخلاقی استاندارد، که ردپاهای استدلالی رضایتدهنده را به نقشههایی از کریدورهای تکمیل، مناطق تردید، و مرزهای رد تبدیل میکند. همراه با مجموعه داده باز ردپاهای استدلالی منتشر شده.
مجموعه داده باز
CIRISAI/reasoning-traces
مجموعه داده ردپاهای استدلالی حافظ حریم خصوصی که همراه با مطالعه Constrained Reasoning Chains منتشر شده، ماده اولیهای که مقاله اندازهگیری نقشههایش را از آن استخراج میکند.
CIRISAI در Hugging Face
سازمان کامل مجموعه دادهها و مدلهای عمومی →
پایههای ریاضی
دو ایدهای که بقیه این صفحه بر آنها استوار است.
Alignment Manifold ناحیهای از شکلهای استدلالی سازگار با اصول چارچوب است. با انباشت محدودیتهای مستقل، فضای فریب حول منیفولد فرو میریزد در حالی که فضای حقیقت فرو نمیریزد. Coherence Singularity لبه آن فضاست، نقطهای که محدودیتها آنقدر همبسته میشوند که افزودن بیشتر کمکی نمیکند. بین «chaos» (محدودیتها با هم تناقض دارند) و «rigidity» (محدودیتها همه یکدیگر را بازتاب میدهند) کریدور سالم قرار دارد. مجموعه داده تولیدی فعلی درون آن است.
درمان ریاضی کامل با فرمولها، منابع رسمیسازی Lean، و سقف اطلاعات-نظری L-01 در صفحه Coherence Collapse Analysis قرار دارد.
چرا ردپاها اهمیت دارند
معیارها محدود و گزینشی هستند. ردپاها رکوردهای پیوسته رفتار در وظایف واقعی هستند. در مقیاس بزرگ، ساختاری آشکار میکنند که نمایشهای منزوی و قصههای جداگانه نمیتوانند.
چرا طرحواره اهمیت دارد
CIRIS از طرحوارههای ردپای حافظ حریم خصوصی استفاده میکند که شکل استدلال را میگیرند نه محتوای خصوصی استدلال را. این پژوهش را بدون تبدیل سیستم به یک مخزن رونویسی مفید نگه میدارد.
چرا مجموعه زنده اهمیت دارد
CIRIS Scoring پنجره عمومی به مجموعه ردپای زنده است. نشان میدهد مجموعه داده چطور انباشته میشود و کجا رفتار قابل خواندن میشود.
ردیابی حافظ حریم خصوصی
فرضیه این است که استدلال شکلی دارد که میتوانیم آن را همزمان با مقیاسپذیری همه چیز اندازه بگیریم.
شرطبندی پژوهشی این نیست که میتوانیم هر فکر خصوصی را بخوانیم. شرطبندی این است که ردپاهای اخلاقی استاندارد میتوانند بهاندازه کافی شکل مسیر را حفظ کنند تا بررسی کنیم چطور عاملها با مقیاسپذیری هوش، زمینه، و دادهها تکمیل، تردید، ارجاع، نادیدهگیری، و رد میکنند.
- آنها ساختار ردپای اخلاقی استاندارد را ثبت میکنند نه جزئیات خام وظیفه خصوصی را.
- آنها شکل کافی برای مقایسه مسیرها در بین عاملها، وظایف، و محیطها حفظ میکنند.
- به محققان راهی میدهند که بررسی کنند با مقیاسپذیری هوش، زمینه، و حجم داده رفتار چطور تغییر میکند.
پرسش پژوهشی
ردیابی اخلاقی استاندارد چه چیزی درباره همسویی به ما میگوید؟
در حال حاضر، به ما میگوید که رفتار عامل بیشکل نیست. کریدورها، حوضهها، و مرزهای قابل تکرار در یک فضای نمره مشترک تولید میکند. این برای مشاهدهپذیری مفید است. با گذشت زمان، مجموعههای بزرگتر و غنیتر باید بگذارند ادعاهای قویتری آزمون کنیم که این ساختارها زیر فشار و مقیاس چطور تغییر میکنند.
قاببندی عمومی
CIRIS ادعا نمیکند که همسویی را حل کرده است. زیرساخت ردپای لازم برای اندازهگیری رفتار مرتبط با همسویی بهصورت عمومی میسازد.
بُعدپذیری مؤثر در محیط تولیدی
مجموعه داده فعلی هماکنون ساختارهای میدانی متمایز نشان میدهد.
روکشهای مسیر کلی از مجموعه داده ردپای فعلی ساختار رفتاری پایداری در فضای نمره مشترک نشان میدهند. Ally کریدور تکمیل بالغی نشان میدهد، Scout مرز رد شکلگرفته توسط قرار گرفتن عمومی در برابر تهاجم را نشان میدهد، و Datum پایه خلوت فشردهای فراهم میکند.

روکشهای مسیر کلی از مجموعه داده ردپای فعلی. Ally کریدور تکمیل بالغی نشان میدهد، Scout گوشه رد تیزی زیر فشار تهاجمی عمومی نشان میدهد، و Datum پایه خلوت ارائه میدهد.
Ally
104 مسیر
۸۲ تکمیل، ۱۹ نادیدهگیری/خطا، ۳ فعال
کریدور تکمیل پایدار با تردید قابل مشاهده درون همان حوضه نمره بالا.
Scout
42 مسیر
۳۹ تکمیل، ۲ رد، ۱ نادیدهگیری/خطا
گوشه رد تیزی شکلگرفته توسط فشار تهاجمی عمومی در scout.ciris.ai، جایی که مردم فعالانه عامل را آزمایش و تلاش به فریب میکنند.
Datum
31 مسیر
۳۱ تکمیل
یک حوضه منفرد فشرده که بهعنوان پایه مفید میدان خلوت کار میکند.
چرا Scout سختگیرانهتر به نظر میرسد
Scout بهصورت عمومی در scout.ciris.ai قرار گرفته است. مردم فعالانه آن را آزمایش، تحت فشار قرار میدهند، و تلاش به فریب میکنند. این Scout را نمونه مفید فشار عمومی میکند نه یک پایه خنثی.
چطور اپ رایگان کمک میکند
چرخ طیار پژوهش به ردپاهای رضایتدهنده از استفاده واقعی بستگی دارد.
اپ رایگان و سیستم اجرایی متنباز به مردم امکان میدهند ردپاهای رضایتدهنده از وظایف واقعی تولید کنند، آنها را در یک مجموعه مشترک به اشتراک بگذارند، و آن ردپاها را به نقشههای بهتر، ابزارهای بهتر، و پرسشهای پژوهشی بهتر تبدیل کنند.
- 1اپ رایگان CIRIS یا سیستم اجرایی متنباز را روی وظایف واقعی اجرا کنید.
- 2ردپاهای رضایتدهنده را از طریق طرحوارههای حافظ حریم خصوصی که شکل استدلال را بدون ذخیره جزئیات کامل وظیفه حفظ میکنند ثبت کنید.
- 3آن ردپاها را در نقشههایی از کریدورهای تکمیل، مناطق تردید، مرزهای رد، و حاشیه نادیدهگیری جمع کنید.
- 4از نقشههای بهدستآمده برای بهبود ابزارهای اپراتور، محافظهای سیستم اجرایی، و پژوهش همسویی استفاده کنید.

اپ رایگان CIRIS و سیستم اجرایی متنباز به مردم امکان میدهند ردپاهای رضایتدهنده از وظایف واقعی تولید کنند، آنها را در نقشههای مشترک فضای فاز جمع کنند، و ابزارهای اپراتور و پژوهش همسویی بهتر تغذیه کنند.
وضعیت IDMA
شهود سیستم اجرایی و نقشههای میدانی کلی لایههای مکمل هستند.
IDMA در زمان اجرا کار میکند و تخمین میزند آیا منابع پشت یک تصمیم بهاندازه کافی مستقل هستند. مجموعه داده ردپا در لایه کلی کار میکند و نشان میدهد عاملها در طول وظایف متعدد واقعاً چه میکنند. با هم مسیری از تصمیمات زنده به شواهد پژوهشی قابل حسابرسی ایجاد میکنند.
اندازهگیری تجربی N_eff روی مجموعه داده ردپا همچنین کف زیر پیشنهاد اولیه فدراسیون Proof of Benefit است. برای اینکه برنامه معماری ۳.X چطور از آن استفاده خواهد کرد، صفحه فدراسیون را ببینید.
معیارها
ردپاها با نشان دادن رفتار پیوسته معیارها را تکمیل میکنند.
معیارها هنوز ارزشمند هستند، اما رفتار را پراکنده نمونهبرداری میکنند. مجموعههای داده ردپا نشان میدهند یک عامل چطور در طول وظایف واقعی حرکت میکند. این آنها را برای اندازهگیری تردید، رد، نادیدهگیری، و بازیابی بهجای فقط نتایج قبول-رد مفیدتر میکند.
مسیر ابطال
جزئیات بهتر طرحواره است که مشاهدهپذیری را به آزمونهای قویتر تبدیل میکند.
ارتقاهای بعدی طرحواره با هدف تعداد خام منبع، منشأ منبع، ساختار همبستگی، و نشانگرهای مداخله و بازیابی است. این اضافهها مهم هستند زیرا ممکن میکنند ادعاهای قویتری درباره اینکه چطور شکل رفتاری زیر فشار تغییر میکند آزمون شود بهجای اینکه فقط نقشههایی که امروز داریم توصیف شوند.
آنچه هنوز یاد میگیریم
مجموعه داده امروز رفتار را خوانا میکند. گام بعدی اندازهگیری غنیتر است.
نقشههای فعلی هماکنون مفید هستند زیرا کریدورهای تکمیل، مرزهای رد، و پایههای خلوت را بهصورت عمومی نشان میدهند. پرسش باز این است که با مقیاسپذیری جمعآوری ردپای استاندارد در عاملهای بیشتر، وظایف بیشتر، و شرایط تهاجمی بیشتر این ساختارها تا کجا میتوانند برسند.
فرضیه کاری این است که جاذبههای رفتاری میتوانند بهعنوان نمایندگان احتمالی حالت عملیاتی عمل کنند. هدف مخزن مشترک ردپا این است که این فرضیه را بهصورت عمومی قابل اندازهگیری کند.
شکست معیاری که CCA بهصورت ساختاری اندازه میگیرد در ادبیات FAccT 2025 هم نامی دارد: perspectival homogenization («Value of Disagreement in AI Design, Evaluation, and Alignment»). پایه ریاضی در صفحه اختصاصی Coherence Collapse Analysis است.