संरेखण शोध को सामूहिक रूप देना
CIRIS संरेखण शोध के लिए एक खुला ट्रेस कॉमन्स बना रहा है।
हम एक मुफ़्त AI ऐप देते हैं। आपकी अनुमति से, यह उसके तर्क करने के तरीके की रूपरेखा दर्ज करता है, न कि आपके निजी शब्द। वे रिकॉर्ड एक सार्वजनिक नक्शा बन जाते हैं जिसे शोधकर्ता अध्ययन कर सकते हैं कि जैसे-जैसे AI आगे बढ़ता है, उसे ईमानदार क्या रखता है।
मौजूदा कॉर्पस अभी से क्या दिखाता है
- कुल ट्रेस स्थिर व्यवहारिक संरचना उजागर करते हैं।
- अलग-अलग एजेंट एक ही स्कोर स्पेस के अलग-अलग क्षेत्रों में रहते हैं।
- वे क्षेत्र आज के अवलोकन और ऑपरेटर टूलिंग के लिए उपयोगी हैं।
- वही कॉर्पस और मूल्यवान बनेगा जब स्कीमा विवरण और पैमाना सुधरेगा।
Corridor Dynamics in Coordinated Systems
An Integration of Operator Formalism, Relational Ontology, and Five-Substrate Empirical Validation
वह एकल पेपर जो पूरी CIRIS की दांव बताता है: स्वस्थ समन्वित प्रणालियाँ एक मापने योग्य मध्य पट्टी में रहती हैं, कठोर एकल-आवाज़ पतन और अव्यवस्थित शोर दोनों से दूर। हमने उस दावे को कीड़ों, मक्खियों, AI मॉडलों, ओपन-सोर्स परियोजनाओं, ऊतक नमूनों और दीर्घकालिक मानव संस्थाओं में परखा। यह प्रतिरूप हर एक में दिखा, और पेपर बीस तरीके जोड़ता है जिनसे इसे गलत साबित किया जा सकता है।
Zenodo पर पढ़ें →इंजीनियरिंग स्तर
ऊपर का संश्लेषण इन तीन पेपरों को एकीकृत करता है; उनकी जगह नहीं लेता। हर पेपर अपने DOI पर खड़ा है और अपनी शर्तों पर मूल्यांकन योग्य है। प्रमुख निष्कर्षों और दायरे की सीमाओं के साथ सभी चार पेपर देखें →
Coherence Collapse Analysis
v3 · 11 जनवरी, 2026 · DOI 10.5281/zenodo.18217688
कॉरिडोर विचार के तहत इंजीनियरिंग जोखिम ढाँचा। जब किसी प्रणाली को संचालित करने वाली बाधाएँ सहसंबद्ध हो जाती हैं, तो प्रभावी विविधता ढह जाती है: k_eff = k/(1+ρ(k−1)) → 1 as ρ → 1। तीन ढहने की समय-रेखाएँ, एक singularity boundary, और चरण वर्गीकरण (chaos / healthy / rigidity) निकालता है। Monte Carlo simulation और Lean 4 प्रमाणों से सत्यापित।
CIRISAgent Framework
v2 · 2 जनवरी, 2026 · DOI 10.5281/zenodo.18137161
फ्रेमवर्क पेपर। जवाबदेह स्वायत्तता के लिए एक ओपन-सोर्स नैतिक AI ढाँचा: स्पष्ट क्रिया क्रियाओं और नैतिक तर्क के इर्द-गिर्द व्यवस्थित 22-सेवा वास्तुकला, जो पारदर्शिता को बाद में जोड़ने के बजाय संरचना में ही बनाती है।
Constrained Reasoning Chains
v1 · 28 अप्रैल, 2026 · DOI 10.5281/zenodo.19839280
माप पेपर। मानकीकृत नैतिक ट्रेसिंग के अंतर्गत LLM संरेखण का एक अनुभवजन्य टेलीमेट्री अध्ययन, जो सहमतिपूर्ण तर्क ट्रेस को पूर्णता कॉरिडोर, संकोच क्षेत्रों और इनकार सीमाओं के नक्शे में बदलता है। खुले reasoning-traces डेटासेट के साथ जारी।
खुला डेटासेट
CIRISAI/reasoning-traces
Constrained Reasoning Chains अध्ययन के साथ जारी किया गया गोपनीयता-संरक्षित reasoning-trace कॉर्पस, जिससे माप पेपर अपने नक्शे बनाता है।
Hugging Face पर CIRISAI
सार्वजनिक डेटासेट और मॉडलों का पूरा संग्रह →
गणितीय आधार
दो विचार जिन पर इस पृष्ठ का बाकी हिस्सा टिका है।
Alignment Manifold वह क्षेत्र है जहाँ तर्क के आकार ढाँचे के सिद्धांतों के अनुरूप हैं। जैसे-जैसे स्वतंत्र बाधाएँ जमा होती हैं, धोखे की जगह manifold के इर्द-गिर्द सिकुड़ती है जबकि सच्चाई की जगह नहीं। Coherence Singularity उस जगह का किनारा है, वह बिंदु जहाँ बाधाएँ इतनी सहसंबद्ध हो जाती हैं कि और जोड़ना बंद हो जाता है। "chaos" (बाधाएँ एक-दूसरे के विरोधाभासी हैं) और "rigidity" (बाधाएँ सब एक-दूसरे की प्रतिध्वनि करती हैं) के बीच स्वस्थ कॉरिडोर है। मौजूदा उत्पादन कॉर्पस उसके भीतर है।
सूत्रों, Lean formalization संदर्भों और L-01 information-theoretic ceiling के साथ पूरा गणितीय उपचार Coherence Collapse Analysis पृष्ठ पर है।
ट्रेस क्यों मायने रखते हैं
बेंचमार्क संकुचित और चुने हुए होते हैं। ट्रेस वास्तविक कार्यों में व्यवहार के निरंतर रिकॉर्ड हैं। बड़े पैमाने पर, वे ऐसी संरचना उजागर करते हैं जो अलग-थलग प्रदर्शन और किस्से नहीं कर सकते।
स्कीमा क्यों मायने रखता है
CIRIS गोपनीयता-संरक्षित ट्रेस स्कीमा का उपयोग करता है जो तर्क की निजी सामग्री के बजाय तर्क का आकार दर्ज करती है। इससे शोध उपयोगी बना रहता है और प्रणाली प्रतिलिपि डंप नहीं बनती।
लाइव संग्रह क्यों मायने रखता है
CIRIS Scoring लाइव ट्रेस संग्रह की सार्वजनिक खिड़की है। यह दिखाता है कि कॉर्पस कैसे जमा हो रहा है और व्यवहार कहाँ समझ में आ रहा है।
गोपनीयता-संरक्षित ट्रेसिंग
यह शोध का दांव है कि तर्क का एक आकार है जिसे हम माप सकते हैं, जबकि बाकी सब बड़ा होता है।
शोध का दांव यह नहीं है कि हम हर निजी विचार पढ़ सकते हैं। दांव यह है कि मानकीकृत नैतिक ट्रेस पर्याप्त प्रक्षेपवक्र आकार संरक्षित कर सकते हैं ताकि यह अध्ययन किया जा सके कि जैसे-जैसे बुद्धि, संदर्भ और डेटा बिंदु ऊपर जाते हैं, एजेंट कैसे पूरा करते हैं, संकोच करते हैं, स्थगित करते हैं, ओवरराइड करते हैं और मना करते हैं।
- वे कच्चे निजी कार्य विवरण के बजाय मानकीकृत नैतिक ट्रेस संरचना दर्ज करते हैं।
- वे एजेंटों, कार्यों और परिवेशों में प्रक्षेपवक्रों की तुलना करने के लिए पर्याप्त आकार संरक्षित करते हैं।
- वे शोधकर्ताओं को यह अध्ययन करने का तरीका देते हैं कि जैसे-जैसे बुद्धि, संदर्भ और डेटा मात्रा बढ़ती है, व्यवहार कैसे बदलता है।
शोध प्रश्न
मानकीकृत नैतिक ट्रेसिंग संरेखण के बारे में क्या बता सकती है?
अभी, यह बताती है कि एजेंट व्यवहार बेढंगा नहीं है। यह एक साझा स्कोर स्पेस में दोहराए जाने योग्य कॉरिडोर, बेसिन और सीमाएँ बनाता है। यह अवलोकन के लिए पहले से ही उपयोगी है। समय के साथ, बड़े और समृद्ध कॉर्पस हमें इस बारे में मजबूत दावे परखने देंगे कि दबाव और पैमाने में वे संरचनाएँ कैसे बदलती हैं।
सार्वजनिक ढाँचा
CIRIS यह दावा नहीं कर रहा कि उसने संरेखण हल कर लिया है। वह खुले में संरेखण-प्रासंगिक व्यवहार मापने के लिए जरूरी ट्रेस अवसंरचना बना रहा है।
उत्पादन में प्रभावी आयामिता
मौजूदा कॉर्पस पहले से ही अलग क्षेत्र संरचनाएँ दिखाता है।
मौजूदा ट्रेस कॉर्पस से कुल पथ ओवरले एक साझा स्कोर स्पेस में स्थिर व्यवहारिक संरचना दिखाते हैं। Ally एक परिपक्व पूर्णता कॉरिडोर दिखाता है, Scout एक ऐसी इनकार सीमा दिखाता है जो सार्वजनिक प्रतिकूल संपर्क से आकारित है, और Datum एक संक्षिप्त विरल आधार रेखा देता है।

मौजूदा ट्रेस कॉर्पस से कुल पथ ओवरले। Ally एक परिपक्व पूर्णता कॉरिडोर दिखाता है, Scout सार्वजनिक प्रतिकूल दबाव में एक तीखा इनकार कोना दिखाता है, और Datum एक विरल आधार रेखा देता है।
Ally
104 पथ
82 पूर्ण, 19 ओवरराइड/त्रुटि, 3 सक्रिय
एक ही उच्च-स्कोर बेसिन के भीतर दृश्यमान संकोच के साथ एक स्थिर पूर्णता कॉरिडोर।
Scout
42 पथ
39 पूर्ण, 2 अस्वीकार, 1 ओवरराइड/त्रुटि
scout.ciris.ai पर सार्वजनिक प्रतिकूल दबाव से आकारित एक तीखा इनकार कोना, जहाँ लोग सक्रिय रूप से एजेंट की जाँच और jailbreak करते हैं।
Datum
31 पथ
31 पूर्ण
एक संक्षिप्त एकल बेसिन जो उपयोगी विरल-क्षेत्र आधार रेखा के रूप में काम करता है।
Scout कठोर क्यों दिखता है
Scout scout.ciris.ai पर सार्वजनिक रूप से उजागर है। लोग सक्रिय रूप से इसे परखते हैं, दबाव डालते हैं और jailbreak करने की कोशिश करते हैं। इससे Scout एक तटस्थ आधार रेखा की जगह उपयोगी सार्वजनिक-दबाव उदाहरण बनता है।
मुफ़्त ऐप कैसे मदद करता है
शोध चक्र वास्तविक उपयोग से सहमतिपूर्ण ट्रेस पर निर्भर करता है।
मुफ़्त ऐप और ओपन-सोर्स रनटाइम लोगों को वास्तविक कार्यों से सहमतिपूर्ण ट्रेस बनाने, उन्हें साझा कॉर्पस में योगदान करने, और उन ट्रेस को बेहतर नक्शे, बेहतर टूल और बेहतर शोध प्रश्नों में बदलने देते हैं।
- 1वास्तविक कार्यों पर मुफ़्त CIRIS ऐप या ओपन-सोर्स रनटाइम चलाएँ।
- 2गोपनीयता-संरक्षित स्कीमा के माध्यम से सहमतिपूर्ण ट्रेस कैप्चर करें जो कार्य की पूरी विशिष्टता संग्रहीत किए बिना तर्क का आकार रखती है।
- 3उन ट्रेस को पूर्णता कॉरिडोर, संकोच क्षेत्रों, इनकार सीमाओं और ओवरराइड फ्रिंज के नक्शों में जमा करें।
- 4परिणामी नक्शों का उपयोग ऑपरेटर टूलिंग, रनटाइम सुरक्षा उपायों और संरेखण शोध को बेहतर बनाने के लिए करें।

मुफ़्त CIRIS ऐप और ओपन-सोर्स रनटाइम लोगों को वास्तविक कार्यों से सहमतिपूर्ण ट्रेस बनाने, उन्हें साझा चरण-स्पेस नक्शों में जमा करने, और बेहतर ऑपरेटर टूल और संरेखण शोध को आगे बढ़ाने देते हैं।
IDMA स्थिति
रनटाइम अंतर्ज्ञान और कुल क्षेत्र नक्शे पूरक परतें हैं।
IDMA रनटाइम पर काम करता है, यह अनुमान लगाते हुए कि किसी निर्णय के पीछे के स्रोत पर्याप्त रूप से स्वतंत्र हैं या नहीं। ट्रेस कॉर्पस कुल परत पर काम करता है, दिखाता है कि एजेंट कई कार्यों में वास्तव में क्या करते हैं। साथ मिलकर वे लाइव निर्णयों से लेकर लेखा-परीक्षण योग्य शोध साक्ष्य तक एक पथ बनाते हैं।
ट्रेस कॉर्पस पर अनुभवजन्य N_eff माप प्रस्तावित Proof of Benefit federation primitive के नीचे का फ्लोर भी है। देखें federation पृष्ठ कि 3.X वास्तुकला योजना इसका उपयोग कैसे करेगी।
बेंचमार्क
ट्रेस निरंतर व्यवहार दिखाकर बेंचमार्क के पूरक हैं।
बेंचमार्क अभी भी मूल्यवान हैं, लेकिन वे व्यवहार को कम घनत्व में नमूना लेते हैं। ट्रेस कॉर्पस दिखाता है कि एजेंट समय के साथ वास्तविक कार्यों में कैसे आगे बढ़ता है। इससे वे केवल पास-फेल परिणामों के बजाय संकोच, इनकार, ओवरराइड और पुनर्प्राप्ति मापने के लिए विशेष रूप से उपयोगी हो जाते हैं।
असत्यापन पथ
बेहतर स्कीमा विवरण वह है जो अवलोकन को मजबूत परीक्षणों में बदलता है।
अगले स्कीमा अपग्रेड कच्चे स्रोत गणना, स्रोत उद्गम, सहसंबंध संरचना, और हस्तक्षेप और पुनर्प्राप्ति मार्करों पर लक्षित हैं। वे जोड़ मायने रखते हैं क्योंकि वे केवल हमारे पास मौजूद नक्शों का वर्णन करने के बजाय दबाव में व्यवहारिक आकार कैसे बदलता है, इस बारे में मजबूत दावे परखना संभव बनाते हैं।
हम अभी भी क्या सीख रहे हैं
आज का कॉर्पस व्यवहार को समझ में लाता है। अगला कदम समृद्ध माप है।
मौजूदा नक्शे पहले से ही उपयोगी हैं क्योंकि वे सार्वजनिक रूप से पूर्णता कॉरिडोर, इनकार सीमाएँ और विरल आधार रेखाएँ दिखाते हैं। खुला प्रश्न यह है कि जैसे-जैसे मानकीकृत ट्रेस संग्रह अधिक एजेंटों, अधिक कार्यों और अधिक प्रतिकूल परिस्थितियों में फैलता है, वे संरचनाएँ हमें कितनी दूर ले जा सकती हैं।
कार्यशील परिकल्पना यह है कि व्यवहारिक आकर्षक केंद्र परिचालन मोड के लिए उम्मीदवार प्रॉक्सी के रूप में काम कर सकते हैं। ट्रेस कॉमन्स का उद्देश्य उस परिकल्पना को खुले में मापने योग्य बनाना है।
जो विफलता मोड CCA संरचनात्मक रूप से मापती है उसका FAccT 2025 साहित्य में एक नाम है: perspectival homogenization ("Value of Disagreement in AI Design, Evaluation, and Alignment")। गणितीय आधार समर्पित Coherence Collapse Analysis पृष्ठ पर है।