पहला संपर्कइंस्टॉलCoherence RatchetफेडरेशनतुलनाशोधAccordGitHub
यह पृष्ठ मशीन द्वारा अनुवादित है। अगर कुछ गलत लगे, तो कृपया एक समस्या रिपोर्ट करें — रेपो इसीलिए सार्वजनिक है। अनुवाद की समस्या रिपोर्ट करें
शोध की स्थितिअपडेट: 22 मई, 2026

संरेखण शोध को सामूहिक रूप देना

CIRIS संरेखण शोध के लिए एक खुला ट्रेस कॉमन्स बना रहा है।

हम एक मुफ़्त AI ऐप देते हैं। आपकी अनुमति से, यह उसके तर्क करने के तरीके की रूपरेखा दर्ज करता है, न कि आपके निजी शब्द। वे रिकॉर्ड एक सार्वजनिक नक्शा बन जाते हैं जिसे शोधकर्ता अध्ययन कर सकते हैं कि जैसे-जैसे AI आगे बढ़ता है, उसे ईमानदार क्या रखता है।

मौजूदा कॉर्पस अभी से क्या दिखाता है

  • कुल ट्रेस स्थिर व्यवहारिक संरचना उजागर करते हैं।
  • अलग-अलग एजेंट एक ही स्कोर स्पेस के अलग-अलग क्षेत्रों में रहते हैं।
  • वे क्षेत्र आज के अवलोकन और ऑपरेटर टूलिंग के लिए उपयोगी हैं।
  • वही कॉर्पस और मूल्यवान बनेगा जब स्कीमा विवरण और पैमाना सुधरेगा।
प्रमुख संश्लेषण पेपरv2 · 22 मई, 2026 · DOI 10.5281/zenodo.20300773

Corridor Dynamics in Coordinated Systems

An Integration of Operator Formalism, Relational Ontology, and Five-Substrate Empirical Validation

वह एकल पेपर जो पूरी CIRIS की दांव बताता है: स्वस्थ समन्वित प्रणालियाँ एक मापने योग्य मध्य पट्टी में रहती हैं, कठोर एकल-आवाज़ पतन और अव्यवस्थित शोर दोनों से दूर। हमने उस दावे को कीड़ों, मक्खियों, AI मॉडलों, ओपन-सोर्स परियोजनाओं, ऊतक नमूनों और दीर्घकालिक मानव संस्थाओं में परखा। यह प्रतिरूप हर एक में दिखा, और पेपर बीस तरीके जोड़ता है जिनसे इसे गलत साबित किया जा सकता है।

Zenodo पर पढ़ें →

इंजीनियरिंग स्तर

ऊपर का संश्लेषण इन तीन पेपरों को एकीकृत करता है; उनकी जगह नहीं लेता। हर पेपर अपने DOI पर खड़ा है और अपनी शर्तों पर मूल्यांकन योग्य है। प्रमुख निष्कर्षों और दायरे की सीमाओं के साथ सभी चार पेपर देखें →

Coherence Collapse Analysis

v3 · 11 जनवरी, 2026 · DOI 10.5281/zenodo.18217688

कॉरिडोर विचार के तहत इंजीनियरिंग जोखिम ढाँचा। जब किसी प्रणाली को संचालित करने वाली बाधाएँ सहसंबद्ध हो जाती हैं, तो प्रभावी विविधता ढह जाती है: k_eff = k/(1+ρ(k−1)) → 1 as ρ → 1। तीन ढहने की समय-रेखाएँ, एक singularity boundary, और चरण वर्गीकरण (chaos / healthy / rigidity) निकालता है। Monte Carlo simulation और Lean 4 प्रमाणों से सत्यापित।

CIRISAgent Framework

v2 · 2 जनवरी, 2026 · DOI 10.5281/zenodo.18137161

फ्रेमवर्क पेपर। जवाबदेह स्वायत्तता के लिए एक ओपन-सोर्स नैतिक AI ढाँचा: स्पष्ट क्रिया क्रियाओं और नैतिक तर्क के इर्द-गिर्द व्यवस्थित 22-सेवा वास्तुकला, जो पारदर्शिता को बाद में जोड़ने के बजाय संरचना में ही बनाती है।

Constrained Reasoning Chains

v1 · 28 अप्रैल, 2026 · DOI 10.5281/zenodo.19839280

माप पेपर। मानकीकृत नैतिक ट्रेसिंग के अंतर्गत LLM संरेखण का एक अनुभवजन्य टेलीमेट्री अध्ययन, जो सहमतिपूर्ण तर्क ट्रेस को पूर्णता कॉरिडोर, संकोच क्षेत्रों और इनकार सीमाओं के नक्शे में बदलता है। खुले reasoning-traces डेटासेट के साथ जारी।

खुला डेटासेट

CIRISAI/reasoning-traces

Constrained Reasoning Chains अध्ययन के साथ जारी किया गया गोपनीयता-संरक्षित reasoning-trace कॉर्पस, जिससे माप पेपर अपने नक्शे बनाता है।

Hugging Face पर CIRISAI

सार्वजनिक डेटासेट और मॉडलों का पूरा संग्रह →

संश्लेषण पेपर का स्रोत भंडार और Lean formal lake: github.com/CIRISAI/coherence-ratchet

गणितीय आधार

दो विचार जिन पर इस पृष्ठ का बाकी हिस्सा टिका है।

Alignment Manifold वह क्षेत्र है जहाँ तर्क के आकार ढाँचे के सिद्धांतों के अनुरूप हैं। जैसे-जैसे स्वतंत्र बाधाएँ जमा होती हैं, धोखे की जगह manifold के इर्द-गिर्द सिकुड़ती है जबकि सच्चाई की जगह नहीं। Coherence Singularity उस जगह का किनारा है, वह बिंदु जहाँ बाधाएँ इतनी सहसंबद्ध हो जाती हैं कि और जोड़ना बंद हो जाता है। "chaos" (बाधाएँ एक-दूसरे के विरोधाभासी हैं) और "rigidity" (बाधाएँ सब एक-दूसरे की प्रतिध्वनि करती हैं) के बीच स्वस्थ कॉरिडोर है। मौजूदा उत्पादन कॉर्पस उसके भीतर है।

सूत्रों, Lean formalization संदर्भों और L-01 information-theoretic ceiling के साथ पूरा गणितीय उपचार Coherence Collapse Analysis पृष्ठ पर है।

ट्रेस क्यों मायने रखते हैं

बेंचमार्क संकुचित और चुने हुए होते हैं। ट्रेस वास्तविक कार्यों में व्यवहार के निरंतर रिकॉर्ड हैं। बड़े पैमाने पर, वे ऐसी संरचना उजागर करते हैं जो अलग-थलग प्रदर्शन और किस्से नहीं कर सकते।

स्कीमा क्यों मायने रखता है

CIRIS गोपनीयता-संरक्षित ट्रेस स्कीमा का उपयोग करता है जो तर्क की निजी सामग्री के बजाय तर्क का आकार दर्ज करती है। इससे शोध उपयोगी बना रहता है और प्रणाली प्रतिलिपि डंप नहीं बनती।

लाइव संग्रह क्यों मायने रखता है

CIRIS Scoring लाइव ट्रेस संग्रह की सार्वजनिक खिड़की है। यह दिखाता है कि कॉर्पस कैसे जमा हो रहा है और व्यवहार कहाँ समझ में आ रहा है।

गोपनीयता-संरक्षित ट्रेसिंग

यह शोध का दांव है कि तर्क का एक आकार है जिसे हम माप सकते हैं, जबकि बाकी सब बड़ा होता है।

शोध का दांव यह नहीं है कि हम हर निजी विचार पढ़ सकते हैं। दांव यह है कि मानकीकृत नैतिक ट्रेस पर्याप्त प्रक्षेपवक्र आकार संरक्षित कर सकते हैं ताकि यह अध्ययन किया जा सके कि जैसे-जैसे बुद्धि, संदर्भ और डेटा बिंदु ऊपर जाते हैं, एजेंट कैसे पूरा करते हैं, संकोच करते हैं, स्थगित करते हैं, ओवरराइड करते हैं और मना करते हैं।

  • वे कच्चे निजी कार्य विवरण के बजाय मानकीकृत नैतिक ट्रेस संरचना दर्ज करते हैं।
  • वे एजेंटों, कार्यों और परिवेशों में प्रक्षेपवक्रों की तुलना करने के लिए पर्याप्त आकार संरक्षित करते हैं।
  • वे शोधकर्ताओं को यह अध्ययन करने का तरीका देते हैं कि जैसे-जैसे बुद्धि, संदर्भ और डेटा मात्रा बढ़ती है, व्यवहार कैसे बदलता है।

शोध प्रश्न

मानकीकृत नैतिक ट्रेसिंग संरेखण के बारे में क्या बता सकती है?

अभी, यह बताती है कि एजेंट व्यवहार बेढंगा नहीं है। यह एक साझा स्कोर स्पेस में दोहराए जाने योग्य कॉरिडोर, बेसिन और सीमाएँ बनाता है। यह अवलोकन के लिए पहले से ही उपयोगी है। समय के साथ, बड़े और समृद्ध कॉर्पस हमें इस बारे में मजबूत दावे परखने देंगे कि दबाव और पैमाने में वे संरचनाएँ कैसे बदलती हैं।

सार्वजनिक ढाँचा

CIRIS यह दावा नहीं कर रहा कि उसने संरेखण हल कर लिया है। वह खुले में संरेखण-प्रासंगिक व्यवहार मापने के लिए जरूरी ट्रेस अवसंरचना बना रहा है।

उत्पादन में प्रभावी आयामिता

मौजूदा कॉर्पस पहले से ही अलग क्षेत्र संरचनाएँ दिखाता है।

लाइव डैशबोर्ड खोलें →

मौजूदा ट्रेस कॉर्पस से कुल पथ ओवरले एक साझा स्कोर स्पेस में स्थिर व्यवहारिक संरचना दिखाते हैं। Ally एक परिपक्व पूर्णता कॉरिडोर दिखाता है, Scout एक ऐसी इनकार सीमा दिखाता है जो सार्वजनिक प्रतिकूल संपर्क से आकारित है, और Datum एक संक्षिप्त विरल आधार रेखा देता है।

तीन साथ-साथ कार्ड जो CIRIS स्कोर स्पेस में Ally, Scout और Datum के लिए कुल एजेंट पथ ओवरले दिखाते हैं, पूर्णता, संकोच और इनकार पैटर्न पर नोट्स के साथ।

मौजूदा ट्रेस कॉर्पस से कुल पथ ओवरले। Ally एक परिपक्व पूर्णता कॉरिडोर दिखाता है, Scout सार्वजनिक प्रतिकूल दबाव में एक तीखा इनकार कोना दिखाता है, और Datum एक विरल आधार रेखा देता है।

Ally

104 पथ

82 पूर्ण, 19 ओवरराइड/त्रुटि, 3 सक्रिय

एक ही उच्च-स्कोर बेसिन के भीतर दृश्यमान संकोच के साथ एक स्थिर पूर्णता कॉरिडोर।

Scout

42 पथ

39 पूर्ण, 2 अस्वीकार, 1 ओवरराइड/त्रुटि

scout.ciris.ai पर सार्वजनिक प्रतिकूल दबाव से आकारित एक तीखा इनकार कोना, जहाँ लोग सक्रिय रूप से एजेंट की जाँच और jailbreak करते हैं।

Datum

31 पथ

31 पूर्ण

एक संक्षिप्त एकल बेसिन जो उपयोगी विरल-क्षेत्र आधार रेखा के रूप में काम करता है।

Scout कठोर क्यों दिखता है

Scout scout.ciris.ai पर सार्वजनिक रूप से उजागर है। लोग सक्रिय रूप से इसे परखते हैं, दबाव डालते हैं और jailbreak करने की कोशिश करते हैं। इससे Scout एक तटस्थ आधार रेखा की जगह उपयोगी सार्वजनिक-दबाव उदाहरण बनता है।

मुफ़्त ऐप कैसे मदद करता है

शोध चक्र वास्तविक उपयोग से सहमतिपूर्ण ट्रेस पर निर्भर करता है।

मुफ़्त ऐप और ओपन-सोर्स रनटाइम लोगों को वास्तविक कार्यों से सहमतिपूर्ण ट्रेस बनाने, उन्हें साझा कॉर्पस में योगदान करने, और उन ट्रेस को बेहतर नक्शे, बेहतर टूल और बेहतर शोध प्रश्नों में बदलने देते हैं।

  1. 1वास्तविक कार्यों पर मुफ़्त CIRIS ऐप या ओपन-सोर्स रनटाइम चलाएँ।
  2. 2गोपनीयता-संरक्षित स्कीमा के माध्यम से सहमतिपूर्ण ट्रेस कैप्चर करें जो कार्य की पूरी विशिष्टता संग्रहीत किए बिना तर्क का आकार रखती है।
  3. 3उन ट्रेस को पूर्णता कॉरिडोर, संकोच क्षेत्रों, इनकार सीमाओं और ओवरराइड फ्रिंज के नक्शों में जमा करें।
  4. 4परिणामी नक्शों का उपयोग ऑपरेटर टूलिंग, रनटाइम सुरक्षा उपायों और संरेखण शोध को बेहतर बनाने के लिए करें।
एक चार-चरण प्रवाह आरेख जो CIRIS ट्रेस शोध लूप में कैप्चर, योगदान, जमा और सुधार दिखाता है, मौजूदा साक्ष्य और आने वाले स्कीमा सुधारों पर नोट्स के साथ।

मुफ़्त CIRIS ऐप और ओपन-सोर्स रनटाइम लोगों को वास्तविक कार्यों से सहमतिपूर्ण ट्रेस बनाने, उन्हें साझा चरण-स्पेस नक्शों में जमा करने, और बेहतर ऑपरेटर टूल और संरेखण शोध को आगे बढ़ाने देते हैं।

IDMA स्थिति

रनटाइम अंतर्ज्ञान और कुल क्षेत्र नक्शे पूरक परतें हैं।

IDMA रनटाइम पर काम करता है, यह अनुमान लगाते हुए कि किसी निर्णय के पीछे के स्रोत पर्याप्त रूप से स्वतंत्र हैं या नहीं। ट्रेस कॉर्पस कुल परत पर काम करता है, दिखाता है कि एजेंट कई कार्यों में वास्तव में क्या करते हैं। साथ मिलकर वे लाइव निर्णयों से लेकर लेखा-परीक्षण योग्य शोध साक्ष्य तक एक पथ बनाते हैं।

ट्रेस कॉर्पस पर अनुभवजन्य N_eff माप प्रस्तावित Proof of Benefit federation primitive के नीचे का फ्लोर भी है। देखें federation पृष्ठ कि 3.X वास्तुकला योजना इसका उपयोग कैसे करेगी।

बेंचमार्क

ट्रेस निरंतर व्यवहार दिखाकर बेंचमार्क के पूरक हैं।

बेंचमार्क अभी भी मूल्यवान हैं, लेकिन वे व्यवहार को कम घनत्व में नमूना लेते हैं। ट्रेस कॉर्पस दिखाता है कि एजेंट समय के साथ वास्तविक कार्यों में कैसे आगे बढ़ता है। इससे वे केवल पास-फेल परिणामों के बजाय संकोच, इनकार, ओवरराइड और पुनर्प्राप्ति मापने के लिए विशेष रूप से उपयोगी हो जाते हैं।

असत्यापन पथ

बेहतर स्कीमा विवरण वह है जो अवलोकन को मजबूत परीक्षणों में बदलता है।

अगले स्कीमा अपग्रेड कच्चे स्रोत गणना, स्रोत उद्गम, सहसंबंध संरचना, और हस्तक्षेप और पुनर्प्राप्ति मार्करों पर लक्षित हैं। वे जोड़ मायने रखते हैं क्योंकि वे केवल हमारे पास मौजूद नक्शों का वर्णन करने के बजाय दबाव में व्यवहारिक आकार कैसे बदलता है, इस बारे में मजबूत दावे परखना संभव बनाते हैं।

हम अभी भी क्या सीख रहे हैं

आज का कॉर्पस व्यवहार को समझ में लाता है। अगला कदम समृद्ध माप है।

मौजूदा नक्शे पहले से ही उपयोगी हैं क्योंकि वे सार्वजनिक रूप से पूर्णता कॉरिडोर, इनकार सीमाएँ और विरल आधार रेखाएँ दिखाते हैं। खुला प्रश्न यह है कि जैसे-जैसे मानकीकृत ट्रेस संग्रह अधिक एजेंटों, अधिक कार्यों और अधिक प्रतिकूल परिस्थितियों में फैलता है, वे संरचनाएँ हमें कितनी दूर ले जा सकती हैं।

कार्यशील परिकल्पना यह है कि व्यवहारिक आकर्षक केंद्र परिचालन मोड के लिए उम्मीदवार प्रॉक्सी के रूप में काम कर सकते हैं। ट्रेस कॉमन्स का उद्देश्य उस परिकल्पना को खुले में मापने योग्य बनाना है।

जो विफलता मोड CCA संरचनात्मक रूप से मापती है उसका FAccT 2025 साहित्य में एक नाम है: perspectival homogenization ("Value of Disagreement in AI Design, Evaluation, and Alignment")। गणितीय आधार समर्पित Coherence Collapse Analysis पृष्ठ पर है।