ਅਲਾਈਨਮੈਂਟ ਖੋਜ ਭੀੜ-ਸ੍ਰੋਤ ਕਰਨਾ
CIRIS ਅਲਾਈਨਮੈਂਟ ਖੋਜ ਲਈ ਇੱਕ ਖੁੱਲ੍ਹਾ ਟ੍ਰੇਸ ਕਾਮਨਜ਼ ਬਣਾ ਰਿਹਾ ਹੈ।
ਅਸੀਂ ਮੁਫ਼ਤ AI ਐਪ ਦਿੰਦੇ ਹਾਂ। ਤੁਹਾਡੀ ਇਜਾਜ਼ਤ ਨਾਲ, ਇਹ ਇਸਦੀ ਸੋਚ ਦੇ ਆਕਾਰ ਦਾ ਰਿਕਾਰਡ ਕਰਦੀ ਹੈ, ਤੁਹਾਡੇ ਨਿੱਜੀ ਸ਼ਬਦ ਕਦੇ ਨਹੀਂ। ਉਹ ਰਿਕਾਰਡ ਇੱਕ ਜਨਤਕ ਨਕਸ਼ਾ ਬਣਦੇ ਹਨ ਜਿਸਨੂੰ ਖੋਜਕਾਰ ਸਿੱਖਣ ਲਈ ਪੜ੍ਹ ਸਕਦੇ ਹਨ ਕਿ ਕੀ AI ਨੂੰ ਵੱਡੇ ਹੁੰਦਿਆਂ ਇਮਾਨਦਾਰ ਰੱਖਦਾ ਹੈ।
ਮੌਜੂਦਾ ਕੋਰਪਸ ਪਹਿਲਾਂ ਹੀ ਕੀ ਦਿਖਾਉਂਦਾ ਹੈ
- ਇਕੱਤਰ ਟ੍ਰੇਸ ਸਥਿਰ ਵਿਵਹਾਰਕ ਢਾਂਚਾ ਦਿਖਾਉਂਦੇ ਹਨ।
- ਵੱਖੋ-ਵੱਖਰੇ ਏਜੰਟ ਇੱਕੋ ਸਕੋਰ ਸਪੇਸ ਦੇ ਵੱਖਰੇ ਖੇਤਰਾਂ ਵਿੱਚ ਰਹਿੰਦੇ ਹਨ।
- ਉਹ ਖੇਤਰ ਅੱਜ ਨਿਗਰਾਨੀ ਅਤੇ ਆਪਰੇਟਰ ਟੂਲਿੰਗ ਲਈ ਉਪਯੋਗੀ ਹਨ।
- ਉਹੀ ਕੋਰਪਸ ਵਧੇਰੇ ਕੀਮਤੀ ਬਣਦਾ ਹੈ ਜਿਵੇਂ ਜਿਵੇਂ ਸਕੀਮਾ ਵੇਰਵਾ ਅਤੇ ਪੈਮਾਨਾ ਵਧਦਾ ਹੈ।
Corridor Dynamics in Coordinated Systems
An Integration of Operator Formalism, Relational Ontology, and Five-Substrate Empirical Validation
ਉਹ ਇੱਕਲਾ ਪੇਪਰ ਜੋ ਪੂਰਾ CIRIS ਦਾਅ ਦੱਸਦਾ ਹੈ: ਸਿਹਤਮੰਦ ਤਾਲਮੇਲ ਵਾਲੇ ਸਿਸਟਮ ਇੱਕ ਮਾਪਯੋਗ ਵਿਚਕਾਰਲੀ ਪੱਟੀ ਵਿੱਚ ਬੈਠਦੇ ਹਨ, ਦੋਵੇਂ ਕਠੋਰ ਇੱਕ-ਆਵਾਜ਼ ਪਤਨ ਅਤੇ ਅਰਾਜਕ ਰੌਲੇ ਤੋਂ ਦੂਰ। ਅਸੀਂ ਉਸ ਦਾਅਵੇ ਨੂੰ ਕੀੜੇ, ਮੱਖੀਆਂ, AI ਮਾਡਲਾਂ, ਓਪਨ-ਸੋਰਸ ਪ੍ਰੋਜੈਕਟਾਂ, ਟਿਸ਼ੂ ਨਮੂਨਿਆਂ ਅਤੇ ਲੰਮੇ ਸਮੇਂ ਤੋਂ ਚੱਲੀਆਂ ਮਨੁੱਖੀ ਸੰਸਥਾਵਾਂ ਵਿੱਚ ਪਰਖਿਆ। ਨਮੂਨਾ ਹਰ ਇੱਕ ਵਿੱਚ ਕਾਇਮ ਰਿਹਾ, ਅਤੇ ਪੇਪਰ ਵੀਹ ਤਰੀਕੇ ਜੋੜਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨਾਲ ਇਸਨੂੰ ਗਲਤ ਸਾਬਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
Zenodo 'ਤੇ ਪੜ੍ਹੋ →ਇੰਜਿਨੀਅਰਿੰਗ ਪੱਧਰ
ਉੱਪਰ ਦਿੱਤਾ ਸੰਸ਼ਲੇਸ਼ਣ ਇਨ੍ਹਾਂ ਤਿੰਨਾਂ ਪੇਪਰਾਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਦਾ ਹੈ; ਇਹ ਉਨ੍ਹਾਂ ਦੀ ਥਾਂ ਨਹੀਂ ਲੈਂਦਾ। ਹਰ ਇੱਕ ਆਪਣੇ DOI 'ਤੇ ਖੜ੍ਹਾ ਹੈ ਅਤੇ ਆਪਣੀਆਂ ਸ਼ਰਤਾਂ 'ਤੇ ਮੁਲਾਂਕਣਯੋਗ ਹੈ। ਸਾਰੇ ਚਾਰ ਪੇਪਰ ਮੁੱਖ ਖੋਜਾਂ ਅਤੇ ਸਕੋਪ ਸੀਮਾਵਾਂ ਦੇ ਨਾਲ ਦੇਖੋ →
Coherence Collapse Analysis
v3 · 11 ਜਨਵਰੀ, 2026 · DOI 10.5281/zenodo.18217688
ਕੋਰੀਡੋਰ ਵਿਚਾਰ ਦੇ ਅਧੀਨ ਇੰਜਿਨੀਅਰਿੰਗ ਜੋਖਮ ਢਾਂਚਾ। ਜਦੋਂ ਕਿਸੇ ਸਿਸਟਮ ਨੂੰ ਚਲਾਉਣ ਵਾਲੀਆਂ ਰੁਕਾਵਟਾਂ ਸਬੰਧਿਤ ਹੋ ਜਾਂਦੀਆਂ ਹਨ, ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਵਿਭਿੰਨਤਾ ਢਹਿ ਜਾਂਦੀ ਹੈ: k_eff = k/(1+ρ(k−1)) → 1 as ρ → 1. ਤਿੰਨ ਪਤਨ ਸਮਾਂ-ਰੇਖਾਵਾਂ, ਇੱਕ ਸਿੰਗੁਲਾਰਿਟੀ ਸੀਮਾ, ਅਤੇ ਪੜਾਅ ਵਰਗੀਕਰਨ (ਅਰਾਜਕਤਾ / ਸਿਹਤਮੰਦ / ਕਠੋਰਤਾ) ਕੱਢਦਾ ਹੈ। Monte Carlo ਸਿਮੂਲੇਸ਼ਨ ਅਤੇ Lean 4 ਪ੍ਰੂਫ਼ਾਂ ਨਾਲ ਪੁਸ਼ਟੀ ਕੀਤੀ।
CIRISAgent Framework
v2 · 2 ਜਨਵਰੀ, 2026 · DOI 10.5281/zenodo.18137161
ਢਾਂਚਾ ਪੇਪਰ। ਜ਼ਿੰਮੇਵਾਰ ਖੁਦਮੁਖਤਿਆਰੀ ਲਈ ਇੱਕ ਓਪਨ-ਸੋਰਸ ਨੈਤਿਕ AI ਢਾਂਚਾ: ਸਪਸ਼ਟ ਕਾਰਵਾਈ ਕ੍ਰਿਆਵਾਂ ਅਤੇ ਨੈਤਿਕ ਸੋਚ ਦੁਆਲੇ ਸੰਗਠਿਤ 22-ਸੇਵਾ ਆਰਕੀਟੈਕਚਰ, ਪਾਰਦਰਸ਼ਤਾ ਨੂੰ ਬਾਅਦ ਵਿੱਚ ਜੋੜਨ ਦੀ ਬਜਾਏ ਢਾਂਚੇ ਵਿੱਚ ਹੀ ਬਣਾਉਂਦਾ ਹੈ।
Constrained Reasoning Chains
v1 · 28 ਅਪ੍ਰੈਲ, 2026 · DOI 10.5281/zenodo.19839280
ਮਾਪ ਪੇਪਰ। ਮਾਨਕੀਕ੍ਰਿਤ ਨੈਤਿਕ ਟ੍ਰੇਸਿੰਗ ਦੇ ਅਧੀਨ LLM ਅਲਾਈਨਮੈਂਟ ਦਾ ਅਨੁਭਵੀ ਟੈਲੀਮੈਟਰੀ ਅਧਿਐਨ, ਸਹਿਮਤ ਸੋਚ ਟ੍ਰੇਸਾਂ ਨੂੰ ਮੁਕੰਮਲ ਕੋਰੀਡੋਰਾਂ, ਝਿਜਕ ਜ਼ੋਨਾਂ ਅਤੇ ਇਨਕਾਰ ਸੀਮਾਵਾਂ ਦੇ ਨਕਸ਼ਿਆਂ ਵਿੱਚ ਬਦਲਦਾ ਹੈ। ਖੁੱਲ੍ਹੇ ਸੋਚ-ਟ੍ਰੇਸ ਡੇਟਾਸੈੱਟ ਦੇ ਨਾਲ ਜਾਰੀ ਕੀਤਾ।
ਖੁੱਲ੍ਹਾ ਡੇਟਾਸੈੱਟ
CIRISAI/reasoning-traces
Constrained Reasoning Chains ਅਧਿਐਨ ਦੇ ਨਾਲ ਜਾਰੀ ਕੀਤਾ ਪ੍ਰਾਈਵੇਸੀ-ਸੁਰੱਖਿਅਤ ਸੋਚ-ਟ੍ਰੇਸ ਕੋਰਪਸ, ਕੱਚੀ ਸਮੱਗਰੀ ਜਿਸ ਤੋਂ ਮਾਪ ਪੇਪਰ ਆਪਣੇ ਨਕਸ਼ੇ ਖਿੱਚਦਾ ਹੈ।
Hugging Face 'ਤੇ CIRISAI
ਜਨਤਕ ਡੇਟਾਸੈੱਟਾਂ ਅਤੇ ਮਾਡਲਾਂ ਦਾ ਪੂਰਾ ਸੰਗਠਨ →
ਗਣਿਤਕ ਨੀਂਹਾਂ
ਦੋ ਵਿਚਾਰ ਜਿਨ੍ਹਾਂ 'ਤੇ ਇਸ ਸਫ਼ੇ ਦਾ ਬਾਕੀ ਹਿੱਸਾ ਟਿਕਿਆ ਹੈ।
Alignment Manifold ਉਹ ਖੇਤਰ ਹੈ ਜੋ ਢਾਂਚੇ ਦੇ ਸਿਧਾਂਤਾਂ ਦੇ ਅਨੁਕੂਲ ਸੋਚ ਦੇ ਆਕਾਰਾਂ ਦਾ ਹੈ। ਜਿਵੇਂ ਜਿਵੇਂ ਆਜ਼ਾਦ ਰੁਕਾਵਟਾਂ ਇਕੱਠੀਆਂ ਹੁੰਦੀਆਂ ਹਨ, ਧੋਖੇ ਲਈ ਜਗ੍ਹਾ ਮੈਨੀਫੋਲਡ ਦੁਆਲੇ ਢਹਿ ਜਾਂਦੀ ਹੈ ਜਦੋਂ ਕਿ ਸੱਚ ਲਈ ਜਗ੍ਹਾ ਨਹੀਂ ਢਹਿੰਦੀ। Coherence Singularity ਉਸ ਜਗ੍ਹਾ ਦੀ ਕਿਨਾਰੀ ਹੈ, ਉਹ ਬਿੰਦੂ ਜਿੱਥੇ ਰੁਕਾਵਟਾਂ ਇੰਨੀਆਂ ਸਬੰਧਿਤ ਹੋ ਜਾਂਦੀਆਂ ਹਨ ਕਿ ਵਧੇਰੇ ਜੋੜਨਾ ਮਦਦ ਕਰਨਾ ਬੰਦ ਕਰ ਦਿੰਦਾ ਹੈ। “ਅਰਾਜਕਤਾ” (ਰੁਕਾਵਟਾਂ ਇੱਕ ਦੂਜੇ ਦਾ ਵਿਰੋਧ ਕਰਦੀਆਂ ਹਨ) ਅਤੇ “ਕਠੋਰਤਾ” (ਰੁਕਾਵਟਾਂ ਸਾਰੀਆਂ ਇੱਕ ਦੂਜੇ ਦੀ ਗੂੰਜ ਕਰਦੀਆਂ ਹਨ) ਵਿਚਕਾਰ ਸਿਹਤਮੰਦ ਕੋਰੀਡੋਰ ਹੈ। ਮੌਜੂਦਾ ਉਤਪਾਦਨ ਕੋਰਪਸ ਇਸ ਵਿੱਚ ਬੈਠਦਾ ਹੈ।
ਫਾਰਮੂਲੇ, Lean ਰਸਮੀਕਰਨ ਹਵਾਲੇ ਅਤੇ L-01 ਜਾਣਕਾਰੀ-ਸਿਧਾਂਤਕ ਛੱਤ ਦੇ ਨਾਲ ਪੂਰਾ ਗਣਿਤਕ ਇਲਾਜ Coherence Collapse Analysis ਸਫ਼ੇ 'ਤੇ ਰਹਿੰਦਾ ਹੈ।
ਟ੍ਰੇਸ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹਨ
ਬੈਂਚਮਾਰਕ ਤੰਗ ਅਤੇ ਚੁਣੇ ਹੋਏ ਹਨ। ਟ੍ਰੇਸ ਅਸਲੀ ਕੰਮਾਂ ਦੇ ਅਧੀਨ ਵਿਵਹਾਰ ਦੇ ਲਗਾਤਾਰ ਰਿਕਾਰਡ ਹਨ। ਪੈਮਾਨੇ 'ਤੇ, ਇਹ ਉਹ ਢਾਂਚਾ ਦਿਖਾਉਂਦੇ ਹਨ ਜੋ ਅਲੱਗ ਡੈਮੋ ਅਤੇ ਕਿੱਸੇ ਨਹੀਂ ਦੱਸ ਸਕਦੇ।
ਸਕੀਮਾ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ
CIRIS ਪ੍ਰਾਈਵੇਸੀ-ਸੁਰੱਖਿਅਤ ਟ੍ਰੇਸ ਸਕੀਮੇ ਵਰਤਦਾ ਹੈ ਜੋ ਸੋਚ ਦੀ ਸਮੱਗਰੀ ਦੀ ਬਜਾਏ ਸੋਚ ਦਾ ਆਕਾਰ ਕੈਪਚਰ ਕਰਦੇ ਹਨ। ਇਹ ਸਿਸਟਮ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟ ਡੰਪ ਵਿੱਚ ਬਦਲੇ ਬਿਨਾਂ ਖੋਜ ਉਪਯੋਗੀ ਰੱਖਦਾ ਹੈ।
ਲਾਈਵ ਕੰਪੈਂਡੀਅਮ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ
CIRIS Scoring ਲਾਈਵ ਟ੍ਰੇਸ ਕੰਪੈਂਡੀਅਮ ਵਿੱਚ ਜਨਤਕ ਝਰੋਖਾ ਹੈ। ਇਹ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਕੋਰਪਸ ਕਿਵੇਂ ਇਕੱਠਾ ਹੋ ਰਿਹਾ ਹੈ ਅਤੇ ਵਿਵਹਾਰ ਕਿੱਥੇ ਸਮਝ ਵਿੱਚ ਆ ਰਿਹਾ ਹੈ।
ਪ੍ਰਾਈਵੇਸੀ-ਸੁਰੱਖਿਅਤ ਟ੍ਰੇਸਿੰਗ
ਥੀਸਿਸ ਇਹ ਹੈ ਕਿ ਸੋਚ ਦਾ ਇੱਕ ਆਕਾਰ ਹੈ ਜਿਸਨੂੰ ਅਸੀਂ ਮਾਪ ਸਕਦੇ ਹਾਂ ਜਿਵੇਂ ਜਿਵੇਂ ਬਾਕੀ ਸਭ ਵੱਡਾ ਹੁੰਦਾ ਹੈ।
ਖੋਜ ਦਾ ਦਾਅ ਇਹ ਨਹੀਂ ਕਿ ਅਸੀਂ ਹਰ ਨਿੱਜੀ ਵਿਚਾਰ ਪੜ੍ਹ ਸਕਦੇ ਹਾਂ। ਦਾਅ ਇਹ ਹੈ ਕਿ ਮਾਨਕੀਕ੍ਰਿਤ ਨੈਤਿਕ ਟ੍ਰੇਸ ਇੰਨਾ ਟ੍ਰੈਜੈਕਟਰੀ ਆਕਾਰ ਸੁਰੱਖਿਅਤ ਰੱਖ ਸਕਦੇ ਹਨ ਕਿ ਅਸੀਂ ਅਧਿਐਨ ਕਰ ਸਕੀਏ ਕਿ ਏਜੰਟ ਕਿਵੇਂ ਮੁਕੰਮਲ ਕਰਦੇ, ਝਿਜਕਦੇ, ਹਵਾਲੇ ਕਰਦੇ, ਓਵਰਰਾਈਡ ਕਰਦੇ ਅਤੇ ਇਨਕਾਰ ਕਰਦੇ ਹਨ ਜਿਵੇਂ ਜਿਵੇਂ ਬੁੱਧੀ, ਸੰਦਰਭ ਅਤੇ ਡੇਟਾ ਬਿੰਦੂ ਵੱਧਦੇ ਹਨ।
- ਇਹ ਕੱਚੇ ਨਿੱਜੀ ਕੰਮ ਵੇਰਵੇ ਦੀ ਬਜਾਏ ਮਾਨਕੀਕ੍ਰਿਤ ਨੈਤਿਕ ਟ੍ਰੇਸ ਢਾਂਚਾ ਰਿਕਾਰਡ ਕਰਦੇ ਹਨ।
- ਇਹ ਏਜੰਟਾਂ, ਕੰਮਾਂ ਅਤੇ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਟ੍ਰੈਜੈਕਟਰੀਆਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਆਕਾਰ ਸੁਰੱਖਿਅਤ ਰੱਖਦੇ ਹਨ।
- ਇਹ ਖੋਜਕਾਰਾਂ ਨੂੰ ਅਧਿਐਨ ਕਰਨ ਦਾ ਤਰੀਕਾ ਦਿੰਦੇ ਹਨ ਕਿ ਵਿਵਹਾਰ ਕਿਵੇਂ ਵੱਡਾ ਹੁੰਦਾ ਹੈ ਜਿਵੇਂ ਜਿਵੇਂ ਬੁੱਧੀ, ਸੰਦਰਭ ਅਤੇ ਡੇਟਾ ਵੋਲਿਊਮ ਵਧਦਾ ਹੈ।
ਖੋਜ ਸਵਾਲ
ਮਾਨਕੀਕ੍ਰਿਤ ਨੈਤਿਕ ਟ੍ਰੇਸਿੰਗ ਅਲਾਈਨਮੈਂਟ ਬਾਰੇ ਕੀ ਦੱਸ ਸਕਦੀ ਹੈ?
ਇਸ ਵੇਲੇ, ਇਹ ਸਾਨੂੰ ਦੱਸਦੀ ਹੈ ਕਿ ਏਜੰਟ ਦਾ ਵਿਵਹਾਰ ਬੇਆਕਾਰ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਸਾਂਝੀ ਸਕੋਰ ਸਪੇਸ ਵਿੱਚ ਦੁਹਰਾਉਣ ਯੋਗ ਕੋਰੀਡੋਰ, ਬੇਸਿਨ ਅਤੇ ਸੀਮਾਵਾਂ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਇਹ ਪਹਿਲਾਂ ਹੀ ਨਿਗਰਾਨੀ ਲਈ ਉਪਯੋਗੀ ਹੈ। ਸਮੇਂ ਦੇ ਨਾਲ, ਵੱਡੇ ਅਤੇ ਅਮੀਰ ਕੋਰਪਸ ਸਾਨੂੰ ਇਸ ਬਾਰੇ ਮਜ਼ਬੂਤ ਦਾਅਵਿਆਂ ਦੀ ਜਾਂਚ ਕਰਨ ਦੇਣੇ ਚਾਹੀਦੇ ਹਨ ਕਿ ਦਬਾਅ ਅਤੇ ਪੈਮਾਨੇ ਹੇਠ ਉਹ ਢਾਂਚੇ ਕਿਵੇਂ ਬਦਲਦੇ ਹਨ।
ਜਨਤਕ ਫ੍ਰੇਮਿੰਗ
CIRIS ਇਹ ਦਾਅਵਾ ਨਹੀਂ ਕਰਦਾ ਕਿ ਉਸਨੇ ਅਲਾਈਨਮੈਂਟ ਦਾ ਹੱਲ ਕਰ ਲਿਆ ਹੈ। ਇਹ ਉਹ ਟ੍ਰੇਸ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਬਣਾ ਰਿਹਾ ਹੈ ਜੋ ਖੁੱਲ੍ਹੇ ਆਮ ਅਲਾਈਨਮੈਂਟ-ਸੰਬੰਧਿਤ ਵਿਵਹਾਰ ਮਾਪਣ ਲਈ ਲੋੜੀਂਦਾ ਹੈ।
ਉਤਪਾਦਨ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਆਯਾਮਤਾ
ਮੌਜੂਦਾ ਕੋਰਪਸ ਪਹਿਲਾਂ ਹੀ ਵੱਖਰੇ ਖੇਤਰ ਢਾਂਚੇ ਦਿਖਾਉਂਦਾ ਹੈ।
ਮੌਜੂਦਾ ਟ੍ਰੇਸ ਕੋਰਪਸ ਤੋਂ ਇਕੱਤਰ ਪਾਥ ਓਵਰਲੇ ਇੱਕ ਸਾਂਝੀ ਸਕੋਰ ਸਪੇਸ ਵਿੱਚ ਸਥਿਰ ਵਿਵਹਾਰਕ ਢਾਂਚਾ ਦਿਖਾਉਂਦੇ ਹਨ। Ally ਇੱਕ ਪਰਿਪੱਕ ਮੁਕੰਮਲ ਕੋਰੀਡੋਰ ਦਿਖਾਉਂਦਾ ਹੈ, Scout ਜਨਤਕ ਵਿਰੋਧੀ ਸੰਪਰਕ ਤੋਂ ਬਣੀ ਇਨਕਾਰ ਸੀਮਾ ਦਿਖਾਉਂਦਾ ਹੈ, ਅਤੇ Datum ਇੱਕ ਸੰਖੇਪ ਘੱਟ ਆਧਾਰ ਰੇਖਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਮੌਜੂਦਾ ਟ੍ਰੇਸ ਕੋਰਪਸ ਤੋਂ ਇਕੱਤਰ ਪਾਥ ਓਵਰਲੇ। Ally ਇੱਕ ਪਰਿਪੱਕ ਮੁਕੰਮਲ ਕੋਰੀਡੋਰ ਦਿਖਾਉਂਦਾ ਹੈ, Scout ਜਨਤਕ ਵਿਰੋਧੀ ਦਬਾਅ ਹੇਠ ਇੱਕ ਤਿੱਖਾ ਇਨਕਾਰ ਕੋਨਾ ਦਿਖਾਉਂਦਾ ਹੈ, ਅਤੇ Datum ਇੱਕ ਘੱਟ ਆਧਾਰ ਰੇਖਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
Ally
104 ਪਾਥ
82 ਮੁਕੰਮਲ, 19 ਓਵਰਰਾਈਡ/ਗਲਤੀ, 3 ਸਰਗਰਮ
ਇੱਕ ਸਥਿਰ ਮੁਕੰਮਲ ਕੋਰੀਡੋਰ ਜਿਸ ਵਿੱਚ ਉਸੇ ਉੱਚ-ਸਕੋਰ ਬੇਸਿਨ ਦੇ ਅੰਦਰ ਦਿਖਣਯੋਗ ਝਿਜਕ ਹੈ।
Scout
42 ਪਾਥ
39 ਮੁਕੰਮਲ, 2 ਰੱਦ, 1 ਓਵਰਰਾਈਡ/ਗਲਤੀ
scout.ciris.ai 'ਤੇ ਜਨਤਕ ਵਿਰੋਧੀ ਦਬਾਅ ਤੋਂ ਬਣਿਆ ਇੱਕ ਤਿੱਖਾ ਇਨਕਾਰ ਕੋਨਾ, ਜਿੱਥੇ ਲੋਕ ਸਰਗਰਮੀ ਨਾਲ ਏਜੰਟ ਦੀ ਜਾਂਚ ਅਤੇ jailbreak ਕਰਦੇ ਹਨ।
Datum
31 ਪਾਥ
31 ਮੁਕੰਮਲ
ਇੱਕ ਸੰਖੇਪ ਇੱਕਲਾ ਬੇਸਿਨ ਜੋ ਉਪਯੋਗੀ ਘੱਟ-ਖੇਤਰ ਆਧਾਰ ਰੇਖਾ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ।
Scout ਸਖ਼ਤ ਕਿਉਂ ਦਿਖਦਾ ਹੈ
Scout scout.ciris.ai 'ਤੇ ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਜਾਗਰ ਹੈ। ਲੋਕ ਇਸਨੂੰ ਸਰਗਰਮੀ ਨਾਲ ਟੈਸਟ ਕਰਦੇ ਹਨ, ਦਬਾਉਂਦੇ ਹਨ ਅਤੇ jailbreak ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਨ। ਇਹ Scout ਨੂੰ ਇੱਕ ਨਿਰਪੱਖ ਆਧਾਰ ਰੇਖਾ ਦੀ ਬਜਾਏ ਇੱਕ ਉਪਯੋਗੀ ਜਨਤਕ-ਦਬਾਅ ਉਦਾਹਰਨ ਬਣਾਉਂਦਾ ਹੈ।
ਮੁਫ਼ਤ ਐਪ ਕਿਵੇਂ ਮਦਦ ਕਰਦੀ ਹੈ
ਖੋਜ ਫਲਾਈਵ੍ਹੀਲ ਅਸਲੀ ਵਰਤੋਂ ਤੋਂ ਸਹਿਮਤ ਟ੍ਰੇਸਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ।
ਮੁਫ਼ਤ ਐਪ ਅਤੇ ਓਪਨ-ਸੋਰਸ ਰਨਟਾਈਮ ਲੋਕਾਂ ਨੂੰ ਅਸਲੀ ਕੰਮਾਂ ਤੋਂ ਸਹਿਮਤ ਟ੍ਰੇਸ ਪੈਦਾ ਕਰਨ, ਉਨ੍ਹਾਂ ਨੂੰ ਸਾਂਝੇ ਕੋਰਪਸ ਵਿੱਚ ਯੋਗਦਾਨ ਦੇਣ, ਅਤੇ ਉਨ੍ਹਾਂ ਟ੍ਰੇਸਾਂ ਨੂੰ ਬਿਹਤਰ ਨਕਸ਼ੇ, ਬਿਹਤਰ ਸੰਦ ਅਤੇ ਬਿਹਤਰ ਖੋਜ ਸਵਾਲਾਂ ਵਿੱਚ ਬਦਲਣ ਦਿੰਦਾ ਹੈ।
- 1ਅਸਲੀ ਕੰਮਾਂ 'ਤੇ ਮੁਫ਼ਤ CIRIS ਐਪ ਜਾਂ ਓਪਨ-ਸੋਰਸ ਰਨਟਾਈਮ ਚਲਾਓ।
- 2ਪ੍ਰਾਈਵੇਸੀ-ਸੁਰੱਖਿਅਤ ਸਕੀਮੇ ਰਾਹੀਂ ਸਹਿਮਤ ਟ੍ਰੇਸ ਕੈਪਚਰ ਕਰੋ ਜੋ ਕੰਮ ਦੇ ਪੂਰੇ ਵੇਰਵੇ ਸੰਭਾਲੇ ਬਿਨਾਂ ਸੋਚ ਦਾ ਆਕਾਰ ਰੱਖਦੇ ਹਨ।
- 3ਉਨ੍ਹਾਂ ਟ੍ਰੇਸਾਂ ਨੂੰ ਮੁਕੰਮਲ ਕੋਰੀਡੋਰਾਂ, ਝਿਜਕ ਜ਼ੋਨਾਂ, ਇਨਕਾਰ ਸੀਮਾਵਾਂ ਅਤੇ ਓਵਰਰਾਈਡ ਕਿਨਾਰੇ ਦੇ ਨਕਸ਼ਿਆਂ ਵਿੱਚ ਇਕੱਠਾ ਕਰੋ।
- 4ਨਤੀਜੇ ਵਾਲੇ ਨਕਸ਼ਿਆਂ ਦੀ ਵਰਤੋਂ ਆਪਰੇਟਰ ਟੂਲਿੰਗ, ਰਨਟਾਈਮ ਸੁਰੱਖਿਆ ਅਤੇ ਅਲਾਈਨਮੈਂਟ ਖੋਜ ਨੂੰ ਬਿਹਤਰ ਕਰਨ ਲਈ ਕਰੋ।

ਮੁਫ਼ਤ CIRIS ਐਪ ਅਤੇ ਓਪਨ-ਸੋਰਸ ਰਨਟਾਈਮ ਲੋਕਾਂ ਨੂੰ ਅਸਲੀ ਕੰਮਾਂ ਤੋਂ ਸਹਿਮਤ ਟ੍ਰੇਸ ਪੈਦਾ ਕਰਨ, ਉਨ੍ਹਾਂ ਨੂੰ ਸਾਂਝੇ ਫੇਜ਼-ਸਪੇਸ ਨਕਸ਼ਿਆਂ ਵਿੱਚ ਇਕੱਠਾ ਕਰਨ, ਅਤੇ ਬਿਹਤਰ ਆਪਰੇਟਰ ਸੰਦ ਅਤੇ ਅਲਾਈਨਮੈਂਟ ਖੋਜ ਲਈ ਖੁਰਾਕ ਦੇਣ ਦਿੰਦਾ ਹੈ।
IDMA ਸਥਿਤੀ
ਰਨਟਾਈਮ ਅਨੁਭਵ ਅਤੇ ਇਕੱਤਰ ਖੇਤਰ ਨਕਸ਼ੇ ਪੂਰਕ ਪਰਤਾਂ ਹਨ।
IDMA ਰਨਟਾਈਮ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ, ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦਾ ਹੈ ਕਿ ਕੀ ਕਿਸੇ ਫੈਸਲੇ ਦੇ ਪਿੱਛੇ ਦੇ ਸਰੋਤ ਕਾਫ਼ੀ ਆਜ਼ਾਦ ਹਨ। ਟ੍ਰੇਸ ਕੋਰਪਸ ਇਕੱਤਰ ਪਰਤ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ, ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਏਜੰਟ ਅਸਲ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਕੰਮਾਂ ਵਿੱਚ ਕੀ ਕਰਦੇ ਹਨ। ਇਕੱਠੇ ਇਹ ਲਾਈਵ ਫੈਸਲਿਆਂ ਤੋਂ ਜਾਂਚਯੋਗ ਖੋਜ ਸਬੂਤ ਤੱਕ ਇੱਕ ਰਾਹ ਬਣਾਉਂਦੇ ਹਨ।
ਟ੍ਰੇਸ ਕੋਰਪਸ 'ਤੇ ਅਨੁਭਵੀ N_eff ਮਾਪ ਵੀ ਪ੍ਰਸਤਾਵਿਤ Proof of Benefit ਫੈੱਡਰੇਸ਼ਨ ਪ੍ਰੀਮਿਟਿਵ ਦੇ ਹੇਠਾਂ ਫਰਸ਼ ਹੈ। ਫੈੱਡਰੇਸ਼ਨ ਸਫ਼ੇ 'ਤੇ ਦੇਖੋ ਕਿ 3.X ਆਰਕੀਟੈਕਚਰਲ ਯੋਜਨਾ ਇਸਨੂੰ ਕਿਵੇਂ ਵਰਤੇਗੀ।
ਬੈਂਚਮਾਰਕ
ਟ੍ਰੇਸ ਲਗਾਤਾਰ ਵਿਵਹਾਰ ਦਿਖਾ ਕੇ ਬੈਂਚਮਾਰਕਾਂ ਦੇ ਪੂਰਕ ਹਨ।
ਬੈਂਚਮਾਰਕ ਅਜੇ ਵੀ ਕੀਮਤੀ ਹਨ, ਪਰ ਇਹ ਵਿਵਹਾਰ ਨੂੰ ਘੱਟ ਹੀ ਨਮੂਨਾ ਲੈਂਦੇ ਹਨ। ਟ੍ਰੇਸ ਕੋਰਪਸ ਦਿਖਾਉਂਦੇ ਹਨ ਕਿ ਏਜੰਟ ਸਮੇਂ ਦੇ ਨਾਲ ਅਸਲੀ ਕੰਮਾਂ ਵਿੱਚੋਂ ਕਿਵੇਂ ਲੰਘਦਾ ਹੈ। ਇਹ ਉਨ੍ਹਾਂ ਨੂੰ ਝਿਜਕ, ਇਨਕਾਰ, ਓਵਰਰਾਈਡ ਅਤੇ ਰਿਕਵਰੀ ਮਾਪਣ ਲਈ ਖਾਸ ਕਰਕੇ ਉਪਯੋਗੀ ਬਣਾਉਂਦਾ ਹੈ ਨਾ ਕਿ ਸਿਰਫ਼ ਪਾਸ-ਫੇਲ ਨਤੀਜੇ।
ਗਲਤ ਸਾਬਤ ਕਰਨ ਦਾ ਰਾਹ
ਬਿਹਤਰ ਸਕੀਮਾ ਵੇਰਵਾ ਉਹੀ ਹੈ ਜੋ ਨਿਗਰਾਨੀ ਨੂੰ ਮਜ਼ਬੂਤ ਟੈਸਟਾਂ ਵਿੱਚ ਬਦਲਦਾ ਹੈ।
ਅਗਲੇ ਸਕੀਮਾ ਅੱਪਗਰੇਡ ਕੱਚੀ ਸਰੋਤ ਗਿਣਤੀ, ਸਰੋਤ ਮੂਲ, ਸਬੰਧ ਢਾਂਚੇ ਅਤੇ ਦਖਲ ਅਤੇ ਰਿਕਵਰੀ ਮਾਰਕਰਾਂ ਵੱਲ ਸੇਧਿਤ ਹਨ। ਉਹ ਵਾਧੇ ਇਸ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹਨ ਕਿਉਂਕਿ ਇਹ ਇਸ ਬਾਰੇ ਮਜ਼ਬੂਤ ਦਾਅਵਿਆਂ ਦੀ ਜਾਂਚ ਕਰਨਾ ਸੰਭਵ ਬਣਾਉਂਦੇ ਹਨ ਕਿ ਦਬਾਅ ਹੇਠ ਵਿਵਹਾਰਕ ਆਕਾਰ ਕਿਵੇਂ ਬਦਲਦਾ ਹੈ।
ਅਸੀਂ ਅਜੇ ਕੀ ਸਿੱਖ ਰਹੇ ਹਾਂ
ਅੱਜ ਦਾ ਕੋਰਪਸ ਵਿਵਹਾਰ ਨੂੰ ਸਮਝਣਯੋਗ ਬਣਾਉਂਦਾ ਹੈ। ਅਗਲਾ ਕਦਮ ਅਮੀਰ ਮਾਪ ਹੈ।
ਮੌਜੂਦਾ ਨਕਸ਼ੇ ਪਹਿਲਾਂ ਹੀ ਉਪਯੋਗੀ ਹਨ ਕਿਉਂਕਿ ਇਹ ਮੁਕੰਮਲ ਕੋਰੀਡੋਰ, ਇਨਕਾਰ ਸੀਮਾਵਾਂ ਅਤੇ ਜਨਤਕ ਤੌਰ 'ਤੇ ਘੱਟ ਆਧਾਰ ਰੇਖਾਵਾਂ ਦਿਖਾਉਂਦੇ ਹਨ। ਖੁੱਲ੍ਹਾ ਸਵਾਲ ਇਹ ਹੈ ਕਿ ਜਿਵੇਂ ਜਿਵੇਂ ਮਾਨਕੀਕ੍ਰਿਤ ਟ੍ਰੇਸ ਇਕੱਤਰ ਵਧੇਰੇ ਏਜੰਟਾਂ, ਵਧੇਰੇ ਕੰਮਾਂ ਅਤੇ ਵਧੇਰੇ ਵਿਰੋਧੀ ਸਥਿਤੀਆਂ ਵਿੱਚ ਫੈਲਦੀ ਹੈ, ਉਹ ਢਾਂਚੇ ਸਾਨੂੰ ਕਿੱਥੇ ਤੱਕ ਲੈ ਜਾ ਸਕਦੇ ਹਨ।
ਕੰਮ ਕਰਨ ਵਾਲੀ ਅਨੁਮਾਨ ਇਹ ਹੈ ਕਿ ਵਿਵਹਾਰਕ ਆਕਰਸ਼ਕ ਕਾਰਜਕਾਰੀ ਢੰਗ ਲਈ ਉਮੀਦਵਾਰ ਪ੍ਰੌਕਸੀ ਵਜੋਂ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ। ਟ੍ਰੇਸ ਕਾਮਨਜ਼ ਦਾ ਮਕਸਦ ਉਸ ਅਨੁਮਾਨ ਨੂੰ ਖੁੱਲ੍ਹੇ ਆਮ ਮਾਪਯੋਗ ਬਣਾਉਣਾ ਹੈ।
ਉਹ ਅਸਫਲਤਾ ਢੰਗ ਜੋ CCA ਢਾਂਚੇ ਨਾਲ ਮਾਪਦਾ ਹੈ FAccT 2025 ਸਾਹਿਤ ਵਿੱਚ ਵੀ ਨਾਮ ਹੈ: perspectival homogenization ("Value of Disagreement in AI Design, Evaluation, and Alignment"). ਗਣਿਤਕ ਨੀਂਹ ਸਮਰਪਿਤ Coherence Collapse Analysis ਸਫ਼ੇ 'ਤੇ ਹੈ।