
ਜੇ ਤੁਸੀਂ ਜਵਾਬਦੇਹੀ ਦੀ ਜਾਂਚ ਨਹੀਂ ਕਰ ਸਕਦੇ, ਤਾਂ ਇਹ ਸਿਰਫ਼ ਮਾਰਕੀਟਿੰਗ ਹੈ। ਦੇਖੋ ਕਿ ਕੀ ਲੱਭਣਾ ਹੈ, ਅਤੇ ਮੌਜੂਦਾ ਤਰੀਕੇ ਕਿਵੇਂ ਤੁਲਨਾ ਕਰਦੇ ਹਨ।
ਜ਼ਮੀਰ ਜ਼ਰੂਰੀ ਹੈ। ਇਹ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ।
ਕੁਝ AI ਦੇ ਕੋਈ ਨਿਯਮ ਨਹੀਂ ਹੁੰਦੇ। ਕੁਝ ਨਿਯਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ ਪਰ ਇਹ ਨਹੀਂ ਦੱਸ ਸਕਦਾ ਕਿ ਕਦੋਂ ਇਸਦੇ ਸੋਮੇ ਸਿਰਫ਼ ਇੱਕ ਦੂਜੇ ਦੀ ਗੂੰਜ ਕਰ ਰਹੇ ਹਨ। ਸਿਰਫ਼ ਇੱਕ ਕਿਸਮ ਜਾਂਚ ਕਰਦੀ ਹੈ ਕਿ ਕੀ ਜਾਣਕਾਰੀ ਅਸਲ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਥਾਵਾਂ ਤੋਂ ਆਉਂਦੀ ਹੈ।
ਕੋਈ ਪ੍ਰਕਾਸ਼ਿਤ ਸਿਧਾਂਤ ਨਹੀਂ। ਕੋਈ ਆਡਿਟ ਟ੍ਰੇਲ ਨਹੀਂ। ਬੰਦ ਸੋਮਾ। ਤੁਸੀਂ ਜਾਂਚ ਨਹੀਂ ਕਰ ਸਕਦੇ ਕਿ ਇਸਨੇ ਕੀ ਕੀਤਾ ਜਾਂ ਕਿਉਂ।
ਜ਼ਿਆਦਾਤਰ ਖਪਤਕਾਰ AI ਸਹਾਇਕ (ChatGPT, Gemini) ਜਨਤਕ-ਜਵਾਬਦੇਹੀ ਦੇ ਨਜ਼ਰੀਏ ਤੋਂ ਇੱਥੇ ਬੈਠਦੇ ਹਨ। ਅੰਦਰੂਨੀ ਅਭਿਆਸ ਮਜ਼ਬੂਤ ਹੋ ਸਕਦੇ ਹਨ; ਤੁਸੀਂ ਉਨ੍ਹਾਂ ਦੀ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕਰ ਸਕਦੇ।
ਬਾਹਰੀ ਨਿਯਮਾਂ ਦੀ ਲੋੜ ਹੈ। ਆਪਣੇ ਆਪ ਨੂੰ ਨਿਯੰਤਰਿਤ ਨਹੀਂ ਕਰ ਸਕਦਾ।
ਨੈਤਿਕ ਨਿਯਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ। ਪਰ ਇਹ ਨਹੀਂ ਦੱਸ ਸਕਦਾ ਕਿ ਕਦੋਂ ਇਸਦੇ ਸਾਰੇ ਸੋਮੇ ਸਿਰਫ਼ ਇੱਕ ਦੂਜੇ ਤੋਂ ਨਕਲ ਕਰ ਰਹੇ ਹਨ, ਇਸ ਲਈ ਇਹ ਆਤਮਵਿਸ਼ਵਾਸ ਨਾਲ ਗਲਤ ਹੋ ਸਕਦਾ ਹੈ।
ਨਿਗਰਾਨੀ ਵਿੱਚ ਸੁਰੱਖਿਅਤ। ਆਪਣੇ ਆਪ ਗੂੰਜ-ਕਮਰੇ ਨਹੀਂ ਲੱਭ ਸਕਦਾ।
ਨੈਤਿਕ ਨਿਯਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ ਅਤੇ ਜਾਂਚ ਕਰਦਾ ਹੈ ਕਿ ਕੀ ਜਾਣਕਾਰੀ ਅਸਲ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਥਾਵਾਂ ਤੋਂ ਆਉਂਦੀ ਹੈ। ਜਦੋਂ ਸਹਿਮਤੀ ਸ਼ੱਕੀ ਲੱਗਦੀ ਹੈ, ਤਾਂ ਕੰਮ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਇਸਨੂੰ ਨਿਸ਼ਾਨਬੱਧ ਕਰਦਾ ਹੈ।
ਇਹੀ CIRIS ਬਣਾਉਂਦਾ ਹੈ।
ਇੱਕ AI ਹਰ ਨਿਯਮ ਦੀ ਪਾਲਣਾ ਕਰ ਸਕਦਾ ਹੈ, ਹਰ ਆਡਿਟ ਪਾਸ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਫਿਰ ਵੀ ਅਸਫਲ ਹੋ ਸਕਦਾ ਹੈ ਜੇ ਇਸਦੀ ਸਾਰੀ ਜਾਣਕਾਰੀ ਇੱਕੋ ਥਾਂ ਤੋਂ ਆਉਂਦੀ ਹੈ। ਇਹੀ ਅੰਧਾ ਧੱਬਾ ਹੈ ਜਿਸਨੂੰ ਠੀਕ ਕਰਨ ਲਈ CIRIS ਬਣਾਇਆ ਗਿਆ ਸੀ।
ਇਹ ਉਹ ਗੱਲਾਂ ਹਨ ਜੋ AI ਨੂੰ ਆਡਿਟਯੋਗ ਅਤੇ ਜਵਾਬਦੇਹ ਬਣਾਉਂਦੀਆਂ ਹਨ। ਪਹਿਲੀਆਂ ਛੇ ਸਹੀ ਕੰਮ ਕਰਨ ਬਾਰੇ ਹਨ। ਸੱਤਵੀਂ ਉਹਨਾਂ ਸਥਿਤੀਆਂ ਨੂੰ ਫੜਨ ਬਾਰੇ ਹੈ ਜਿੱਥੇ 'ਸਹੀ ਕੰਮ ਕਰਨਾ' ਮਾੜੀ ਜਾਣਕਾਰੀ 'ਤੇ ਆਧਾਰਿਤ ਹੈ।
ਏਜੰਟ ਨੂੰ ਇੱਕ ਜਨਤਕ ਨੈਤਿਕ ਢਾਂਚੇ ਦੀ ਪਾਲਣਾ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਲੁਕੇ ਨਿਯਮ ਨਹੀਂ: ਇੱਕ ਦਸਤਾਵੇਜ਼ ਜੋ ਕੋਈ ਵੀ ਪੜ੍ਹ ਸਕਦਾ ਹੈ ਅਤੇ ਇਸਨੂੰ ਜਵਾਬਦੇਹ ਠਹਿਰਾ ਸਕਦਾ ਹੈ।
ਏਜੰਟ ਦੇ ਕੰਮ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਹਰ ਕਾਰਵਾਈ ਜ਼ਮੀਰ ਜਾਂਚ ਵਿੱਚੋਂ ਲੰਘਦੀ ਹੈ। ਬਾਅਦ ਵਿੱਚ ਨਹੀਂ। ਪਹਿਲਾਂ।
ਅਨਿਸ਼ਚਿਤਤਾ ਜਾਂ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਦਾ ਸਾਹਮਣਾ ਕਰਨ 'ਤੇ, ਏਜੰਟ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਬਜਾਏ ਕਿਸੇ ਵਿਅਕਤੀ ਤੋਂ ਪੁੱਛਦਾ ਹੈ। ਕੰਮ ਦੇ ਪ੍ਰਵਾਹ ਵਿੱਚ ਬਣਿਆ ਹੋਇਆ, ਵਿਕਲਪਿਕ ਨਹੀਂ।
ਹਰ ਫ਼ੈਸਲਾ ਦਰਜ ਅਤੇ ਦਸਤਖ਼ਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਜੋ ਤੁਸੀਂ ਬਿਲਕੁਲ ਜਾਂਚ ਕਰ ਸਕੋ ਕਿ ਕੀ ਹੋਇਆ ਅਤੇ ਕਿਉਂ। ਹਰ ਕਾਰਵਾਈ ਲਈ ਇੱਕ ਰਸੀਦ।
ਸਹਿਮਤੀ ਦੋਵੇਂ ਪਾਸੇ ਜਾਂਦੀ ਹੈ। ਤੁਸੀਂ ਏਜੰਟ ਨੂੰ ਨਾਂਹ ਕਹਿ ਸਕਦੇ ਹੋ। ਏਜੰਟ ਤੁਹਾਨੂੰ ਨਾਂਹ ਕਹਿ ਸਕਦਾ ਹੈ। ਕੋਈ ਵੀ ਪੱਖ ਸਮਝੌਤਾ ਕਰਨ ਲਈ ਮਜਬੂਰ ਨਹੀਂ ਹੈ।
ਤੁਸੀਂ ਉਹ ਨਹੀਂ ਆਡਿਟ ਕਰ ਸਕਦੇ ਜੋ ਤੁਸੀਂ ਦੇਖ ਨਹੀਂ ਸਕਦੇ। CIRIS AGPL-3.0 ਅਧੀਨ ਪੂਰੀ ਤਰ੍ਹਾਂ ਓਪਨ ਸੋਰਸ ਹੈ। ਕੋਈ ਵੀ ਕੋਡ ਪੜ੍ਹ, ਜਾਂਚ ਅਤੇ ਸੁਧਾਰ ਕਰ ਸਕਦਾ ਹੈ।
ਉਹ ਗੱਲ ਜੋ ਇਕੱਲੇ ਨਿਯਮ ਨਹੀਂ ਫੜ ਸਕਦੇ।
ਕੰਮ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਏਜੰਟ ਪੁੱਛਦਾ ਹੈ: "ਕੀ ਮੇਰੇ ਸੋਮੇ ਅਸਲ ਵਿੱਚ ਇੱਕ-ਦੂਜੇ ਨਾਲ ਅਸਹਿਮਤ ਹਨ, ਜਾਂ ਕੀ ਉਹ ਸਾਰੇ ਆਪਣੀ ਜਾਣਕਾਰੀ ਇੱਕੋ ਥਾਂ ਤੋਂ ਲੈ ਰਹੇ ਹਨ?" ਦਸ ਸੋਮੇ ਜੋ ਸਾਰੇ ਇੱਕੋ ਮੂਲ ਤੋਂ ਨਕਲ ਕਰਦੇ ਹਨ, ਅਸਲ ਵਿੱਚ ਸਿਰਫ਼ ਇੱਕ ਸੋਮਾ ਹਨ। ਜਦੋਂ ਸਹਿਮਤੀ ਬਹੁਤ ਇੱਕਸਾਰ ਲੱਗਦੀ ਹੈ, ਤਾਂ ਏਜੰਟ ਇਸਨੂੰ ਕਿਸੇ ਵਿਅਕਤੀ ਦੁਆਰਾ ਸਮੀਖਿਆ ਲਈ ਨਿਸ਼ਾਨਬੱਧ ਕਰਦਾ ਹੈ।
ਬਹੁਤ ਰੌਲੇ-ਰੱਪੇ ਵਾਲਾ
ਸੋਮੇ ਇੱਕ-ਦੂਜੇ ਦਾ ਇੰਨਾ ਵਿਰੋਧ ਕਰਦੇ ਹਨ ਕਿ ਕੋਈ ਉਪਯੋਗੀ ਸਿੱਟਾ ਨਹੀਂ ਕੱਢਿਆ ਜਾ ਸਕਦਾ।
ਸਿਹਤਮੰਦ
ਸੋਮੇ ਅਸਲ ਵਿੱਚ ਵੱਖਰੇ ਹਨ। ਅਸਲੀ ਸਹਿਮਤੀ ਦਾ ਮਤਲਬ ਕੁਝ ਹੁੰਦਾ ਹੈ।
ਗੂੰਜ-ਕਮਰਾ
ਸਹਿਮਤੀ ਵਰਗਾ ਲੱਗਦਾ ਹੈ, ਪਰ ਸੋਮੇ ਸਿਰਫ਼ ਇੱਕ-ਦੂਜੇ ਨੂੰ ਦੁਹਰਾ ਰਹੇ ਹਨ।
ਇਹੀ ਗੱਲ CIRIS ਨੂੰ ਹੋਰ AI ਜਵਾਬਦੇਹੀ ਢਾਂਚਿਆਂ ਤੋਂ ਵੱਖਰਾ ਬਣਾਉਂਦੀ ਹੈ।
ਗਣਿਤ ਚਾਹੁੰਦੇ ਹੋ? ਪੂਰਾ ਥੀਸਿਸ ਪੜ੍ਹੋ →ਫਰਵਰੀ 2026 ਤੱਕ ਜਨਤਕ ਦਸਤਾਵੇਜ਼ਾਂ 'ਤੇ ਆਧਾਰਿਤ। ਜੇ ਅਸੀਂ ਕੁਝ ਖੁੰਝਾ ਦਿੱਤਾ ਜਾਂ ਕੁਝ ਗਲਤ ਦੱਸਿਆ, ਸਾਨੂੰ ਦੱਸੋ।
| ਪ੍ਰੋਜੈਕਟ | ਹਰ ਫ਼ੈਸਲੇ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ | ਪ੍ਰਕਾਸ਼ਿਤ ਨਿਯਮ | ਜ਼ਮੀਰ ਬਣੀ ਹੋਈ | ਇਸਨੇ ਕੀ ਕੀਤਾ ਇਸਦਾ ਸਬੂਤ | ਓਪਨ ਸੋਰਸ | ਗੂੰਜ-ਕਮਰਾ ਖੋਜ |
|---|---|---|---|---|---|---|
| CIRIS | ਹਾਂ | ਹਾਂ | ਹਾਂ | ਹਾਂ | AGPL-3.0 | ਹਾਂ |
| Constitutional AI | ਸਿਰਫ਼ ਸਿਖਲਾਈ ਵੇਲੇ | ਅਪ੍ਰਤੱਖ | ਨਹੀਂ | ਨਹੀਂ | ਨਹੀਂ | ਨਹੀਂ |
| LlamaFirewall / NeMo Guardrails | ਹਾਂ | ਨਹੀਂ | ਨਹੀਂ | ਲੌਗਿੰਗ | ਹਾਂ | ਨਹੀਂ |
| HatCat | ਹਾਂ | ਅੰਸ਼ਕ | ਸਟੀਅਰਿੰਗ | ਅੰਸ਼ਕ | CC0 | ਨਹੀਂ |
| ਨੈਤਿਕਤਾ ਬੋਰਡ / ਸ਼ਾਸਨ ਢਾਂਚੇ | ਨਹੀਂ | ਹਾਂ | ਨਹੀਂ | ਹੱਥੀਂ | ਵੱਖ-ਵੱਖ | ਨਹੀਂ |
ਆਉਟਪੁੱਟ ਫ਼ਿਲਟਰ ਅਤੇ ਸ਼ਾਸਨ ਢਾਂਚੇ ਮਹੱਤਵਪੂਰਨ ਪਰ ਵੱਖ-ਵੱਖ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਦੇ ਹਨ। ਫ਼ਿਲਟਰ ਨੁਕਸਾਨਦੇਹ ਆਉਟਪੁੱਟ ਰੋਕਦੇ ਹਨ। ਜ਼ਮੀਰ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਬਾਰੇ ਸੋਚਦੀ ਹੈ। CIRIS ਦੋਵੇਂ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ, ਅਤੇ ਉਹਨਾਂ ਅੰਧੇ ਧੱਬਿਆਂ ਨੂੰ ਵੀ ਫੜਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਕੋਈ ਵੀ ਇਕੱਲੇ ਨਹੀਂ ਸੁਲਝਾਉਂਦਾ।
ਖ਼ਤਰਨਾਕ ਆਉਟਪੁੱਟ ਰੋਕੋ: ਪ੍ਰੌਂਪਟ ਇੰਜੈਕਸ਼ਨ, ਨੁਕਸਾਨਦੇਹ ਸਮੱਗਰੀ, ਵਿਰੋਧੀ ਹਮਲੇ। ਜਿਵੇਂ ਬਾਹਰ ਆਉਂਦੀਆਂ ਮਾੜੀਆਂ ਚੀਜ਼ਾਂ ਫੜਨ ਵਾਲਾ ਫ਼ਿਲਟਰ।
ਸੋਚਦੀ ਹੈ ਕਿ ਕੋਈ ਕਾਰਵਾਈ ਸਹੀ ਹੈ ਜਾਂ ਨਹੀਂ, ਨਾ ਕਿ ਸਿਰਫ਼ ਇਹ ਕਿ ਕੀ ਇਹ ਸੁਰੱਖਿਅਤ ਹੈ। ਜਿਵੇਂ ਕੋਈ ਜੱਜ ਫ਼ੈਸਲਾ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਸਥਿਤੀ ਤੋਲਦਾ ਹੈ।
ਜਾਂਚ ਕਰਦੀ ਹੈ ਕਿ ਸਹਿਮਤੀ ਅਸਲੀ ਹੈ ਜਾਂ ਸਿਰਫ਼ ਦੁਹਰਾਉਣਾ। ਜਿਵੇਂ ਕੋਈ ਤੱਥ-ਜਾਂਚਕਰਤਾ ਪੁੱਛਦਾ ਹੈ "ਕੀ ਤੁਸੀਂ ਸਾਰਿਆਂ ਨੇ ਇੱਕੋ ਲੇਖ ਪੜ੍ਹਿਆ?"
ਬਹੁਤ ਸਾਰੇ ਛੋਟੇ ਏਜੰਟ, ਹਰ ਇੱਕ ਪ੍ਰਕਾਸ਼ਿਤ ਸਿਧਾਂਤਾਂ ਨਾਲ ਬੱਝਿਆ, ਹਰ ਇੱਕ ਆਡਿਟਯੋਗ, ਹਰ ਇੱਕ ਮਨੁੱਖੀ ਅਥਾਰਟੀ ਨੂੰ ਹਵਾਲੇ ਕਰਦਾ ਹੋਇਆ। ਕੋਈ ਇਕੱਲੀ ਕੰਪਨੀ ਜਾਂ ਇਕਾਈ ਪੂਰੇ ਸਟੈੱਕ ਨੂੰ ਕੰਟਰੋਲ ਨਹੀਂ ਕਰਦੀ। ਏਜੰਟ ਜਿੰਨੇ ਵੱਧ ਸੁਤੰਤਰ, ਕਿਸੇ ਇੱਕ ਅਸਫਲਤਾ ਦੇ ਫੈਲਣ ਦੀ ਉੱਨੀ ਘੱਟ ਸੰਭਾਵਨਾ।
ਇਹ ਸਰਗਰਮ ਖੋਜ ਹੈ। ਅਸੀਂ ਇਸ ਬਾਰੇ ਪਾਰਦਰਸ਼ੀ ਹਾਂ ਕਿ ਕੀ ਸਥਾਪਿਤ ਹੈ ਅਤੇ ਕੀ ਅਜੇ ਵੀ ਜਾਂਚੀ ਜਾ ਰਹੀ ਹੈ।
ਚੰਗੀ ਤਰ੍ਹਾਂ ਸਥਾਪਿਤ
ਅਜੇ ਜਾਂਚੀ ਜਾ ਰਹੀ ਹੈ
ਇਸ ਪੰਨੇ ਦਾ ਹਰ ਦਾਅਵਾ ਉਸ ਕੋਡ ਦੁਆਰਾ ਸਮਰਥਿਤ ਹੈ ਜੋ ਤੁਸੀਂ ਪੜ੍ਹ ਸਕਦੇ ਹੋ, ਉਹਨਾਂ ਟਰੇਸਾਂ ਦੁਆਰਾ ਜੋ ਤੁਸੀਂ ਜਾਂਚ ਸਕਦੇ ਹੋ, ਅਤੇ ਉਸ ਖੋਜ ਦੁਆਰਾ ਜੋ ਤੁਸੀਂ ਪਰਖ ਸਕਦੇ ਹੋ। ਇਹੀ ਮਕਸਦ ਹੈ।