アライメント研究のクラウドソーシング
CIRISはアライメント研究のためのオープントレースコモンズを構築しています。
私たちは無料のAIアプリを提供しています。あなたの同意のもと、アプリは推論の形を記録しますが、あなたの個人的な言葉は一切記録しません。これらの記録は公開マップとなり、研究者がAIのスケールに伴う誠実さの維持について学ぶために活用できます。
現在のコーパスがすでに示していること
- 集約トレースは安定した行動構造を明らかにしています。
- エージェントによって、同じスコア空間の異なる領域を占めています。
- それらの領域は、今日の可観測性とオペレータツールにとってすでに有用です。
- スキーマの詳細度と規模が向上するにつれ、同じコーパスの価値はさらに高まります。
Corridor Dynamics in Coordinated Systems
An Integration of Operator Formalism, Relational Ontology, and Five-Substrate Empirical Validation
CIRISの主張全体を述べた単一の論文です。健全な協調システムは、単一の声による硬直した崩壊と無秩序なノイズの両方から離れた、測定可能な中間帯に位置します。私たちはこの主張を、線虫・ハエ・AIモデル・オープンソースプロジェクト・組織サンプル・長寿命の人間社会という全領域にわたって検証しました。どの領域においてもパターンは維持されており、論文には誤りを証明するための二十の方法が添付されています。
Zenodoで読む →エンジニアリング層
上記の統合論文はこれら三本の論文を統合するものであり、置き換えるものではありません。各論文は独自のDOIを持ち、独自の観点から評価できます。 主要な知見と範囲の限界とともに全四本の論文を見る →
Coherence Collapse Analysis
v3 · 2026年1月11日 · DOI 10.5281/zenodo.18217688
コリドーの考え方の下にあるエンジニアリングリスクフレームワークです。システムを支配する制約が相関するようになると、有効な多様性が崩壊します:k_eff = k/(1+ρ(k−1)) → 1(ρ → 1のとき)。三つの崩壊タイムライン、特異点境界、および相分類(カオス/健全/硬直)を導出します。モンテカルロシミュレーションとLean 4証明で検証済みです。
CIRISAgent Framework
v2 · 2026年1月2日 · DOI 10.5281/zenodo.18137161
フレームワーク論文です。説明責任ある自律性のためのオープンソース倫理AIフレームワーク:明示的なアクション動詞と倫理的推論を中心に構成された22サービスアーキテクチャで、透明性を後付けではなく構造そのものに組み込んでいます。
Constrained Reasoning Chains
v1 · 2026年4月28日 · DOI 10.5281/zenodo.19839280
測定論文です。標準化された倫理トレースのもとでのLLMアライメントの実証的テレメトリ研究であり、同意を得た推論トレースを完了コリドー、躊躇ゾーン、拒否境界のマップに変換します。オープンな推論トレースデータセットと同時に公開されました。
オープンデータセット
CIRISAI/reasoning-traces
Constrained Reasoning Chains研究と同時に公開されたプライバシー保護型推論トレースコーパスで、測定論文がマップを描く際の原材料となっています。
CIRISAI on Hugging Face
公開データセットとモデルの全組織 →
数学的基礎
このページが依拠する二つの考え方。
アライメントマニフォールドとは、フレームワークの原則と一致する推論形状の領域です。独立した制約が蓄積されるにつれ、欺瞞の余地はマニフォールドの周囲で崩壊していく一方、真実の余地は崩壊しません。Coherence Singularity(一貫性特異点)はその余地の端であり、制約が非常に相関して追加しても効果がなくなる地点です。「カオス」(制約が互いに矛盾する)と「硬直」(制約がすべて互いを反響する)の間に健全なコリドーがあります。現在の本番コーパスはその中に位置しています。
数式、Leanの形式化参照、L-01情報理論的上限を含む完全な数学的処理は、Coherence Collapse Analysisページにあります。
トレースが重要な理由
ベンチマークは限定的で厳選されています。トレースは実際のタスクにおける行動の継続的な記録です。大規模になると、孤立したデモや逸話では明らかにできない構造が明確になります。
スキーマが重要な理由
CIRISはプライバシー保護型トレーススキーマを使用し、推論の内容ではなく推論の形を捉えます。これにより、システムをトランスクリプトのダンプにすることなく、研究に有用な状態を維持できます。
ライブコンペンジウムが重要な理由
CIRIS Scoringはライブトレースコンペンジウムへの公開ウィンドウです。コーパスがどのように蓄積され、行動がどこで判読可能になっているかを示しています。
プライバシー保護型トレーシング
研究の仮説は、推論にはすべてがスケールする中でも測定可能な形があるというものです。
研究の賭けは、すべての個人的な思考を読み取れるというものではありません。標準化された倫理トレースが、エージェントが知性・コンテキスト・データポイントの拡大に伴ってどのように完了し、躊躇し、延期し、上書きし、拒否するかを研究するのに十分な軌跡の形を保持できるというものです。
- 生のプライベートなタスク詳細ではなく、標準化された倫理トレース構造を記録します。
- エージェント、タスク、環境をまたいで軌跡を比較するのに十分な形を保持します。
- 知性・コンテキスト・データ量が増加するにつれて行動がどのようにスケールするかを研究者が研究できる方法を提供します。
研究上の問い
標準化された倫理トレーシングはアライメントについて何を教えてくれるか?
現時点では、エージェントの行動は形がないものではないことがわかります。共有スコア空間において繰り返し可能なコリドー、盆地、境界を生み出します。これはすでに可観測性にとって有用です。時間が経つにつれ、より大規模でリッチなコーパスを通じて、それらの構造がプレッシャーやスケールの下でどのように変化するかについて、より強い主張を検証できるようになるはずです。
公開における位置づけ
CIRISはアライメントを解決したと主張していません。アライメント関連の行動を公開の場で測定するために必要なトレースインフラを構築しています。
本番環境における有効次元数
現在のコーパスはすでに明確なフィールド構造を示しています。
現在のトレースコーパスの集約パスオーバーレイは、共有スコア空間における安定した行動構造を示しています。Allyは成熟した完了コリドーを示し、Scoutは公開的な敵対的露出によって形成された拒否境界を示し、Datumはコンパクトな疎なベースラインを提供しています。

現在のトレースコーパスからの集約パスオーバーレイ。Allyは成熟した完了コリドーを示し、Scoutは公開的な敵対的プレッシャーの下で鋭い拒否コーナーを示し、Datumは疎なベースラインを提供しています。
Ally
104 パス
82完了、19上書き/エラー、3アクティブ
同じ高スコア盆地内に目に見える躊躇を含む安定した完了コリドー。
Scout
42 パス
39完了、2拒否、1上書き/エラー
scout.ciris.aiで人々が積極的にプローブやジェイルブレイクを試みる公開的な敵対的プレッシャーによって形成された鋭い拒否コーナー。
Datum
31 パス
31完了
有用な疎フィールドベースラインとして機能するコンパクトな単一盆地。
Scoutがより厳しく見える理由
Scoutはscout.ciris.aiで公開されています。人々が積極的にテストし、プレッシャーをかけ、ジェイルブレイクを試みます。そのため、Scoutは中立なベースラインではなく、有用な公開プレッシャーの例となっています。
無料アプリがどのように役立つか
研究のフライホイールは、実際の使用からの同意を得たトレースに依存しています。
無料アプリとオープンソースランタイムにより、人々は実際のタスクから同意を得たトレースを生成し、共有コーパスに提供し、それらのトレースをより良いマップ、より良いツール、より良い研究上の問いに変えることができます。
- 1無料CIRISアプリまたはオープンソースランタイムを実際のタスクで実行します。
- 2タスクの詳細を保存することなく推論の形を保持するプライバシー保護型スキーマを通じて同意を得たトレースを収集します。
- 3それらのトレースを完了コリドー、躊躇ゾーン、拒否境界、上書きフリンジのマップに集約します。
- 4得られたマップを活用してオペレータツール、ランタイムセーフガード、アライメント研究を改善します。

無料CIRISアプリとオープンソースランタイムにより、人々は実際のタスクから同意を得たトレースを生成し、それらを共有の位相空間マップに集約し、より良いオペレータツールとアライメント研究に役立てることができます。
IDMAステータス
ランタイム直感と集約フィールドマップは補完的な層です。
IDMAはランタイムで機能し、ある決定の背後にある情報源が十分に独立しているかどうかを推定します。トレースコーパスは集約層で機能し、多くのタスクにわたってエージェントが実際に何をするかを示します。両者を合わせることで、ライブ決定から監査可能な研究エビデンスへの経路が生まれます。
トレースコーパスの実証的なN_eff測定は、提案されているProof of Benefitフェデレーションプリミティブの下限でもあります。3.Xアーキテクチャ計画がそれをどのように使用するかについては、フェデレーションページを参照してください。
ベンチマーク
トレースは継続的な行動を示すことでベンチマークを補完します。
ベンチマークは依然として価値がありますが、行動をまばらにサンプリングします。トレースコーパスは、エージェントが時間をかけて実際のタスクをどのように処理するかを示します。そのため、合格・不合格の結果だけでなく、躊躇・拒否・上書き・回復を測定するのに特に有用です。
反証の道筋
より詳細なスキーマが可観測性をより強力なテストに変えます。
次のスキーマのアップグレードは、生のソース数、ソースの出所、相関構造、介入と回復のマーカーを目標としています。これらの追加は、現在持っているマップを記述するだけでなく、プレッシャーの下で行動の形がどのように変化するかについてより強い主張を検証できるようにするために重要です。
まだ学んでいること
今日のコーパスは行動を判読可能にします。次のステップはより豊かな測定です。
現在のマップはすでに有用です。公開の場で完了コリドー、拒否境界、疎なベースラインを示しているからです。未解決の問いは、より多くのエージェント、より多くのタスク、より多くの敵対的条件をまたいで標準化されたトレース収集がスケールするにつれ、それらの構造がどこまで私たちを導けるかです。
行動アトラクターが運用モードの候補プロキシとして機能できるという作業仮説があります。トレースコモンズの目的は、その仮説を公開の場で測定可能にすることです。
CCAが構造的に測定する障害モードは、FAccT 2025の文献にも名前があります:perspectival homogenization(「Value of Disagreement in AI Design, Evaluation, and Alignment」)。数学的基礎は専用のCoherence Collapse Analysisページにあります。