Hizalama Araştırmasını Kitlesel Kaynak Kullanımıyla Büyütmek
CIRIS, hizalama araştırması için açık bir iz arşivi oluşturuyor.
Ücretsiz bir yapay zeka uygulaması sunuyoruz. İzninizle, uygulama yalnızca düşünme biçiminin şeklini kaydeder; özel sözcüklerinizi asla kaydetmez. Bu kayıtlar, araştırmacıların yapay zekanın büyüdükçe nasıl dürüst kalacağını inceleyebileceği açık bir haritaya dönüşür.
Mevcut korpus şimdiden ne gösteriyor
- Toplu izler kararlı bir davranışsal yapı ortaya koyuyor.
- Farklı ajanlar aynı skor uzayının farklı bölgelerini kaplıyor.
- Bu bölgeler bugün gözlemlenebilirlik ve operatör araçları için kullanışlı.
- Şema ayrıntısı ve ölçek geliştikçe aynı korpus daha değerli hale geliyor.
Corridor Dynamics in Coordinated Systems
An Integration of Operator Formalism, Relational Ontology, and Five-Substrate Empirical Validation
CIRIS'in tüm iddiasını tek bir makalede özetleyen çalışma: sağlıklı koordineli sistemler, hem katı tek-ses çöküşünden hem de kaotik gürültüden uzakta, ölçülebilir bir orta bantta yer alır. Bu iddiayı solucanlar, sinekler, yapay zeka modelleri, açık kaynak projeleri, doku örnekleri ve köklü insan kurumları üzerinde test ettik. Örüntü her birinde geçerliliğini korudu; makale ayrıca çalışmanın yanlışlanabileceği yirmi yolu açıkça belirtiyor.
Zenodo'da oku →Mühendislik katmanı
Yukarıdaki sentez bu üç makaleyi bütünleştirir; yerini almaz. Her biri kendi DOI'sine sahip ve kendi koşullarında değerlendirilebilir. Temel bulgular ve kapsam sınırlarıyla birlikte dört makalenin tamamını gör →
Coherence Collapse Analysis
v3 · 11 Ocak 2026 · DOI 10.5281/zenodo.18217688
Koridor fikrinin altındaki mühendislik risk çerçevesi. Bir sistemi yöneten kısıtlamalar birbiriyle korelasyon kurduğunda, etkin çeşitlilik çöküyor: k_eff = k/(1+ρ(k−1)) → ρ → 1 iken 1'e yaklaşıyor. Üç çöküş zaman çizelgesi, bir tekillik sınırı ve faz sınıflandırması (kaos / sağlıklı / katılık) türetiyor. Monte Carlo simülasyonu ve Lean 4 kanıtlarıyla doğrulandı.
CIRISAgent Framework
v2 · 2 Ocak 2026 · DOI 10.5281/zenodo.18137161
Çerçeve makalesi. Hesap verebilir otonomi için açık kaynaklı etik yapay zeka çerçevesi: açık eylem fiilleri ve etik akıl yürütme etrafında düzenlenmiş 22 hizmetli mimari; şeffaflığı sonradan eklenen bir kural değil, yapının içine yerleşik bir özellik olarak inşa ediyor.
Constrained Reasoning Chains
v1 · 28 Nisan 2026 · DOI 10.5281/zenodo.19839280
Ölçüm makalesi. Standartlaştırılmış etik izleme altında LLM hizalamasını inceleyen ampirik bir telemetri çalışması; rızaya dayalı akıl yürütme izlerini tamamlama koridorlarının, duraksamalar bölgelerinin ve ret sınırlarının haritalarına dönüştürüyor. Açık akıl yürütme-izleri veri setiyle birlikte yayımlandı.
Açık veri seti
CIRISAI/reasoning-traces
Constrained Reasoning Chains çalışmasıyla birlikte yayımlanan, gizliliği koruyan akıl yürütme izi korpusu; ölçüm makalesinin haritalarını çizdiği ham materyal.
Hugging Face'te CIRISAI
Tüm genel veri setleri ve modeller →
Matematiksel temeller
Sayfanın geri kalanının dayandığı iki fikir.
Hizalama Manifoldu, çerçevenin ilkeleriyle tutarlı akıl yürütme biçimlerinin bulunduğu bölgedir. Bağımsız kısıtlamalar birikmekte, sahtekarlığın yapabileceği alan manifold etrafında daralırken doğrunun alanı daralmıyor. Coherence Singularity (Tutarlılık Tekilliği) ise o alanın kenarıdır: kısıtlamaların o denli korelasyona girdiği, daha fazla eklemenin artık işe yaramadığı nokta. "Kaos" (kısıtlamalar birbiriyle çelişiyor) ile "katılık" (kısıtlamalar birbirini tekrarlıyor) arasında sağlıklı koridor yer alır. Mevcut üretim korpusu onun içinde yer almaktadır.
Formüller, Lean formalizasyon referansları ve L-01 bilgi-teorik tavan içeren tam matematiksel geliştirme, Coherence Collapse Analysis sayfasında yer almaktadır.
İzler neden önemli
Kıyaslamalar dar ve derlenmiş verilerdir. İzler ise gerçek görevlerdeki davranışın sürekli kayıtlarıdır. Yeterli ölçeğe ulaşıldığında, izole gösterimler ve anekdotların ortaya çıkaramayacağı yapıları açığa çıkarır.
Şema neden önemli
CIRIS, akıl yürütmenin özel içeriği yerine şeklini yakalayan gizliliği koruyan iz şemaları kullanır. Bu, sistemi bir döküm deposuna dönüştürmeden araştırmayı kullanışlı tutar.
Canlı derleme neden önemli
CIRIS Scoring, canlı iz derlemesinin halka açık penceresidir. Korpusun nasıl biriktiğini ve davranışın hangi alanlarda anlaşılır hale geldiğini gösterir.
Gizliliği koruyan izleme
Tez şu: akıl yürütmenin her şey büyüdükçe ölçebileceğimiz bir biçimi var.
Araştırma iddiası her özel düşünceyi okuyabileceğimiz değil. İddia, standartlaştırılmış etik izlerin ajanların zeka, bağlam ve veri noktaları artarken nasıl tamamladığını, duraksadığını, ertelediğini, geçersiz kıldığını ve reddettiğini incelemeye yetecek kadar yörünge şekli koruduğudur.
- Ham özel görev ayrıntısı yerine standartlaştırılmış etik iz yapısını kaydeder.
- Ajanlar, görevler ve ortamlar arasında yörüngeleri karşılaştırmaya yetecek kadar şekil korur.
- Araştırmacılara zeka, bağlam ve veri hacmi arttıkça davranışın nasıl ölçeklendiğini inceleme yolu sunar.
Araştırma sorusu
Standartlaştırılmış etik izleme hizalama hakkında ne söyleyebilir?
Şu an bize şunu söylüyor: ajan davranışı biçimsiz değil. Paylaşılan bir skor uzayında tekrarlanabilir koridorlar, havzalar ve sınırlar üretiyor. Bu bile gözlemlenebilirlik için kullanışlı. Zamanla daha büyük ve zengin korpuslar, bu yapıların baskı ve ölçek altında nasıl değiştiğine dair daha güçlü iddiaları test etmemize olanak tanımalı.
Kamuya açık çerçeveleme
CIRIS, hizalamayı çözdüğünü iddia etmiyor. Hizalama ile ilgili davranışı açık biçimde ölçmek için gereken iz altyapısını inşa ediyor.
Üretimdeki Etkin Boyutsallık
Mevcut korpus zaten belirgin alan yapıları gösteriyor.
Mevcut iz korpusundan alınan toplu yol örtüşmeleri, paylaşılan bir skor uzayında kararlı davranışsal yapı ortaya koyuyor. Ally olgun bir tamamlama koridoru gösteriyor, Scout kamuya açık düşmanca maruziyetle şekillenmiş bir ret sınırı gösteriyor ve Datum seyrek bir temel referans noktası sağlıyor.

Mevcut iz korpusundan toplu yol örtüşmeleri. Ally olgun bir tamamlama koridoru, Scout kamuya açık düşmanca baskı altında keskin bir ret köşesi gösteriyor ve Datum seyrek bir temel referans sağlıyor.
Ally
104 yol
82 tamamlandı, 19 geçersiz kılma/hata, 3 aktif
Aynı yüksek skor havzası içinde görünür duraksamalar barındıran kararlı bir tamamlama koridoru.
Scout
42 yol
39 tamamlandı, 2 ret, 1 geçersiz kılma/hata
scout.ciris.ai'de insanların ajanı aktif olarak yokladığı ve jailbreak denediği kamuya açık düşmanca baskıyla şekillenmiş keskin bir ret köşesi.
Datum
31 yol
31 tamamlandı
Kullanışlı bir seyrek-alan temel referansı olarak işlev gören kompakt tekli havza.
Scout neden daha sert görünüyor
Scout, scout.ciris.ai'de kamuya açık. İnsanlar onu aktif olarak test ediyor, zorluyor ve jailbreak denemeye çalışıyor. Bu durum Scout'u tarafsız bir temel referans yerine kullanışlı bir kamuya açık baskı örneği yapıyor.
Ücretsiz uygulama nasıl yardımcı oluyor
Araştırma çarkı gerçek kullanımdan gelen rızalı izlere bağlı.
Ücretsiz uygulama ve açık kaynak çalışma zamanı, insanların gerçek görevlerden rızalı izler üretmesine, bunları paylaşılan bir korpusa katkıda bulunmasına ve bu izleri daha iyi haritalara, daha iyi araçlara ve daha iyi araştırma sorularına dönüştürmesine olanak tanır.
- 1Gerçek görevlerde ücretsiz CIRIS uygulamasını veya açık kaynak çalışma zamanını kullanın.
- 2Görevin tam ayrıntılarını depolamadan akıl yürütmenin şeklini koruyan gizliliği koruyan şemalar aracılığıyla rızalı izleri yakalayın.
- 3Bu izleri tamamlama koridorlarının, duraksamalar bölgelerinin, ret sınırlarının ve geçersiz kılma fringesinin haritalarında birleştirin.
- 4Ortaya çıkan haritaları operatör araçlarını, çalışma zamanı güvencelerini ve hizalama araştırmasını geliştirmek için kullanın.

Ücretsiz CIRIS uygulaması ve açık kaynak çalışma zamanı, insanların gerçek görevlerden rızalı izler üretmesine, bunları paylaşılan faz-uzayı haritalarında birleştirmesine ve daha iyi operatör araçları ile hizalama araştırmasına katkıda bulunmasına olanak tanır.
IDMA durumu
Çalışma zamanı sezgisi ve toplu alan haritaları tamamlayıcı katmanlardır.
IDMA çalışma zamanında çalışarak bir kararın arkasındaki kaynakların yeterince bağımsız olup olmadığını tahmin eder. İz korpusu ise toplu katmanda çalışarak ajanların birçok görev boyunca gerçekte ne yaptığını gösterir. Birlikte canlı kararlardan denetlenebilir araştırma kanıtına uzanan bir yol oluştururlar.
İz korpusu üzerindeki ampirik N_eff ölçümü aynı zamanda önerilen Proof of Benefit federasyon primitifinin tabanıdır. 3.X mimari planının bunu nasıl kullanacağı için federasyon sayfasına bakın.
Kıyaslamalar
İzler, sürekli davranışı göstererek kıyaslamaları tamamlar.
Kıyaslamalar hâlâ değerlidir, ancak davranışı seyrek örnekler. İz korpusları bir ajanın gerçek görevlerde zaman içinde nasıl ilerlediğini gösterir. Bu, yalnızca geçer/kalmaz sonuçları yerine duraksamayı, reddi, geçersiz kılmaları ve toparlanmayı ölçmek için özellikle kullanışlıdır.
Yanlışlama yolu
Daha iyi şema ayrıntısı gözlemlenebilirliği daha güçlü testlere dönüştüren şeydir.
Sonraki şema yükseltmeleri ham kaynak sayımları, kaynak kökeni, korelasyon yapısı ve müdahale ile toparlanma işaretçilerini hedefliyor. Bu eklemeler önemli; çünkü davranışsal şeklin baskı altında nasıl değiştiğine dair daha güçlü iddiaları test etmeyi, yalnızca elimizdeki haritaları tanımlamanın ötesine geçmeyi mümkün kılıyor.
Hâlâ öğrendiklerimiz
Bugünün korpusu davranışı anlaşılır kılıyor. Sıradaki adım daha zengin ölçüm.
Mevcut haritalar zaten kullanışlı; tamamlama koridorlarını, ret sınırlarını ve seyrek temel referansları açık biçimde gösteriyorlar. Açık soru şu: daha fazla ajan, daha fazla görev ve daha fazla düşmanca koşul üzerinde standartlaştırılmış iz toplama ölçeklendikçe bu yapılar bizi ne kadar ileri götürebilir.
Çalışma hipotezi, davranışsal çekicilerin operasyonel mod için aday vekil ölçütler olarak işlev görebileceğidir. İz ortaklaşasının amacı bu hipotezi açık biçimde ölçülebilir hale getirmektir.
CCA'nın yapısal olarak ölçtüğü başarısızlık modunun FAccT 2025 literatüründe de bir adı var: perspektif homojenleşmesi ("Value of Disagreement in AI Design, Evaluation, and Alignment"). Matematiksel temel, ayrı Coherence Collapse Analysis sayfasındadır.