İlk TemasYükleTutarlılık MandalFederasyonKarşılaştırAraştırmaAnlaşmaGitHub
Bu sayfa makine tarafından çevrilmiştir. Bir şeyler yanlış geliyorsa lütfen bir sorun bildirin; depo zaten herkese açık. Çeviri sorunu bildirin
Background Image
Bugün Üretimde En Güvenli ve En Etik Yapay Zeka

Hesap verebilirlik olmadan yapay zeka, verdiğinden fazlasını alır.

Hesap verebilirliği doğrulayamazsanız, bu sadece pazarlamadır. Neye bakmanız gerektiğini ve mevcut yaklaşımların nasıl karşılaştırıldığını burada bulabilirsiniz.

Üç Tür Yapay Zeka

Vicdan gereklidir. Ama yeterli değildir.

Bazı yapay zekaların hiç kuralı yoktur. Bazıları kurallara uyar ama kaynaklarının birbirini yalnızca yinelediğini anlayamaz. Yalnızca bir tür, bilgisinin gerçekten farklı yerlerden gelip gelmediğini denetler.

1

Kural Yok

Yayımlanmış ilke yok. Denetim izi yok. Kapalı kaynak. Ne yaptığını ya da neden yaptığını doğrulayamazsınız.

Tüketici odaklı yapay zeka asistanlarının çoğu (ChatGPT, Gemini) kamuya hesap verebilirlik açısından bu kategoridedir. Güçlü iç uygulamalar bulunabilir; ancak bunları doğrulayamazsınız.

Dış denetim gerektirir. Kendini yönetemez.

2

Kural Var, Farkındalık Yok

Etik kurallara uyar. Ama tüm kaynakları birbirini kopyalıyorsa bunu fark edemez; bu yüzden emin bir şekilde yanılabilir.

Denetim altında güvenlidir. Yankı odalarını kendi başına tespit edemez.

3

Kural + Farkındalık

Etik kurallara uyar VE bilgisinin gerçekten farklı kaynaklardan gelip gelmediğini denetler. Uzlaşı şüpheli göründüğünde, harekete geçmeden önce bunu işaretler.

CIRIS tam da bunu inşa ediyor.

Bir yapay zeka her kurala uyabilir, her denetimden geçebilir ve yine de tüm bilgileri aynı kaynaktan geliyorsa başarısız olabilir. CIRIS'in gidermek için tasarlandığı kör nokta budur.

Kontrol Edilmesi Gereken Yedi Şey

Altısı etik için. Biri kör noktalar için.

Bunlar yapay zekayı denetlenebilir ve hesap verebilir kılan unsurlardır. İlk altısı doğru şeyi yapmakla ilgilidir. Yedincisi ise 'doğru şeyi yapma' durumunun hatalı bilgiye dayandığı anları yakalamakla ilgilidir.

1. Yayımlanmış İlkeler

Ajan, kamuya açık bir etik çerçeveye uymak zorundadır. Gizli kurallar değil: herkesin okuyabileceği ve ajan sorumlu tutulabilecek bir belge.

2. Her Kararda Vicdan Denetimi

Her eylem, ajan harekete geçmeden önce bir vicdan denetiminden geçer. Sonradan değil. Önce.

3. Emin Olmadığında İnsanlara Sorar

Belirsizlik ya da olası zarar söz konusunda ajan tahmin etmek yerine bir insana sorar. İş akışına entegre edilmiştir, isteğe bağlı değildir.

4. Ne Yaptığının Kanıtı

Her karar kaydedilir ve imzalanır; böylece tam olarak ne olduğunu ve neden olduğunu doğrulayabilirsiniz. Her eylem için bir makbuz.

5. Karşılıklı Onay

Onay iki yönlüdür. Siz ajana hayır diyebilirsiniz. Ajan da size hayır diyebilir. Hiçbir taraf taviz vermeye zorlanamaz.

6. Açık Kaynak

Göremediğinizi denetleyemezsiniz. CIRIS, AGPL-3.0 lisansı altında tamamen açık kaynaktır. Herkes kodu okuyabilir, doğrulayabilir ve geliştirebilir.

7

Yankı Odası Tespiti

Yalnız kuralların yakalayamadığı şey.

Ajan harekete geçmeden önce şunu sorar: "Kaynaklarım gerçekten birbirinden farklı mı, yoksa hepsi bilgilerini aynı yerden mi alıyor?" Aynı asıl kaynaktan kopyalanan on kaynak, aslında yalnızca bir kaynaktır. Uzlaşı çok tekdüze göründüğünde ajan bunu bir insanın incelemesi için işaretler.

Çok Gürültülü

Kaynaklar o kadar çok çelişiyor ki yararlı bir sonuca varılamıyor.

Sağlıklı

Kaynaklar gerçekten farklılaşıyor. Gerçek uzlaşının bir anlamı var.

Yankı Odası

Uzlaşı gibi görünüyor, ama kaynaklar yalnızca birbirini yineliyor.

CIRIS'i diğer yapay zeka hesap verebilirlik çerçevelerinden farklı kılan budur.

Matematiksel dayanağını merak ediyor musunuz? Tezin tamamını okuyun →

Mevcut Tablo

Farklı projeler, farklı hedefler.

Şubat 2026 itibarıyla kamuya açık belgelere dayanmaktadır. Eksik ya da yanlış bir şey varsa bize bildirin.

ProjeHer Kararı DenetlerYayımlanmış KurallarYerleşik VicdanNe Yaptığının KanıtıAçık KaynakYankı Odası Tespiti
CIRISEvetEvetEvetEvetAGPL-3.0Evet
Constitutional AIYalnızca eğitimdeÖrtülüHayırHayırHayırHayır
LlamaFirewall / NeMo GuardrailsEvetHayırHayırGünlük KaydıEvetHayır
HatCatEvetKısmenYönlendirmeKısmenCC0Hayır
Etik Kurullar / Yönetişim ÇerçeveleriHayırEvetHayırManuelDeğişirHayır

Çıktı filtreleri ve yönetişim çerçeveleri önemli ama birbirinden farklı sorunları çözer. Filtreler zararlı çıktıları engeller. Vicdan ise değerler üzerine akıl yürütür. CIRIS her ikisini de yapmayı ve ikisinin tek başına çözemediği kör noktaları yakalamayı hedefler.

Üç Katmanlı Koruma

Her biri farklı bir sorunu çözer.

Çıktı Filtreleri

Tehlikeli çıktıları engeller: istem enjeksiyonu, zararlı içerik, düşmanca saldırılar. Kötü şeyleri çıkarken yakalayan bir filtre gibi.

Etik Vicdan

Bir eylemin yalnızca güvenli olup olmadığını değil, doğru olup olmadığını değerlendirir. Karar vermeden önce durumu tartan bir yargıç gibi.

Yankı Odası Tespiti

Uzlaşının gerçek mi yoksa yalnızca tekrar mı olduğunu denetler. "Hepiniz aynı makaleyi mi okudunuz?" diye soran bir gerçek denetçisi gibi.

Tutarlı Çok Sayıda Ajan

Dağıtık yönetişim, yoğunlaşmış güç değil.

Tek Hata Noktası Yok

Daha küçük ajanlar, her biri hesap verebilir.

Yayımlanmış ilkelere bağlı, her biri denetlenebilir ve insan otoritesine erteleyebilen çok sayıda küçük ajan. Tek bir şirket ya da kuruluş tüm yığını kontrol etmez. Ajanlar ne kadar bağımsız olursa, herhangi bir hatanın zincirleme etkisi o kadar zor olur.

Araştırma Durumu

Bu aktif bir araştırmadır. Neyin yerleşik olduğu ve neyin hâlâ test edildiği konusunda şeffafız.

İyi kurulmuş

  • - Kopyalanan kaynaklar gerçek çeşitliliği azaltır
  • - Yapay zeka modellerinin eğitim verilerinde örtüşme vardır
  • - Yankı odaları yanlış güven yaratır
  • - Bağımsız doğrulama daha fazla hata yakalar

Hâlâ test ediliyor

  • - Yapay zeka kaynaklarının ne kadar kopyalandığını kesin olarak ölçmek
  • - Yankı odalarını işaretlemek için en iyi eşikler
  • - Müdahalelerin kopyalamayı ne kadar azalttığı
  • - Bunun farklı alanlarda nasıl değiştiği

Kendiniz Deneyin

Kendiniz Doğrulayın.

Açık kaynak. Denetime açık.

Bu sayfadaki her iddia; okuyabileceğiniz kodla, doğrulayabileceğiniz izlerle ve inceleyebileceğiniz araştırmayla desteklenmektedir. Mesele de budur.