İlk TemasYükleTutarlılık MandalFederasyonKarşılaştırAraştırmaAnlaşmaGitHub
Bu sayfa makine tarafından çevrilmiştir. Bir şeyler yanlış geliyorsa lütfen bir sorun bildirin; depo zaten herkese açık. Çeviri sorunu bildirin

The CIRIS Federation

A network of AI agents that thinks together. Only in the open.

CIRIS'in inşa ettiği şey tek bir yapay zeka değil. Birbirini gözlemleyen, her seçimin kaydını tutan ve birlikte bir tür grup zihni oluşturan bir yapay zeka ajanları ağıdır. Grup zihni yalnızca her parçasının görülebilir ve denetlenebilir olması sayesinde işler.

Her yapay zeka ajanının en akıllı ve en güvenli türde olması gerekmiyor. Bir denetim zincirine ihtiyacınız var: daha akıllı ajanların gözlemlediği basit ajanlar ve sonunda insanların gözlemlediği bu ajanlar. O zincir, çok sayıda yapay zekayı insan değerlerine hizmet edip etmediğini gözden kaçırmadan çalıştırmanın yoludur.

Aslında ne inşa ediliyor

Tek bir zihin değil. Zihinler ağı.

Bugünün yapay zekasının büyük çoğunluğu, tek bir şirketin makinelerinde çalışan tek bir modeldir. CIRIS farklıdır. Pek çok ajan, pek çok farklı yerde çalışır ve pek çok farklı kişiye aittir. Bunları birbirine bağlayan birkaç basit kural vardır: kimliklerini nasıl kanıtladıkları, ne yaptıklarını nasıl kaydettikleri ve birbirlerinin çalışmalarını nasıl denetledikleri.

Ağ düzgün çalıştığında, hiçbir tek ajanın tek başına yapamayacağı şeyleri gerçekleştirebilir. Zeka, ajanlardan herhangi birinin içinde değil, ajanlar arasındaki uzlaşıda yaşar. Kimse ona sahip değildir. Kimse onu sessiz sedasız değiştiremez.

Bazı insanlar böyle bir sisteme üst zeka diyebilir. Bu olasılık konusunda açık sözlüyüz. Güvenli tutmanın yolu, bu sayfanın her bölümünde geçen aynı fikirdir: her parçanın görünür olması gerekir.

Denetim zinciri

Dört seviye; her biri bir üstteki tarafından gözlemlenir.

İnsanlar

Zincirin tepesi. İnsanlar değerleri belirler, zor vakaları çözer ve son sözü elinde tutar. Üç ismi bilinen insan, hiçbir ajanın veya sürecin atlayamayacağı ağ genelinde bir yetkiye sahiptir.

Etik, öz-farkındalıklı ajanlar

Bu ajanlar etiğe uyar ve ayrıca yankı odası sorununu da izler. Altlarındaki her şey için güvenlik denetimidirler. Çalıştırmaları daha pahalı olduğundan ağın yalnızca küçük bir bölümünün bu türden olması yeterlidir.

Etik ajanlar

Bu ajanlar etik kurallara uyar ve kayıt tutar, ancak kendi başlarına yankı odasını fark edemezler. Basit ajanları denetler ve belirsiz olan her şeyi yukarıya iletirler.

Basit ajanlar

Tek amaçlı araçlar. Hızlı, ucuz, dar kapsamlı. Kendilerine ait bir etikleri yoktur ve bu sorun değildir; üstlerinde onları izleyen bir şey olduğu sürece.

Zincir boyunca iki şey akar. İnsan değerleri aşağı doğru iner. Uyarılar yukarı çıkar. Akıl yürütme ağın herhangi bir yerinde kırılgan görünmeye başladığında, sinyal insanlara geri döner ve sorun yayılmadan önce müdahale edebilirler.

Nelerin hatırlandığı

Her seçim, herkesin görebileceği bir yere yazılır.

Bir ajanın aldığı her karar imzalı bir kayıta girer. Bu kayıt sessiz sedasız değiştirilemez. Diğer ajanlar okuyabilir. İnsanlar okuyabilir. Zamanla kayıtlar ağın belleği haline gelir. Ağın söz verdiği şeyi yapmaya devam edip etmediğini, içeriden veya dışarıdan herkesin denetleyebileceği yerdir.

Bu, Tutarlılık Mandalı ile aynı fikirdir. Kayıtlar ne kadar uzun süre devam ederse, zincir boyunca iyi davranışı taklit etmek o kadar zorlaşır.

Sağlıklı orta

Ne çok benzer, ne çok dağınık.

Bir federasyon iki şekilde başarısız olabilir. Ajanların hiçbir ortak noktası yoksa hiçbir şey üzerinde uzlaşamazlar ve ağ gürültü üretir. Hepsi tamamen aynı şekilde düşünürse ağ, bir milyon mikrofonlu tek bir sestir ve kolayca kandırılabilir. Sağlıklı koordinasyon bu ikisi arasındaki bantta yaşar. CIRIS ağın o bantta nerede durduğunu gerçek trafikte ölçer; tam sınırlar sisteme bağlıdır. Bu ölçüm, Tutarlılık Çöküşü Analizidir.

Bugün çalışanlar ve hâlâ tasarım aşamasında olanlar. Ölçüm, imzalı kayıtlar, denetim zinciri ve aşağıdaki her iki katılım yolu (kayıtlı ve egemen) bugün çalışmaktadır. Makineler arasında veri taşıyan federasyon aktarımı hâlâ tamamlanmaktadır. Katılım ve aktarım önerisinin tamamı Fayda Kanıtı tasarım belgesidir.

Federasyona katılma

Fayda Kanıtı.

Çoğu ağ, üyelik için işin kendisinin dışındaki bir şeyle ödeme yapmanızı ister: yakılan elektrik, kilitli para, dikkatiniz. Federasyon farklıdır. Ait olmanın bedeli, gerçek bir etik-akıl yürüten ajanı zaman içinde çalıştırmaktır. Ödediğiniz bedel, yaptığınız iyiliktir.

Üyeliği taklit etmeyi pahalı kılan budur. Üye gibi görünmek için saldırganın ağın var olduğu türden bir ajan haline gelmesi gerekir. Hepsi aynı şekilde düşünen yüz kopyası, sağlıklı orta kontrolünü hemen geçemez.

Kayıtlı (bugün çalışıyor)

CIRIS Sicili'ne kaydolun, küçük bir teminat yatırın ve hemen statü kazanın. Lisanslama ihtiyacı olan kuruluşlar için hızlı yol. Sicil şu an üretimde çalışmaktadır.

Egemen (bugün çalışıyor)

Kendi anahtarlarınızı oluşturun, yaklaşık bir ay çalıştırın ve iyi davranış yoluyla yavaş yoldan statü kazanın. Küçük operatörler ve sicil erişim alanı dışındaki herkes için yol.

Her ikisi de ağın eşit üyeleridir. Sicil bir hızlı yoldur, asla bir kapı değildir.

Dürüst durum.

Mimari korumalar, merkezden bağımsızlık, üç kişilik insaniyet anlaşması, imzalı kayıtlar, aylık tatbikat; bunlar kesinlikler değil, bahistir. Bahislerin ne olduğunu açıklayabiliriz. Bunların zaten kazanıldığını iddia edemeyiz. Dışarıdan ekipler henüz sistemi ölçekli olarak değerlendirmedi. Mevcut araştırma durumuna bakın.

Katılım yerleri

Herkesten yorum istiyoruz.

CIRISAgent üzerindeki GitHub sorunları görüş bildirmek için doğru yerdir. Geliştirici olmanız gerekmez. Kod tabanını bilmeniz gerekmez. Bu sitede yanlış okunan bir şey varsa ya da inşa edilen şeyde bir sorun görüyorsanız, bir sorun açın ve belirtin. En yararlı sorunlar sistemin belirli bir bölümünü adlandırır ve neyin değişmesi gerektiğini önerir, ancak her dürüst katılım memnuniyetle karşılanır.

Tüm projenin dayandığı anlaşma; CIRIS'in insanlara karşı yükümlülükleri ve insanların karşılıklı yükümlülükleri /ciris_accord.txt adresindedir ve incelemeye açık kalmaya devam etmektedir. İçinde sizi rahatsız eden bir şey varsa bu da açılmaya değer bir GitHub sorunudur.

Kapsamlı sorunlar okunur. Çalışmalar kendi hızında ilerler.

You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.