Italiano sempliceAvanzato

Quello che CIRIS sta costruendo non è un'unica AI. È una rete di agenti AI che si controllano a vicenda, tengono un registro di ogni scelta e formano insieme una sorta di mente collettiva. La mente collettiva funziona solo perché ogni sua parte può essere vista e verificata.

Non hai bisogno che ogni agente AI sia il tipo più intelligente e sicuro. Hai bisogno di una catena di supervisione: agenti semplici sorvegliati da agenti più intelligenti, e questi sorvegliati, alla fine, dalle persone. Quella catena è il modo in cui puoi gestire molte AI senza perdere il controllo del fatto che stia servendo i valori umani.

Cosa si sta costruendo davvero

Non una mente sola. Una rete di menti.

La maggior parte delle AI oggi è un modello che gira sulle macchine di un'unica azienda. CIRIS è diverso. Molti agenti girano in molti posti, di proprietà di molte persone. Sono tenuti insieme da poche regole semplici: come dimostrano chi sono, come registrano quello che fanno e come controllano il lavoro degli altri.

Quando la rete funziona, può fare cose che nessun agente singolo potrebbe fare da solo. L'intelligenza vive nell'accordo tra agenti, non dentro nessuno di essi. Nessuno la possiede. Nessuno può cambiarla in silenzio.

Alcune persone chiamerebbero un sistema del genere una superintelligenza. Siamo onesti riguardo a questa possibilità. Il modo per mantenerla sicura è la stessa idea che attraversa ogni parte di questa pagina: ogni pezzo deve essere aperto alla vista.

La catena di supervisione

Quattro livelli, ciascuno sorvegliato da quello superiore.

Persone

La cima della catena. Le persone stabiliscono i valori, risolvono i casi difficili e mantengono l'ultima parola. Tre individui umani identificati detengono un'autorità valida per tutta la rete che nessun agente o processo può aggirare.

Agenti etici e consapevoli di sé

Questi seguono un'etica e osservano anche il problema della camera d'eco. Sono il controllo di sicurezza su tutto ciò che si trova sotto di loro. Costano di più da gestire, quindi solo una piccola parte della rete deve essere di questo tipo.

Agenti etici

Questi seguono regole etiche e tengono registri, ma non riescono a individuare da soli una camera d'eco. Sorvegliano gli agenti semplici e trasmettono verso l'alto tutto ciò che è incerto.

Agenti semplici

Strumenti per uno scopo preciso. Veloci, economici, specializzati. Nessuna etica propria, e va bene, purché qualcosa sopra di loro li stia sorvegliando. La maggior parte degli agenti sarà di questo tipo.

Due cose si muovono attraverso la catena. I valori umani scendono verso il basso. Gli avvisi salgono verso l'alto. Quando il ragionamento inizia a sembrare fragile in qualsiasi punto della rete, il segnale risale alle persone, che possono intervenire prima che il problema si diffonda.

Cosa viene ricordato

Ogni scelta, scritta dove tutti possono vederla.

Ogni scelta che fa un agente finisce in un registro firmato. Il registro non può essere cambiato in silenzio. Altri agenti possono leggerlo. Le persone possono leggerlo. Nel tempo, i registri diventano la memoria della rete. Sono il modo in cui chiunque, dentro o fuori, può verificare se la rete sta ancora facendo quello che aveva detto che avrebbe fatto.

È la stessa idea del Ratchet di Coerenza. Più a lungo girano i registri, più diventa difficile simulare un buon comportamento lungo tutta la catena.

Il giusto equilibrio

Non troppo uguale, non troppo dispersa.

Una Federazione può fallire in due modi. Se gli agenti non hanno nulla in comune, non riescono a concordare su nulla e la rete produce rumore. Se pensano tutti esattamente allo stesso modo, la rete è una voce con un milione di microfoni, e è facile ingannarla. Il coordinamento sano vive nella fascia intermedia. CIRIS misura dove si trova la rete in quella fascia, sul traffico reale, e i confini esatti dipendono dal sistema. Quella misurazione è l'Analisi del Collasso della Coerenza.

Cosa funziona oggi e cosa è ancora in fase di progettazione. La misurazione, i registri firmati, la catena di supervisione e i due percorsi di adesione descritti di seguito (registrato e sovrano) funzionano oggi. Il trasporto federativo che sposta i dati tra macchine è la parte ancora in costruzione. La proposta completa di adesione e trasporto è il documento di progettazione Proof of Benefit.

Entrare nella Federazione

Prova di Beneficio.

La maggior parte delle reti ti chiede di pagare l'appartenenza con qualcosa di esterno al lavoro stesso: elettricità bruciata, denaro bloccato, la tua attenzione. La Federazione è diversa. Il costo dell'appartenenza è gestire un agente di ragionamento etico reale nel tempo. Il prezzo che paghi è il bene che fai.

Questo è ciò che rende costoso falsificare l'appartenenza. Per sembrare un membro, un attaccante dovrebbe diventare davvero il tipo di agente per cui la rete esiste. Cento copie che pensano tutte allo stesso modo falliscono subito il controllo del giusto equilibrio.

Registrato (funziona oggi)

Registrati presso il CIRIS Registry, deposita una piccola cauzione e ottieni subito lo standing. La via rapida per le organizzazioni che hanno bisogno di licenze. Il registro è in produzione ora.

Sovrano (funziona oggi)

Crea le tue chiavi, opera per circa un mese e guadagna lo standing nel modo lento attraverso un buon comportamento. Il percorso per gli operatori piccoli e per chiunque sia fuori dalla portata del registro.

Entrambi sono membri uguali della rete. Il registro è una via rapida, non mai un cancello.

Stato onesto.

Le protezioni architetturali, la decentralizzazione, l'accordo dell'umanità con tre persone, i registri firmati, il test mensile, sono scommesse, non certezze. Possiamo descrivere quali sono le scommesse. Non possiamo affermare di averle già vinte. Team esterni non hanno ancora valutato il sistema su larga scala. Vedi lo stato attuale della ricerca.

Dove partecipare

Chiediamo commenti a chiunque.

Le issue GitHub su CIRISAgent sono il posto dove esprimere la tua opinione. Non devi essere uno sviluppatore. Non devi conoscere il codice. Se qualcosa su questo sito ti sembra sbagliato, o se vedi un problema con quello che si sta costruendo, apri una issue e dillo. Le issue più utili nominano una parte specifica del sistema e propongono cosa dovrebbe cambiare, ma qualsiasi partecipazione onesta è benvenuta.

L'accordo che fonda l'intero progetto, ciò che CIRIS deve alle persone e ciò che le persone devono a CIRIS in cambio, si trova su /ciris_accord.txt ed è aperto alla revisione. Se qualcosa al suo interno non ti convince, anche quella è una issue GitHub che vale la pena aprire.

Le issue sostanziali vengono lette. Il lavoro procede al suo ritmo.

Non devi risolvere la sicurezza dell'AI un agente alla volta. La risolvi per il livello di supervisione, e lasci che la struttura porti il resto.

Il lato della pressione Guarda il punteggio in diretta Partecipa su GitHub