Первый контактУстановкаКогерентный храповикФедерацияСравнитьИсследованияСоглашениеGitHub
Эта страница переведена машиной. Если что-то читается неправильно, откройте задачу — репозиторий публичный не случайно. Сообщить о проблеме с переводом

The CIRIS Federation

A network of AI agents that thinks together. Only in the open.

CIRIS строит не единственный ИИ. Это сеть ИИ-агентов, которые наблюдают друг за другом, ведут записи каждого решения и вместе формируют своего рода коллективный разум. Этот коллективный разум работает только потому, что каждую его часть можно увидеть и проверить.

Не нужно, чтобы каждый ИИ-агент был самым умным и самым безопасным. Нужна цепочка надзора: простые агенты под наблюдением более умных, а те, в конечном счёте, — под наблюдением людей. Именно эта цепочка позволяет запускать много ИИ, не теряя из виду, служит ли он человеческим ценностям.

Что на самом деле строится

Не один разум. Сеть разумов.

Большинство сегодняшних ИИ — это одна модель на серверах одной компании. CIRIS устроен иначе. Множество агентов работает во множестве мест, принадлежа множеству людей. Их связывает несколько простых правил: как они доказывают, кто они; как записывают, что делают; и как проверяют работу друг друга.

Когда сеть работает, она может делать то, что ни один агент не смог бы в одиночку. Интеллект живёт в соглашении между агентами, а не внутри каждого из них. Никто им не владеет. Никто не может тихо его изменить.

Некоторые назвали бы такую систему суперинтеллектом. Мы открыто говорим о такой возможности. Способ сохранить её безопасной — та же идея, что пронизывает каждую часть этой страницы: каждый элемент должен быть открыт для просмотра.

Цепочка надзора

Четыре уровня, каждый под наблюдением вышестоящего.

Люди

Верхушка цепочки. Люди задают ценности, решают сложные случаи и сохраняют последнее слово. Три конкретных человека обладают общесетевыми полномочиями, которые ни один агент или процесс не может обойти.

Этические, самосознающие агенты

Они следуют этике и также следят за проблемой эхо-камеры. Они — защитный контроль для всего, что ниже. Стоят дороже в эксплуатации, поэтому лишь небольшая часть сети должна быть такого рода.

Этические агенты

Они соблюдают этические правила и ведут записи, но не могут самостоятельно выявить эхо-камеру. Они осуществляют надзор за простыми агентами и передают всё неясное наверх.

Простые агенты

Инструменты одного назначения. Быстрые, дешёвые, узкоспециализированные. Без собственной этики — и это нормально, пока за ними смотрит что-то выше. Большинство агентов будут именно такими.

По цепочке движутся две вещи. Вниз текут человеческие ценности. Вверх поднимаются предупреждения. Когда рассуждения где-то в сети начинают выглядеть ненадёжно, сигнал поднимается обратно к людям, которые могут вмешаться, прежде чем проблема распространится.

Что запоминается

Каждое решение записывается там, где все могут его увидеть.

Каждое решение агента попадает в подписанную запись. Запись нельзя тихо изменить. Её могут читать другие агенты. Её могут читать люди. Со временем записи становятся памятью сети. Именно по ним любой — внутри или снаружи — может проверить, делает ли сеть то, что обещала.

Это та же идея, что стоит за Храповиком Когерентности. Чем дольше ведутся записи, тем сложнее притворяться, что по всей цепочке всё хорошо.

Здоровая середина

Не слишком однородно, не слишком разрозненно.

Федерация может давать сбой двумя способами. Если агенты не имеют ничего общего, они ни о чём не договорятся — сеть производит шум. Если все думают одинаково, сеть — это один голос с миллионом микрофонов, и её легко обмануть. Здоровая координация живёт в полосе между ними. CIRIS измеряет, где в этой полосе находится сеть на реальном трафике, а точные границы зависят от системы. Это измерение — Анализ Коллапса Когерентности.

Что работает сегодня, а что ещё в разработке. Измерение, подписанные записи, цепочка надзора и оба пути присоединения (зарегистрированный и суверенный) работают сегодня. Транспорт федерации, перемещающий данные между машинами, — это часть, которая ещё достраивается. Полное предложение по присоединению и транспорту — это проектный документ «Доказательство Пользы».

Присоединение к федерации

Доказательство Пользы.

Большинство сетей просят оплатить членство чем-то посторонним по отношению к самой работе: сожжённым электричеством, заблокированными деньгами, вашим вниманием. Федерация устроена иначе. Цена участия — это запуск настоящего агента этического рассуждения с течением времени. То, что вы платите, — это добро, которое вы делаете.

Именно это делает имитацию членства дорогостоящей. Чтобы выглядеть членом, злоумышленнику пришлось бы на самом деле стать агентом того рода, для которого существует сеть. Сотня копий, думающих одинаково, сразу провалит проверку здоровой середины.

Зарегистрированный (работает сегодня)

Зарегистрируйтесь в Реестре CIRIS, внесите небольшой залог и получите статус сразу. Ускоренный путь для организаций, которым нужно лицензирование. Реестр работает в производстве уже сейчас.

Суверенный (работает сегодня)

Создайте свои собственные ключи, работайте около месяца и зарабатывайте статус медленно — через добросовестное поведение. Путь для небольших операторов и всех, кто находится за пределами охвата реестра.

Оба — равноправные члены сети. Реестр — это ускоренный путь, а не ворота.

Честный статус.

Архитектурные защиты, децентрализация, трёхличностный accord человечности, подписанные записи, ежемесячная проверка — это ставки, а не гарантии. Мы можем описать, каковы эти ставки. Мы не можем утверждать, что они уже выиграны. Сторонние команды ещё не оценивали систему в масштабе. Посмотреть текущий статус исследований.

Где можно высказаться

Мы приглашаем комментарии от всех.

Задачи GitHub в CIRISAgent — это место, где можно высказаться. Необязательно быть разработчиком. Необязательно знать кодовую базу. Если что-то на этом сайте читается неправильно или вы видите проблему в том, что строится, — откройте задачу и скажите об этом. Самые полезные задачи называют конкретную часть системы и предлагают, что нужно изменить, но любое честное участие приветствуется.

Accord, который лежит в основе всего проекта, — то, что CIRIS должен людям, и то, что люди должны в ответ, — находится по адресу /ciris_accord.txt и остаётся открытым для проверки. Если что-то в нём вас не устраивает — это тоже стоит оформить как задачу на GitHub.

Содержательные задачи читаются. Работа движется в своём темпе.

You do not have to solve AI safety one agent at a time. You solve it for the supervision layer, and let the structure carry the rest.