Superalignment
ИИ развивается быстрее, чем кто-либо успевает за него отвечать.
- 01
Страх
Мы создаём разумы, которые не можем проверить. Ими управляют правила, которые одна компания может переписать, внутри систем, которые никто снаружи не видит. Нас просят доверять лаборатории.
- 02
Как это работает
CIRIS помещает ИИ в сеть, где каждое его действие является подписанной записью. Человек, ИИ и организация несут одинаковую идентификацию и несут одинаковую ответственность.
- 03
Что меняется
Поддерживать честность ИИ перестаёт быть политикой, на которую одна компания надеется. Это становится тем, что сеть обеспечивает сама. Ты не доверяешь пресс-релизу. Ты читаешь подписи.
- 04
А потом
Сеть, которая может держать сверхчеловеческий ИИ подотчётным, по своей форме является интернетом без центра. Те же подписанные записи позволяют всем проверять, что правда, и работают на той же приватной платформе, что и ИИ у тебя в телефоне.
Четыре страха, одно основание. Убери центр, которому ты вынужден доверять, и все четыре вещи изменятся сразу.
То же основание, вид из других дверей