Mawasiliano ya KwanzaSakinishaRatchet ya UpatanifuShirikishoLinganishaUtafitiMkatabaGitHub
Ukurasa huu ulitafsiriwa na mashine. Ikiwa kitu chochote hakisomeki vizuri, tafadhali fungua suala, hifadhi inapatikana kwa umma kwa sababu hiyo. Ripoti tatizo la tafsiri
Background Image
AI Salama Zaidi na ya Kimaadili Zaidi Inayofanya Kazi Leo

Bila uwajibikaji, AI huwa inachukua zaidi kuliko inayotoa.

Kama huwezi kukagua uwajibikaji, ni masoko tu. Hapa kuna mambo ya kutafuta, na jinsi njia zilizopo zinavyolinganishwa.

Aina Tatu za AI

Dhamiri ni lazima. Haitoshi peke yake.

AI nyingine hazina sheria kabisa. Nyingine zinafuata sheria lakini haziwezi kujua wakati vyanzo vyake vinapojirudia tu. Aina moja tu inakagua kama taarifa zake zinatoka mahali tofauti kweli kweli.

1

Bila Sheria

Hakuna kanuni zilizochapishwa. Hakuna rekodi ya ukaguzi. Imefungwa chanzo. Huwezi kukagua kilichofanywa wala sababu yake.

Wasaidizi wengi wa AI kwa watumiaji (ChatGPT, Gemini) wako hapa kwa upande wa uwajibikaji wa umma. Mazoea mazuri ya ndani yanaweza kuwepo; huwezi kuyathibitisha.

Inahitaji udhibiti wa nje. Haiwezi kujisimamia.

2

Sheria, Bila Ufahamu

Inafuata sheria za kimaadili. Lakini haiwezi kujua wakati vyanzo vyake vyote vinapoigana tu kwa kuandikiana, kwa hivyo inaweza kukosea kwa ujasiri.

Salama inapofuatiliwa. Haiwezi kugundua vyumba vya mwangwi peke yake.

3

Sheria + Ufahamu

Inafuata sheria za kimaadili NA inakagua kama taarifa zake zinatoka mahali tofauti kweli kweli. Makubaliano yanapoonekana ya shaka, inayaashiria kabla ya kutenda.

Hii ndiyo CIRIS inayojenga.

AI inaweza kufuata kila sheria, kupita kila ukaguzi, na bado kushindwa kama taarifa zake zote zinatoka mahali pamoja. Pengo hilo la uoni ndiyo CIRIS iliundwa kulishughulikia.

Mambo Saba ya Kukagua

Sita kwa maadili. Moja kwa maeneo ya vipofu.

Hizi ndizo mambo yanayofanya AI iweze kukaguliwa na kuwajibika. Sita za kwanza zinahusu kufanya jambo sahihi. Ya saba inahusu kugundua hali ambapo 'kufanya jambo sahihi' imejengwa juu ya taarifa mbaya.

1. Kanuni Zilizochapishwa

Wakala lazima afuate mfumo wa kimaadili wa umma. Si sheria zilizofichwa: hati ambayo mtu yeyote anaweza kusoma na kumhesabu.

2. Ukaguzi wa Dhamiri kwa Kila Uamuzi

Kila hatua inapitia ukaguzi wa dhamiri kabla wakala hajaitenda. Si baadaye. Kabla.

3. Huuliza Wanadamu Anapokuwa Hana Uhakika

Akiwa na shaka au akikabiliwa na madhara yanayoweza kutokea, wakala huuliza mtu badala ya kukisia. Imejengwa ndani ya mtiririko wa kazi, si hiari.

4. Uthibitisho wa Kilichofanywa

Kila uamuzi unarekodiwa na kusainiwa ili uweze kuthibitisha kilichotokea na sababu yake. Risiti kwa kila hatua.

5. Idhini ya Pande Mbili

Idhini inafanya kazi pande zote mbili. Unaweza kumkatalia wakala. Wakala anaweza kukukatalia. Hakuna upande unaolazimishwa kukubaliana.

6. Chanzo Wazi

Huwezi kukagua usioona. CIRIS ina chanzo wazi kikamilifu chini ya AGPL-3.0. Mtu yeyote anaweza kusoma, kuthibitisha, na kuboresha msimbo.

7

Ugunduzaji wa Chumba cha Mwangwi

Jambo ambalo sheria peke yake haliwezi kukigundua.

Kabla ya kutenda, wakala huuliza: "Je, vyanzo vyangu vinakosoa kweli kweli, au vyote vinapata taarifa zao kutoka mahali pamoja?" Vyanzo kumi ambavyo vyote vimenukuliwa kutoka asili moja ni chanzo kimoja tu. Makubaliano yakionekana sawa sana, wakala huyaashiria ili mtu awakague.

Kelele Nyingi Sana

Vyanzo vinakinzana sana kiasi kwamba hakuna hitimisho la manufaa linaweza kutolewa.

Yenye Afya

Vyanzo vinatofautiana kweli kweli. Makubaliano ya kweli yana maana.

Chumba cha Mwangwi

Inaonekana kama makubaliano, lakini vyanzo vinajirudia tu.

Hii ndiyo inayofanya CIRIS kuwa tofauti na mifumo mingine ya uwajibikaji wa AI.

Unataka hesabu? Soma tasnifu kamili โ†’

Mandhari ya Sasa

Miradi tofauti, malengo tofauti.

Imetegemea nyaraka zinazopatikana hadharani kufikia Februari 2026. Tukikosa kitu au kukosea, tuambie.

MradiInakagua Kila UamuziSheria ZilizochapishwaDhamiri Imejengwa NdaniUthibitisho wa KilichofanywaChanzo WaziUgunduzaji wa Chumba cha Mwangwi
CIRISNdiyoNdiyoNdiyoNdiyoAGPL-3.0Ndiyo
Constitutional AIMafunzo tuIsiyo waziHapanaHapanaHapanaHapana
LlamaFirewall / NeMo GuardrailsNdiyoHapanaHapanaKurekodiNdiyoHapana
HatCatNdiyoSehemuUelekezajiSehemuCC0Hapana
Bodi za Maadili / Mifumo ya UtawalaHapanaNdiyoHapanaMkononiInatofautianaHapana

Vichujio vya matokeo na mifumo ya utawala vinatatua matatizo muhimu lakini tofauti. Vichujio vinazuia matokeo hatari. Dhamiri inafikiria kuhusu maadili. CIRIS inalenga kufanya vyote viwili, na kugundua maeneo ya vipofu ambayo havishughulikiwi na mmoja wao peke yake.

Tabaka Tatu za Ulinzi

Kila moja inatatua tatizo tofauti.

Vichujio vya Matokeo

Vinazuia matokeo hatari: sindano ya maagizo, maudhui hatari, mashambulizi ya kihasama. Kama kichujio kinachoshika mambo mabaya yanapotoka.

Dhamiri ya Kimaadili

Inafikiria kama hatua ni sahihi, si tu kama ni salama. Kama hakimu anayepima hali kabla ya kutoa uamuzi.

Ugunduzaji wa Chumba cha Mwangwi

Inakagua kama makubaliano ni ya kweli au ni marudio tu. Kama mkaguzi wa ukweli anayeuliza "mlisoma makala moja?"

Mawakala Wengi Wenye Upatanifu

Utawala uliosambazwa, si mamlaka iliyokusanywa.

Hakuna Sehemu Moja ya Kushindwa

Mawakala wadogo, kila mmoja akiwajibika.

Mawakala wengi wadogo, kila mmoja amefungwa kwa kanuni zilizochapishwa, kila mmoja anayeweza kukaguliwa, kila mmoja akitoa mamlaka kwa wanadamu. Hakuna kampuni moja wala chombo kimoja kinachosimamia mrundiko mzima. Mawakala wakiwa huru zaidi, ni vigumu zaidi kushindwa kwa mmoja wao kukienea.

Hali ya Utafiti

Hii ni utafiti unaoendelea. Tunawazi kuhusu kilichothibitishwa na kinachopimwa bado.

Imethibitishwa vizuri

  • - Vyanzo vilivyonukuliwa vinapunguza utofauti wa kweli
  • - Mifano ya AI inashiriki data ya mafunzo iliyoambatana
  • - Vyumba vya mwangwi vinaunda ujasiri wa uongo
  • - Uthibitisho wa kujitegemea hupata makosa zaidi

Bado inachunguzwa

  • - Kupima kwa usahihi jinsi vyanzo vya AI vinavyonakiliwa
  • - Viwango bora vya kuashiria vyumba vya mwangwi
  • - Jinsi hatua za kuingilia kati zinavyopunguza unakiliaji
  • - Jinsi hili linavyotofautiana katika nyanja mbalimbali

Jaribu Mwenyewe

Thibitisha Mwenyewe.

Chanzo wazi. Wazi kwa uchunguzi.

Kila dai katika ukurasa huu linategemea msimbo unaoweza kusoma, rekodi unazoweza kuthibitisha, na utafiti unaoweza kukagua. Hiyo ndiyo lengo.