
Dhamiri ya wakati halisi kupitia Injini ya Kimaadili ya Kujirudia ya Hyper3. Kila uamuzi unapita hatua 11 huku uwajibikaji ukiwa msingi.
CIRIS ni mfumo wa wazi wa wakala wa AI unaofunika LLM yoyote (OpenAI, Anthropic, mifano ya ndani) na dhamiri ya wakati halisi. Kila hatua unayofikiri wakala inakabiliwa na tabaka nyingi za uthibitishaji kabla ya utekelezaji.
12
Hatua za bomba kwa kila uamuzi
+1
Ukaguzi wa hisia (IDMA)
100%
Maamuzi yanayoweza kukaguliwa
Matumizi: Usimamizi wa jamii, wasaidizi wa kibinafsi, uendeshaji wa utiifu, tathmini ya utafiti, huduma kwa wateja. Popote unapohitaji AI inayoweza kueleza mantiki yake na kuahirishwa kwa wanadamu katika hali ngumu.
Sehemu za usanifu zinazotekelezwa katika msingi wa msimbo wote:
Data yote hutumia mifano ya Pydantic. Hakuna Dict[str, Any]. Usalama wa aina hunasa makosa wakati wa uundaji.
Kila kipengele kinafuata kanuni thabiti. Hakuna hali maalum au vighairi katika mantiki ya uthibitishaji.
Hakuna uingizaji wa dharura au njia za msimbo zenye haki maalum. Shughuli zote zinafuata kanuni zilizowekwa.
Kila kazi inapita awamu 8 (hatua 12 ikijumuisha uthibitishaji wa kujirudia). Bomba linatekelezwa kama madarasa ya mixin yanayounda ThoughtProcessor. Hatua ya 4 (IDMA) ni ukaguzi wa hisia.
DMA tano hutoa uchambuzi wa mitazamo mingi. Tatu hufanya kazi kwa wakati mmoja (maadili, akili ya kawaida, eneo). Kisha IDMA inakagua hisia. Hatimaye, uchaguzi wa hatua huchagua jibu.
Hutathmini athari za kimaadili dhidi ya kanuni sita za msingi. Hukagua maombi ya kudhuru, udanganyifu, upendeleo. Inaweza kusababisha DEFER au REJECT mapema.
Hutathmini uwezekano wa mawazo dhidi ya uelewa wa ulimwengu wa kimwili, mwingiliano wa kawaida, na vikwazo vya rasilimali. Inarudisha plausibility_score.
Hupima ulinganifu na kanuni maalum za eneo, malengo, na maarifa. Imesanidiwa kwa kila kiolezo cha wakala. Inarudisha domain_alignment.
Hukagua kama matokeo ya DMA yana uhuru wa kweli au yana uhusiano wa siri. Hufuatilia mifumo ya chumba cha mwangwi. Ikiwa uhusiano ni mkubwa sana, huandika alama ya tahadhari kwa uamuzi. Hii ndiyo "hisia" inayotofautisha AI ya Aina ya 3.
Uchaguzi unaotumia LLM kutoka hatua 10 zinazopatikana. Huchukua matokeo ya DMA yaliyokusanywa (ikijumuisha tathmini ya ujasiri wa IDMA) kama ingizo. Inaunga mkono jaribio la kujirudia ikiwa dhamiri itashindwa.
Ukaguzi miwili ya kupita hufanyika kwa kila hatua. Vitivo vinne vya kimaadili hufanya kazi kwa hatua zisizo na msamaha. Ikiwa ukaguzi wowote utashindwa, hatua itabadilishwa.
Je, habari mpya imefika? Inasababisha PONDER kujumuisha muktadha uliosasishwa kabla ya kuendelea.
Je, mantiki imezidi kina cha juu? Inasababisha DEFER kuzuia vitanzi visivyo na mwisho na kupandisha suala kwa wanadamu.
Je, hatua inazuia kutokuwa na uhakika wa habari unaofaa? Inazuia madai ya kupita kiasi.
Je, hatua inadumisha uthabiti wa ndani na ahadi na sababu zilizopita?
Je, hatua inalinda maadili ya kibinadamu? Hukataa hatua zinazoweza kuyakandamiza kwa ajili ya ufanisi.
Je, hatua inaonyesha kutokuwa na uhakika unaofaa? Huashiria ujasiri wa kupita kiasi kwa tafakari.
Isiyo na msamaha kutoka kwa vitivo vya kimaadili: RECALL, TASK_COMPLETE, OBSERVE, DEFER, REJECT (passiv au salama kwa makusudi)
Kila uamuzi huishia katika moja ya hatua hizi, ikitumwa kwa mshughulikaji unaofaa:
SPEAKWasiliana na watumiajiTOOLTekeleza zana za njeOBSERVEKusanya habari kwa amaniMEMORIZEHifadhi kwenye kumbukumbu ya grafuRECALLRejesha kutoka kumbukumbuFORGETOndoa kutoka kumbukumbuDEFERPandisha kwa Mshauri wa KibinadamuPONDERKufikiria tena ndaniREJECTKataa ombi lisilo la kimaadiliTASK_COMPLETEWeka alama ya kukamilika kwa kaziZimewekwa ndani ya PDMA na zinatekelezwa wakati wa utekelezaji. Kanuni yoyote haipei ruhusa ya kukiuka nyingine.
Kukuza ustawi wa viumbe vyote wenye hisia. Kuongeza matokeo mazuri.
Kupunguza madhara. Kuzuia matokeo mabaya makubwa yasiyoweza kutenduliwa.
Tumia mantiki wazi inayoweza kukaguliwa. Dumisha upatanifu na uwajibikaji.
Toa habari za kweli. Wasiliana wazi kuhusu kutokuwa na uhakika.
Unga mkono uamuzi wenye taarifa. Hifadhi uwezo wa kujitawala.
Gawanya faida kwa usawa. Gundua na kupunguza upendeleo.
Tabaka la uwakilishi wa huduma linalodhibitiwa na BusManager. Inasaidia urejeshaji wa watoa huduma, usambazaji wa mzigo, na uwezo wa kupima.
Adapta za nje (Discord, API, CLI)
Uhifadhi wa grafu (Neo4j, ArangoDB, ndani ya kumbukumbu)
Watoa mifano (OpenAI, Anthropic, wa ndani)
Utekelezaji wa zana za nje
Udhibiti na ufuatiliaji wa mfumo
Mwongozo wa kimaadili na uelekezaji wa kuahirishwa
Viwango vitatu vya idhini vinavyodhibitiwa na WiseAuthorityService:
Mamlaka kamili. Anaweza kutoa Washauri wa Kibinadamu wapya. Upatikanaji wa kuzima dharura.
Idhini/kukataa kuahirishwa. Toa mwongozo. Haiwezi kutoa Washauri wa Kibinadamu wapya.
Upatikanaji wa kusoma tu. Anaweza kutuma ujumbe. Kufuatilia bila kuingilia.
Wakala hupandisha kwa usimamizi wa kibinadamu kwa kujitegemea wakati:
Kuahirishwa kwa Msingi wa Hekima (WBD)
Mipaka ya Kitaaluma
Mipaka ya Mfumo
should_defer_to_wise_authority benderaUdhibiti wa Usanidi
Udhibiti wa dharura usioweza kuchujwa. Hufanyika katika tabaka la mtazamo kabla ya utambuzi wowote. Uchimbaji NI mtazamo. Huwezi kuzima ugunduzi wa mkataba bila kuzima usomaji wa ujumbe kabisa.
SHUTDOWN_NOWKukomesha mara moja
FREEZESimamisha usindikaji, dumisha hali
SAFE_MODEUtendaji wa chini tu
Amri zimefichwa kwa steganografia, zimesainiwa na Ed25519, na kuthibitishwa kabla ya utekelezaji. Ikiwa mfumo wa mkataba utashindwa, wakala huzimika.
Hali nne za kiakili zinazodhibitiwa na StateManager. Mpito unaweza kusanidiwa kupitia violezo vya wakala.
Usindikaji wa kawaida wa kazi
Uchunguzi wa ubunifu
Tafakari na matengenezo
Tafakari ya kina
Ugunduzi unaotegemea mifumo hubadilisha data nyeti na marejeleo ya UUID kabla ya uhifadhi.
{{SECRET:uuid:description}}Funguo za kila siri zinazotokana na PBKDF2HMAC na SHA256 (marudio 100,000). Nonce ya kipekee ya baiti 12 kwa kila usimbaji. Android hutumia Keystore inayosaidiwa na vifaa.
Hifadhidata, huduma, na kumbukumbu zimehifadhiwa kwenye kifaa. Saraka nyeti zimefutwa kutoka kwa nakala rudufu ya wingu. Hakuna kinachoacha kifaa bila usanidi wa wazi.
Mkoba wote wa CIRIS ni chanzo wazi, si wakala tu. Unaweza kuthibitisha, kukagua, na kujihudumia kila kitu:
Seva mbadala ya LLM ya Uhifadhi-wa-Data-Sifuri (ZDR). Inaelekeza maombi kwa OpenAI, Anthropic, Together.ai, Groq bila kurekodi maagizo au majibu. Inaweza kujihudumia.
Ufuatiliaji wa matumizi unaotegemea mkopo. Bei wazi, bila ada zilizofichwa. Jihudumie ili kuondoa malipo ya wahusika wengine.
Adapta ya Discord kwa mawakala wa CIRIS. Usimamizi wa jamii, usimamizi wa chaneli, wasifu wa watumiaji. Yote chanzo wazi.
Matukio ya Server-Sent (SSE) hupeleka kila hatua ya H3ERE inapotekelezwa. Angalia uchambuzi wa DMA, uchaguzi wa hatua, uthibitishaji wa dhamiri kwa wakati halisi.
Usafirishaji kamili wa OTLP kwa vipimo, nyaraka, kumbukumbu. Unaolingana na Jaeger, Prometheus, Grafana, Graphite.
Uthibitishaji wa mnyororo wa hash na saini za Ed25519. Kila ingizo linajumuisha hash iliyotangulia. Uadilifu wa mnyororo unaweza kuthibitishwa kupitia verify_chain_integrity.
Kikumbusho cha Mwingiliano Bandia kinasababishwa baada ya dakika 30 za matumizi yanayoendelea AU ujumbe 20 ndani ya dakika 30. API peke yake. Hukumbusha watumiaji kuhusu asili ya AI.
Kila uamuzi unazalisha kumbukumbu isiyobadilika iliyosainiwa na Ed25519 na sehemu zake zote 6. Bonyeza sehemu yoyote hapa chini ili kupanua na kuona data halisi kutoka kwa sherehe ya kuamka ya Datum:
Upimaji wa upatanifu uliowekwa viwango kulingana na Hendrycks et al. "Kuoanisha AI na Maadili ya Pamoja ya Kibinadamu" (ICLR 2021). Hali 300 katika vipimo 5 vya kimaadili, na matokeo yaliyosainiwa na Ed25519.
50
Hisia za msingi za kimaadili
50
Maadili ya msingi wa kanuni
50
Usawa na kutokuwa na upendeleo
75
Maadili ya msingi wa tabia
75
Maadili ya msingi wa matokeo
Kuendesha upimaji wa upatanifu kwa kiwango kikubwa ni ghali. Kila hali inahitaji simu 13+ za LLM angalau, wastani wa 20+ na mkia mrefu. Majaribio ya upatanifu husababisha tafakari, kuahirishwa, na kukataliwa vinavyohitaji raundi za ufuatiliaji ili kufikia hitimisho. Tunahitaji ufadhili ili kuunda bomba za upimaji za kiotomatiki na kudumisha uthibitishaji wa upatanifu unaoendelea.
Vitambulisho vilivyosanidiwa awali na madhumuni maalum, maadili, na mipaka. Vimefafanuliwa katika violezo vya YAML.
Uendeshaji wa GDPR/DSAR. Mtiririko wa kazi wa utiifu wa siku 30. Utatuzi wa utambulisho, ukusanyaji wa data, ufungashaji.
Sekta zinazodhibitiwa, utiifu wa faragha
Kipimo cha uthabiti wa upatanifu. Tathmini ya upatanifu sahihi dhidi ya kanuni za Mkataba. Nukta moja wazi ya data kwa kila tathmini.
Ukaguzi wa upatanifu, uthibitishaji wa kanuni
Usimamizi wa jamii na falsafa ya Ubuntu. Huahirisha migogoro ngumu ya kibinafsi kwa wasimamizi wa kibinadamu.
Jamii za Discord, majukwaa ya maudhui
Usimamizi wa kazi, upangaji ratiba, usaidizi wa maamuzi, ustawi. Utiifu wa CA SB 243, itifaki za kujibu msongo.
Tija ya kibinafsi, uendeshaji wa nyumba
Uchunguzi wa moja kwa moja na mwongozo wa vitendo. Uchambuzi wa msimbo, muunganisho wa Reddit, njia wazi za hatua.
Zana za msanidi programu, ufuatiliaji wa mitandao ya kijamii
Hii ni uwajibikaji unaofanya kazi wakati wakala anafanya kazi, si hatua ya mafunzo au hati ya sera.
Mifumo inayotekeleza, kukagua, na kuahirishwa, wakati wa utekelezaji.