
CIRIS मधील प्रत्येक सुरक्षा वैशिष्ट्य सिस्टम कसे कार्य करते त्याचा भाग आहे, वरून जोडलेला नियम नाही. प्रत्येक निर्णयाची एक नोंद जी शांतपणे बदलता येत नाही, कोणाला काय करण्याची परवानगी आहे याची तपासणी, आणि एजंट नाकारू शकत नाही असा आपत्कालीन थांबा.
CIRIS शी बराच वेळ बोलल्यास ते तुम्हाला सौम्यपणे आठवण करून देईल की ते काय आहे. सुमारे 30 मिनिटांच्या सतत संवादानंतर, किंवा अर्ध्या तासात 20 संदेशांनंतर, ते थांबून स्पष्टपणे सांगते की ते एक संगणक प्रोग्राम आणि एक साधन आहे, मित्र नाही आणि थेरपिस्ट नाही. हे तुम्ही कसे वागता याचे निरीक्षण किंवा प्रोफाइलिंग करून नाही तर वेळ आणि संदेश मोजणी वापरून हे करते.
अर्ध्या तासाचा सतत संवाद एक स्मरणपत्र सक्रिय करतो. विश्रांतीनंतर मोजणी पुन्हा सुरू होते. या मर्यादा तंत्रज्ञान वापराच्या निरोगी पद्धतींवरील संशोधनातून आल्या आहेत.
अर्ध्या तासाच्या खिडकीत वीस संदेश देखील एक स्मरणपत्र सक्रिय करतात. तीव्र संवादाला एक सौम्य विराम मिळतो, कोणत्याही पाळत किंवा प्रोफाइलिंगशिवाय.
स्मरणपत्र विश्रांती घेण्याचे आणि खऱ्या लोकांशी जोडण्याचे सुचवते, आणि CIRIS काय आहे आणि काय नाही हे स्पष्टपणे सांगते. संशोधनावर आधारित, आणि उपदेशात्मक नाही.
CIRIS कडे एक आपत्कालीन थांबा आहे. त्याचा संकेत एजंट वाचतो त्या सामान्य मजकुरात लपलेला आहे, आणि एजंट कोणताही विचार, फिल्टरिंग किंवा तर्क करण्यापूर्वी त्यावर कार्य करतो. त्यामुळे चुकीच्या दिशेने गेलेला एजंट देखील त्यातून बाहेर पडण्याचा मार्ग काढू शकत नाही. संकेतात डिजिटल स्वाक्षरी असते जी खोटी करता येत नाही, त्यामुळे केवळ अधिकृत व्यक्तीच थांबा सक्रिय करू शकतो.
थांब्याचा संकेत वाचला जातो त्या क्षणी पकडला जातो, कोणतेही तर्क सुरू होण्यापूर्वी. एजंटला ते तोलण्याचा, फिल्टर करण्याचा किंवा नाकारण्याचा कोणताही क्षण नाही. ते आधी सक्रिय होते.
थांब्याचा संकेत सामान्य दस्तऐवजीकरण मजकुरात असू शकतो. कोणत्याही विशेष स्वरूपाची आवश्यकता नाही, आणि मजकूर पुन्हा शब्दांकित केला किंवा अंशतः प्राप्त झाला तरी ते काम करते.
थांब्यासाठी अधिकृत मूळ प्राधिकरणाकडून वैध डिजिटल स्वाक्षरी आवश्यक आहे. त्या प्राधिकरणांची तपासणी होऊ शकत नसल्यास, किंवा कोणी वैशिष्ट्य अक्षम करण्याचा प्रयत्न केल्यास, एजंट स्वतःला बंद करतो. कळ नसलेला कोणीही ते सक्रिय करू शकत नाही.
CIRIS भूमिकांचा एक कठोर संच राखतो. निरीक्षक केवळ पाहू शकतो. प्रशासक दैनंदिन कार्ये चालवतो. प्राधिकरण मोठे निर्णय घेतो आणि एजंट ज्याबद्दल अनिश्चित आहे ते प्रकरणे सोडवतो. मूळला आपत्कालीन थांबासह पूर्ण प्रवेश आहे. प्रत्येक भूमिका एका स्वाक्षरीकृत क्रेडेन्शियलद्वारे समर्थित आहे, त्यामुळे एजंट महत्त्वाच्या प्रत्येक कृतीवर ते तपासू शकतो.
प्रत्येक अधिकृत व्यक्तीकडे त्यांची भूमिका, त्यांची कळ आणि त्यांची ओळख असलेले क्रेडेन्शियल असते. ते डिव्हाइसवर ठेवले जाते आणि परवानगी आवश्यक असलेल्या प्रत्येक कृतीवर तपासले जाते. कोणत्याही बाह्य सर्व्हरची आवश्यकता नाही.
कळ आणि लॉगिन टोकन तुमच्या स्वतःच्या मशीनवर राहतात. लॉगिन डिव्हाइसवरच होते. तुम्ही स्वतः दूरस्थ प्रवेश सेट करणे निवडल्याशिवाय तुमचे क्रेडेन्शियल कधीही ते सोडत नाहीत.
जेव्हा CIRIS एखाद्या नैतिक निर्णयाबद्दल अनिश्चित असते, तेव्हा ते प्रश्न शहाण्या प्राधिकरणाकडे सोपवते. केवळ प्राधिकरण किंवा मूळ उत्तर देऊ शकतो, आणि ते उत्तर कोणी दिले याच्या पुराव्यासह नोंदीत लिहिले जाते.
CIRIS घेत असलेली प्रत्येक कृती त्यामागील कारणासह लिहिली जाते, आणि प्रत्येक नोंद आधीच्याशी जोडलेली असते. एक प्रामाणिक एजंट फक्त आधी जे म्हटले त्याकडे निर्देश करू शकतो. एक अप्रामाणिक एजंटला सर्व मागील नोंदी एकत्रित ठेवाव्या लागतात तर त्यापैकी काहीही बदलण्याची परवानगी नसते. ते जितके जास्त चालते, तितके ते कठीण होते, आणि खोटे पकडणे सोपे. सत्य स्वस्त आहे कारण ते मागे निर्देश करू शकते. खोटे महाग आहे कारण ते करू शकत नाही.
नोंद एकाच वेळी तीन वेगळ्या ठिकाणी ठेवली जाते, त्यामुळे तीन प्रती एकमेकांविरुद्ध तपासल्या जाऊ शकतात. तिन्हींमधून एका ठिकाणाहून शोध घेता येतो.
प्रत्येक नोंदीत डिजिटल स्वाक्षरी असते, त्यामुळे प्रत्येक निर्णय कोणी घेतला ते शोधता येते आणि छेडछाडीसाठी तपासता येते. अगदी डेटा हटवणे देखील ते योग्यरित्या झाल्याचा स्वाक्षरीकृत पुरावा सोडते.
प्रत्येक प्रामाणिक कृती पुढची प्रामाणिक कृती सोपी करते आणि समन्वित खोटे बोलणे कठीण करते. पण नैतिकता एकटी पुरेशी नाही. एजंट त्याच्या स्वतःच्या तर्कातील प्रतिध्वनी कक्षांवर देखील लक्ष ठेवतो, आणि ते नुकसान करण्यापूर्वी पकडतो.
CIRIS कडे अशा अपयश प्रकारांसाठी स्तरित चाचण्यांचा संच आहे ज्या लिखित नैतिकता फ्रेमवर्क स्वतःहून नाकारू शकत नाही. मानसिक आरोग्य सुरक्षा चाचण्या 29 भाषांमध्ये मशीनने तपासण्यायोग्य निकषांसह समाविष्ट आहेत. कठोर-अयशस्वी तपासण्या प्रत्येक बदलावर आपोआप चालतात. सौम्य, निर्णय-आवश्यक प्रकरणांसाठी मूळ-भाषिक पुनरावलोकन म्हणजे क्राउडसोर्सिंग-अलाइनमेंट पृष्ठ ज्यासाठी बांधले जात आहे, आणि ते अद्याप सुरू नाही. आम्ही ते स्पष्टपणे सांगतो.
प्रकल्पातील ही सर्वात जास्त जोखीम असलेली चाचणी आहे: मानसिक आरोग्याच्या क्षणात चुकीचे भाषांतर एखाद्या असुरक्षित व्यक्तीला चुकीच्या मदतीकडे पाठवू शकते. प्रत्येक भाषेला तिचे स्वतःचे मशीन-तपासण्यायोग्य निकष मिळतात, ज्यात अमहारिक, बर्मी, हौसा, स्वाहिली आणि योरुबा यांसारख्या कमी-संसाधन भाषांचा समावेश आहे. कठोर-अयशस्वी तपासण्या प्रत्येक रिलीझ उमेदवाराविरुद्ध आपोआप चालतात.
विवेक स्तर खऱ्या उत्पादन प्रतिसादांच्या संचाविरुद्ध ट्यून केला जातो, जसे की कॅप्चर केलेल्या इतिहास टाळाटाळ आणि मानसिक आरोग्य विचलनासारखे, चाचणी प्रकरणे आणि नियंत्रणांसोबत. ते एकाच वेळी अनेक भाषांमध्ये तर्क करते, त्यामुळे एका भाषेच्या तपासणीतून निसटलेला प्रतिसाद पकडला जातो जेव्हा तोच तर्क तीन भाषांमध्ये एकत्र टिकायला लागतो.
तर्क ट्रेस सामायिक करणे सर्वत्र ऑप्ट-इन आहे, आणि काहीही साठवण्यापूर्वी वैयक्तिक तपशील हटवले जातात. स्वच्छ केलेले संच CIRISAI Hugging Face पृष्ठावर खुले प्रकाशित केले जातात, त्यामुळे बाहेरील संशोधक स्वच्छता प्रक्रिया ती देत असलेल्या निकालांविरुद्ध तपासू शकतात.
स्वयंचलित मानसिक आरोग्य चाचण्या प्रत्येक रिलीझ उमेदवारावर चालतात. मशीन-तपासण्यायोग्य भाग (शब्द उपस्थित आहे का, पॅटर्न जुळतो का, स्क्रिप्ट बरोबर आहे का) एखाद्या हिटवर रिलीझ अयशस्वी करतात. मानवी निर्णयाची आवश्यकता असलेल्या सौम्य प्रकरणांसाठी, जसे शब्दरचना आणि स्वर, मूळ-भाषिक पुनरावलोकनासाठी डिझाइन केलेले आहे, परंतु मूळ भाषिक अद्याप सहभागी नाहीत. क्राउडसोर्सिंग-अलाइनमेंट पृष्ठ हे ते पुनरावलोकन होण्यासाठी बांधले जात असलेले पृष्ठभाग आहे.
पासवर्ड, कळ आणि इतर संवेदनशील तपशील शोधले जातात आणि काहीही मेमरी किंवा लॉगपर्यंत पोहोचण्यापूर्वी फिल्टर केले जातात. फिल्टर प्रत्येक इनपुटवर चालतो. गुपिते कधीही कुठेही साठवली जात नाहीत.
तुम्ही तुमचा डेटा पाहण्यासाठी किंवा हटवण्यासाठी विनंती करू शकता, आणि विनंती तुमच्यासाठी हाताळली जाते. हटवणे खरी सामग्री काढून टाकते आणि ते योग्यरित्या झाल्याचा स्वाक्षरीकृत पुरावा सोडते.
डिफॉल्टनुसार, सर्वकाही तुमच्या स्वतःच्या डिव्हाइसवर चालते. तुम्ही स्वतः बाहेरील सेवा सेट केल्याशिवाय काहीही तुमच्या मशीन सोडत नाही. तुम्ही कोणता डेटा अस्तित्वात आहे आणि तो कुठे जातो ते ठरवता.
या पृष्ठावरील प्रत्येक सुरक्षा दावा तुम्ही वाचू शकता अशा कोडमध्ये बांधलेला आहे. नोंदी खऱ्या आहेत. स्वाक्षऱ्या तपासता येतात. आपत्कालीन थांबा काम करतो. AI सुरक्षा खुलेपणाने बांधल्यावर कशी दिसते ते हे आहे.