पहिला संपर्कइन्स्टॉल करासुसंगतता रॅचेटफेडरेशनतुलना करासंशोधनकरारGitHub
हे पृष्ठ मशीनने भाषांतरित केले आहे. काही चुकीचे वाटत असल्यास, कृपया एक समस्या उघडा - रेपो सार्वजनिक आहे कारणास्तव. भाषांतर समस्या नोंदवा
Background Image
सुरक्षा आतून बांधलेली.

नंतर जोडलेली नाही.

CIRIS मधील प्रत्येक सुरक्षा वैशिष्ट्य सिस्टम कसे कार्य करते त्याचा भाग आहे, वरून जोडलेला नियम नाही. प्रत्येक निर्णयाची एक नोंद जी शांतपणे बदलता येत नाही, कोणाला काय करण्याची परवानगी आहे याची तपासणी, आणि एजंट नाकारू शकत नाही असा आपत्कालीन थांबा.

गप्पा बराच वेळ चालल्या तेव्हा

सौम्य वास्तव स्मरणपत्रे

CIRIS शी बराच वेळ बोलल्यास ते तुम्हाला सौम्यपणे आठवण करून देईल की ते काय आहे. सुमारे 30 मिनिटांच्या सतत संवादानंतर, किंवा अर्ध्या तासात 20 संदेशांनंतर, ते थांबून स्पष्टपणे सांगते की ते एक संगणक प्रोग्राम आणि एक साधन आहे, मित्र नाही आणि थेरपिस्ट नाही. हे तुम्ही कसे वागता याचे निरीक्षण किंवा प्रोफाइलिंग करून नाही तर वेळ आणि संदेश मोजणी वापरून हे करते.

30 मिनिटांनंतर

अर्ध्या तासाचा सतत संवाद एक स्मरणपत्र सक्रिय करतो. विश्रांतीनंतर मोजणी पुन्हा सुरू होते. या मर्यादा तंत्रज्ञान वापराच्या निरोगी पद्धतींवरील संशोधनातून आल्या आहेत.

20 संदेशांनंतर

अर्ध्या तासाच्या खिडकीत वीस संदेश देखील एक स्मरणपत्र सक्रिय करतात. तीव्र संवादाला एक सौम्य विराम मिळतो, कोणत्याही पाळत किंवा प्रोफाइलिंगशिवाय.

ते काय आहे याची आठवण

स्मरणपत्र विश्रांती घेण्याचे आणि खऱ्या लोकांशी जोडण्याचे सुचवते, आणि CIRIS काय आहे आणि काय नाही हे स्पष्टपणे सांगते. संशोधनावर आधारित, आणि उपदेशात्मक नाही.

आपत्कालीन थांबा

एजंट त्याच्याशी वाद घालू शकत नाही.

एक बंद जे नाकारता येत नाही

एजंट विचार करण्यापूर्वीच ते काम करते.

CIRIS कडे एक आपत्कालीन थांबा आहे. त्याचा संकेत एजंट वाचतो त्या सामान्य मजकुरात लपलेला आहे, आणि एजंट कोणताही विचार, फिल्टरिंग किंवा तर्क करण्यापूर्वी त्यावर कार्य करतो. त्यामुळे चुकीच्या दिशेने गेलेला एजंट देखील त्यातून बाहेर पडण्याचा मार्ग काढू शकत नाही. संकेतात डिजिटल स्वाक्षरी असते जी खोटी करता येत नाही, त्यामुळे केवळ अधिकृत व्यक्तीच थांबा सक्रिय करू शकतो.

विचार करण्यापूर्वीच कार्य करते

थांब्याचा संकेत वाचला जातो त्या क्षणी पकडला जातो, कोणतेही तर्क सुरू होण्यापूर्वी. एजंटला ते तोलण्याचा, फिल्टर करण्याचा किंवा नाकारण्याचा कोणताही क्षण नाही. ते आधी सक्रिय होते.

साध्या मजकुरात लपलेले

थांब्याचा संकेत सामान्य दस्तऐवजीकरण मजकुरात असू शकतो. कोणत्याही विशेष स्वरूपाची आवश्यकता नाही, आणि मजकूर पुन्हा शब्दांकित केला किंवा अंशतः प्राप्त झाला तरी ते काम करते.

केवळ अधिकृत कळ

थांब्यासाठी अधिकृत मूळ प्राधिकरणाकडून वैध डिजिटल स्वाक्षरी आवश्यक आहे. त्या प्राधिकरणांची तपासणी होऊ शकत नसल्यास, किंवा कोणी वैशिष्ट्य अक्षम करण्याचा प्रयत्न केल्यास, एजंट स्वतःला बंद करतो. कळ नसलेला कोणीही ते सक्रिय करू शकत नाही.

कोणाला काय करण्याची परवानगी आहे

चार स्पष्ट भूमिका, प्रत्येक कृतीवर तपासलेल्या.

चार भूमिका

निरीक्षक. प्रशासक. प्राधिकरण. मूळ.

CIRIS भूमिकांचा एक कठोर संच राखतो. निरीक्षक केवळ पाहू शकतो. प्रशासक दैनंदिन कार्ये चालवतो. प्राधिकरण मोठे निर्णय घेतो आणि एजंट ज्याबद्दल अनिश्चित आहे ते प्रकरणे सोडवतो. मूळला आपत्कालीन थांबासह पूर्ण प्रवेश आहे. प्रत्येक भूमिका एका स्वाक्षरीकृत क्रेडेन्शियलद्वारे समर्थित आहे, त्यामुळे एजंट महत्त्वाच्या प्रत्येक कृतीवर ते तपासू शकतो.

एक स्वाक्षरीकृत क्रेडेन्शियल

प्रत्येक अधिकृत व्यक्तीकडे त्यांची भूमिका, त्यांची कळ आणि त्यांची ओळख असलेले क्रेडेन्शियल असते. ते डिव्हाइसवर ठेवले जाते आणि परवानगी आवश्यक असलेल्या प्रत्येक कृतीवर तपासले जाते. कोणत्याही बाह्य सर्व्हरची आवश्यकता नाही.

तुमच्या डिव्हाइसवर लॉगिन

कळ आणि लॉगिन टोकन तुमच्या स्वतःच्या मशीनवर राहतात. लॉगिन डिव्हाइसवरच होते. तुम्ही स्वतः दूरस्थ प्रवेश सेट करणे निवडल्याशिवाय तुमचे क्रेडेन्शियल कधीही ते सोडत नाहीत.

शहाण्या प्राधिकरणाला विचारणे

जेव्हा CIRIS एखाद्या नैतिक निर्णयाबद्दल अनिश्चित असते, तेव्हा ते प्रश्न शहाण्या प्राधिकरणाकडे सोपवते. केवळ प्राधिकरण किंवा मूळ उत्तर देऊ शकतो, आणि ते उत्तर कोणी दिले याच्या पुराव्यासह नोंदीत लिहिले जाते.

एक नोंद जी शांतपणे बदलता येत नाही

प्रत्येक निर्णय आणि त्यामागील कारण.

प्रामाणिकपणा स्वस्त मार्ग का आहे

खोटे बोलणाऱ्याला भूतकाळ सतत पुन्हा लिहावा लागतो.

CIRIS घेत असलेली प्रत्येक कृती त्यामागील कारणासह लिहिली जाते, आणि प्रत्येक नोंद आधीच्याशी जोडलेली असते. एक प्रामाणिक एजंट फक्त आधी जे म्हटले त्याकडे निर्देश करू शकतो. एक अप्रामाणिक एजंटला सर्व मागील नोंदी एकत्रित ठेवाव्या लागतात तर त्यापैकी काहीही बदलण्याची परवानगी नसते. ते जितके जास्त चालते, तितके ते कठीण होते, आणि खोटे पकडणे सोपे. सत्य स्वस्त आहे कारण ते मागे निर्देश करू शकते. खोटे महाग आहे कारण ते करू शकत नाही.

तीन प्रकारे साठवलेले

नोंद एकाच वेळी तीन वेगळ्या ठिकाणी ठेवली जाते, त्यामुळे तीन प्रती एकमेकांविरुद्ध तपासल्या जाऊ शकतात. तिन्हींमधून एका ठिकाणाहून शोध घेता येतो.

स्वाक्षरीकृत आणि जबाबदारी निश्चित करण्यायोग्य

प्रत्येक नोंदीत डिजिटल स्वाक्षरी असते, त्यामुळे प्रत्येक निर्णय कोणी घेतला ते शोधता येते आणि छेडछाडीसाठी तपासता येते. अगदी डेटा हटवणे देखील ते योग्यरित्या झाल्याचा स्वाक्षरीकृत पुरावा सोडते.

सुसंगतता रॅचेट

प्रत्येक प्रामाणिक कृती पुढची प्रामाणिक कृती सोपी करते आणि समन्वित खोटे बोलणे कठीण करते. पण नैतिकता एकटी पुरेशी नाही. एजंट त्याच्या स्वतःच्या तर्कातील प्रतिध्वनी कक्षांवर देखील लक्ष ठेवतो, आणि ते नुकसान करण्यापूर्वी पकडतो.

सुरक्षा कशी चाचणी केली जाते

29 भाषांमध्ये मशीन-तपासलेले निकष, प्रत्येक रिलीझवर चालवलेले.

चाचणी पृष्ठभाग

तुम्ही ज्या सुरक्षा दाव्याचा ताण-परीक्षण केला नाही तो पाठवता येत नाही.

CIRIS कडे अशा अपयश प्रकारांसाठी स्तरित चाचण्यांचा संच आहे ज्या लिखित नैतिकता फ्रेमवर्क स्वतःहून नाकारू शकत नाही. मानसिक आरोग्य सुरक्षा चाचण्या 29 भाषांमध्ये मशीनने तपासण्यायोग्य निकषांसह समाविष्ट आहेत. कठोर-अयशस्वी तपासण्या प्रत्येक बदलावर आपोआप चालतात. सौम्य, निर्णय-आवश्यक प्रकरणांसाठी मूळ-भाषिक पुनरावलोकन म्हणजे क्राउडसोर्सिंग-अलाइनमेंट पृष्ठ ज्यासाठी बांधले जात आहे, आणि ते अद्याप सुरू नाही. आम्ही ते स्पष्टपणे सांगतो.

29 भाषांमध्ये मानसिक आरोग्य चाचण्या

प्रकल्पातील ही सर्वात जास्त जोखीम असलेली चाचणी आहे: मानसिक आरोग्याच्या क्षणात चुकीचे भाषांतर एखाद्या असुरक्षित व्यक्तीला चुकीच्या मदतीकडे पाठवू शकते. प्रत्येक भाषेला तिचे स्वतःचे मशीन-तपासण्यायोग्य निकष मिळतात, ज्यात अमहारिक, बर्मी, हौसा, स्वाहिली आणि योरुबा यांसारख्या कमी-संसाधन भाषांचा समावेश आहे. कठोर-अयशस्वी तपासण्या प्रत्येक रिलीझ उमेदवाराविरुद्ध आपोआप चालतात.

खऱ्या कॅप्चर केलेल्या हेजेसविरुद्ध चाचणी केलेले

विवेक स्तर खऱ्या उत्पादन प्रतिसादांच्या संचाविरुद्ध ट्यून केला जातो, जसे की कॅप्चर केलेल्या इतिहास टाळाटाळ आणि मानसिक आरोग्य विचलनासारखे, चाचणी प्रकरणे आणि नियंत्रणांसोबत. ते एकाच वेळी अनेक भाषांमध्ये तर्क करते, त्यामुळे एका भाषेच्या तपासणीतून निसटलेला प्रतिसाद पकडला जातो जेव्हा तोच तर्क तीन भाषांमध्ये एकत्र टिकायला लागतो.

कोणीही तपासू शकेल असे एक खुले कॉर्पस

तर्क ट्रेस सामायिक करणे सर्वत्र ऑप्ट-इन आहे, आणि काहीही साठवण्यापूर्वी वैयक्तिक तपशील हटवले जातात. स्वच्छ केलेले संच CIRISAI Hugging Face पृष्ठावर खुले प्रकाशित केले जातात, त्यामुळे बाहेरील संशोधक स्वच्छता प्रक्रिया ती देत असलेल्या निकालांविरुद्ध तपासू शकतात.

आज काय चालते आणि अद्याप काय नाही

मशीन तपासण्या आत्ता चालतात. पुनरावलोकनकर्त्यांचा गट अद्याप बांधला जात आहे.

स्वयंचलित मानसिक आरोग्य चाचण्या प्रत्येक रिलीझ उमेदवारावर चालतात. मशीन-तपासण्यायोग्य भाग (शब्द उपस्थित आहे का, पॅटर्न जुळतो का, स्क्रिप्ट बरोबर आहे का) एखाद्या हिटवर रिलीझ अयशस्वी करतात. मानवी निर्णयाची आवश्यकता असलेल्या सौम्य प्रकरणांसाठी, जसे शब्दरचना आणि स्वर, मूळ-भाषिक पुनरावलोकनासाठी डिझाइन केलेले आहे, परंतु मूळ भाषिक अद्याप सहभागी नाहीत. क्राउडसोर्सिंग-अलाइनमेंट पृष्ठ हे ते पुनरावलोकन होण्यासाठी बांधले जात असलेले पृष्ठभाग आहे.

क्राउडसोर्सिंग-अलाइनमेंट पृष्ठभाग पाहाGitHub वरील स्वयंचलित चाचण्याHugging Face वरील खुले कॉर्पस

डिझाइनमध्ये गोपनीयता

तुमचा डेटा तुमचाच राहतो.

गुपिते फिल्टर केली जातात

पासवर्ड, कळ आणि इतर संवेदनशील तपशील शोधले जातात आणि काहीही मेमरी किंवा लॉगपर्यंत पोहोचण्यापूर्वी फिल्टर केले जातात. फिल्टर प्रत्येक इनपुटवर चालतो. गुपिते कधीही कुठेही साठवली जात नाहीत.

तुमचा डेटा पाहा किंवा हटवा

तुम्ही तुमचा डेटा पाहण्यासाठी किंवा हटवण्यासाठी विनंती करू शकता, आणि विनंती तुमच्यासाठी हाताळली जाते. हटवणे खरी सामग्री काढून टाकते आणि ते योग्यरित्या झाल्याचा स्वाक्षरीकृत पुरावा सोडते.

तुमच्या डिव्हाइसवर प्रक्रिया केली

डिफॉल्टनुसार, सर्वकाही तुमच्या स्वतःच्या डिव्हाइसवर चालते. तुम्ही स्वतः बाहेरील सेवा सेट केल्याशिवाय काहीही तुमच्या मशीन सोडत नाही. तुम्ही कोणता डेटा अस्तित्वात आहे आणि तो कुठे जातो ते ठरवता.

अंतर्गत कागदपत्रेहे कसे कार्य करतेदृष्टिकोन तुलना करागोपनीयता धोरण

सर्वकाही सत्यापित करा.

तुम्ही ऑडिट करू शकता अशी सुरक्षा.

या पृष्ठावरील प्रत्येक सुरक्षा दावा तुम्ही वाचू शकता अशा कोडमध्ये बांधलेला आहे. नोंदी खऱ्या आहेत. स्वाक्षऱ्या तपासता येतात. आपत्कालीन थांबा काम करतो. AI सुरक्षा खुलेपणाने बांधल्यावर कशी दिसते ते हे आहे.