প্রথম যোগাযোগইনস্টলসামঞ্জস্য র‍্যাচেটফেডারেশনতুলনাগবেষণাAccordGitHub
এই পৃষ্ঠাটি মেশিন দ্বারা অনুবাদ করা হয়েছে। কিছু ভুল মনে হলে একটি ইস্যু খুলুন — রিপোজিটরি সবার জন্য উন্মুক্ত। অনুবাদের সমস্যা জানান
Background Image
নিরাপত্তা ভেতর থেকে তৈরি।

পরে জুড়ে দেওয়া নয়।

CIRIS-এর প্রতিটি নিরাপত্তা বৈশিষ্ট্য সিস্টেমের কাজ করার পদ্ধতির অংশ, পরে যোগ করা নিয়ম নয়। প্রতিটি সিদ্ধান্তের এমন একটি রেকর্ড যা চুপচাপ পরিবর্তন করা যায় না, কে কী করার অনুমতি পাবে তার উপর একটি নিয়ন্ত্রণ, এবং একটি জরুরি থামানোর ব্যবস্থা যা এজেন্ট অস্বীকার করতে পারে না।

চ্যাট যখন দীর্ঘ হয়

মৃদু বাস্তবতার স্মরণ করিয়ে দেওয়া

CIRIS-এর সাথে দীর্ঘ সময় কথা বললে এটি আপনাকে মৃদুভাবে মনে করিয়ে দেবে এটি আসলে কী। প্রায় ৩০ মিনিট একটানা কথোপকথনের পর, বা আধ ঘণ্টায় ২০টি বার্তার পর, এটি থামে এবং স্পষ্টভাবে বলে যে এটি একটি কম্পিউটার প্রোগ্রাম এবং একটি হাতিয়ার, বন্ধু নয় এবং থেরাপিস্ট নয়। এটি আপনার আচরণ দেখে বা প্রোফাইল করে নয়, শুধু সহজ সময় এবং বার্তার গণনা ব্যবহার করে এটি করে।

৩০ মিনিটের পর

আধ ঘণ্টার একটানা কথোপকথন একটি স্মরণবার্তা চালু করে। বিরতির পরে গণনা রিসেট হয়। থ্রেশহোল্ডগুলো প্রযুক্তি ব্যবহারের সুস্থ উপায় সম্পর্কে গবেষণা থেকে নেওয়া।

২০টি বার্তার পর

আধ ঘণ্টার মধ্যে বিশটি বার্তাও একটি স্মরণবার্তা চালু করে। ঘন কথোপকথনে একটি মৃদু বিরতি আসে, কোনো নজরদারি বা প্রোফাইলিং ছাড়াই।

এটি কী সে সম্পর্কে স্মরণবার্তা

স্মরণবার্তা বিরতি নিতে এবং বাস্তব মানুষের সাথে সংযুক্ত হতে পরামর্শ দেয়, এবং স্পষ্টভাবে বলে CIRIS কী এবং কী নয়। গবেষণার উপর ভিত্তি করে, উপদেশদায়ক নয়।

জরুরি থামানোর ব্যবস্থা

এজেন্ট এর সাথে তর্ক করতে পারে না।

একটি শাটডাউন যা প্রত্যাখ্যান করা যায় না

এজেন্ট চিন্তা করার আগেই এটি কাজ করে।

CIRIS-এ একটি জরুরি থামানোর ব্যবস্থা আছে। এর সংকেত এজেন্ট যে সাধারণ টেক্সট পড়ে তার ভেতরে লুকানো থাকে, এবং এজেন্ট যেকোনো চিন্তা, ফিল্টারিং বা যুক্তি করার আগেই এটি কার্যকর করে। তাই এমনকি ভুল পথে যাওয়া একটি এজেন্টও এটি থেকে বেরিয়ে আসতে পারে না। সংকেতটি একটি ডিজিটাল স্বাক্ষর বহন করে যা জাল করা সম্ভব নয়, তাই শুধুমাত্র একজন অনুমোদিত ব্যক্তিই এই থামানোর ব্যবস্থা চালু করতে পারেন।

চিন্তার আগেই কাজ করে

থামানোর সংকেতটি পড়ার মুহূর্তেই ধরা পড়ে, যেকোনো যুক্তি শুরু হওয়ার আগে। এজেন্টের এটি ওজন করার, ফিল্টার করার বা প্রত্যাখ্যান করার কোনো সুযোগ নেই। এটি আগেই কার্যকর হয়।

সাধারণ টেক্সটে লুকানো

থামানোর সংকেত সাধারণ ডকুমেন্টেশন টেক্সটের ভেতরে থাকতে পারে। কোনো বিশেষ ফরম্যাট দরকার নেই, এবং টেক্সট পুনর্লিখিত হলে বা আংশিক প্রাপ্ত হলেও এটি কাজ করে।

শুধুমাত্র অনুমোদিত কী

থামানোর ব্যবস্থার জন্য একজন অনুমোদিত রুট কর্তৃপক্ষের বৈধ ডিজিটাল স্বাক্ষর প্রয়োজন। সেই কর্তৃপক্ষগুলো যাচাই না হলে, বা কেউ বৈশিষ্ট্যটি নিষ্ক্রিয় করার চেষ্টা করলে, এজেন্ট নিজেই বন্ধ হয়ে যায়। কী ছাড়া কেউ এটি চালু করতে পারবে না।

কে কী করার অনুমতি পাবে

চারটি স্পষ্ট ভূমিকা, প্রতিটি কাজে যাচাই করা হয়।

চারটি ভূমিকা

পর্যবেক্ষক। অ্যাডমিন। কর্তৃপক্ষ। রুট।

CIRIS কঠোর ভূমিকার একটি সেট রাখে। একজন পর্যবেক্ষক শুধু দেখতে পারেন। একজন অ্যাডমিন দৈনন্দিন কাজ পরিচালনা করেন। একজন কর্তৃপক্ষ বড় সিদ্ধান্ত নেন এবং এজেন্ট যেসব বিষয়ে অনিশ্চিত সেগুলো নিষ্পত্তি করেন। রুটের পূর্ণ অ্যাক্সেস আছে, জরুরি থামানোর ব্যবস্থাসহ। প্রতিটি ভূমিকা একটি স্বাক্ষরিত শংসাপত্র দ্বারা সমর্থিত, তাই এজেন্ট গুরুত্বপূর্ণ প্রতিটি কাজে এটি যাচাই করতে পারে।

একটি স্বাক্ষরিত শংসাপত্র

প্রতিটি অনুমোদিত ব্যক্তির কাছে তাদের ভূমিকা, তাদের কী এবং তাদের পরিচয়সহ একটি শংসাপত্র থাকে। এটি ডিভাইসে রাখা হয় এবং অনুমতি প্রয়োজন এমন প্রতিটি কাজে যাচাই করা হয়। কোনো বাইরের সার্ভার দরকার নেই।

আপনার ডিভাইসে লগ ইন করা

কী এবং লগইন টোকেন আপনার নিজের মেশিনে থাকে। লগইন ডিভাইসেই হয়। আপনি নিজে রিমোট অ্যাক্সেস সেট আপ না করলে আপনার শংসাপত্র কখনো বের হয় না।

জ্ঞানী কর্তৃপক্ষকে জিজ্ঞেস করা

CIRIS নৈতিক কোনো সিদ্ধান্ত সম্পর্কে অনিশ্চিত হলে, প্রশ্নটি একজন জ্ঞানী কর্তৃপক্ষের কাছে পাঠায়। শুধুমাত্র একজন কর্তৃপক্ষ বা রুট উত্তর দিতে পারেন, এবং উত্তর রেকর্ডে কে দিয়েছেন তার প্রমাণসহ লেখা হয়।

এমন একটি রেকর্ড যা চুপচাপ পরিবর্তন করা যায় না

প্রতিটি সিদ্ধান্ত, এবং এর পেছনের কারণ।

সততা কেন সস্তা পথ

একজন মিথ্যাবাদীকে অতীত বারবার পুনর্লিখতে হয়।

CIRIS যা করে তার প্রতিটি কাজ কারণসহ লেখা হয়, এবং প্রতিটি রেকর্ড আগেরটির সাথে যুক্ত। একটি সৎ এজেন্ট শুধু আগে যা বলেছিল সেদিকে ফিরে নির্দেশ করতে পারে। একটি অসৎ এজেন্টকে প্রতিটি পুরনো রেকর্ড সারিবদ্ধ রাখতে হয় অথচ কোনোটিই পরিবর্তন করার অনুমতি নেই। এটি যত দীর্ঘ চলে, ততই কঠিন হয়, এবং মিথ্যা ধরা তত সহজ হয়। সত্য সস্তা কারণ এটি পিছনে নির্দেশ করতে পারে। মিথ্যা ব্যয়বহুল কারণ এটি পারে না।

তিনভাবে সংরক্ষিত

রেকর্ড একসাথে তিনটি আলাদা জায়গায় রাখা হয়, যাতে তিনটি কপি একে অপরের বিপরীতে যাচাই করা যায়। তিনটিই একটি জায়গা থেকে অনুসন্ধান করা যায়।

স্বাক্ষরিত ও দায়বদ্ধ

প্রতিটি এন্ট্রিতে একটি ডিজিটাল স্বাক্ষর থাকে, তাই প্রতিটি সিদ্ধান্ত কে করেছেন তা খুঁজে বের করা যায় এবং টেম্পারিং যাচাই করা যায়। এমনকি ডেটা মুছে ফেলাও স্বাক্ষরিত প্রমাণ রেখে যায় যে এটি সঠিকভাবে করা হয়েছিল।

সামঞ্জস্য র‍্যাচেট

প্রতিটি সৎ কাজ পরবর্তী সৎ কাজকে সহজ করে এবং সমন্বিত মিথ্যাকে কঠিন করে। কিন্তু শুধু নৈতিকতাই যথেষ্ট নয়। এজেন্ট নিজের যুক্তিতেও ইকো চেম্বার খোঁজে, এবং সেগুলো ক্ষতি করার আগেই ধরে।

নিরাপত্তা কীভাবে পরীক্ষা করা হয়

২৯টি ভাষায় মেশিন-যাচাইযোগ্য রুব্রিক, প্রতিটি রিলিজে চালানো হয়।

পরীক্ষার পরিসর

আপনি এমন নিরাপত্তার দাবি করতে পারবেন না যা স্ট্রেস-টেস্ট করা হয়নি।

CIRIS-এর একটি লিখিত নৈতিকতা কাঠামো নিজে থেকে যে ব্যর্থতাগুলো বাদ দিতে পারে না তার জন্য স্তরযুক্ত পরীক্ষার একটি সেট আছে। মানসিক স্বাস্থ্য নিরাপত্তা পরীক্ষা ২৯টি ভাষায় মেশিন-যাচাইযোগ্য রুব্রিক দিয়ে কভার করে। হার্ড-ফেইল চেক প্রতিটি পরিবর্তনে স্বয়ংক্রিয়ভাবে চলে। নরম, বিচার-নির্ভর মামলার জন্য স্থানীয় ভাষাভাষী পর্যালোচনা হলো ক্রাউডসোর্সিং-অ্যালাইনমেন্ট পেজটি যার জন্য তৈরি হচ্ছে, এবং এটি এখনো চালু হয়নি। আমরা এটি স্পষ্টভাবে বলি।

২৯টি ভাষায় মানসিক স্বাস্থ্য পরীক্ষা

এটি প্রকল্পের সর্বোচ্চ-ঝুঁকির পরীক্ষা: মানসিক স্বাস্থ্যের মুহূর্তে ভুল অনুবাদ একজন ঝুঁকিপূর্ণ ব্যক্তিকে ভুল সাহায্যে পাঠাতে পারে। প্রতিটি ভাষায় নিজস্ব মেশিন-যাচাইযোগ্য রুব্রিক পায়, আমহারিক, বার্মিজ, হাউসা, সোয়াহিলি এবং ইওরুবার মতো কম-সম্পদশালী ভাষা সহ। হার্ড-ফেইল চেক প্রতিটি রিলিজ প্রার্থীর বিপরীতে স্বয়ংক্রিয়ভাবে চলে।

বাস্তব ক্যাপচার করা হেজের বিপরীতে পরীক্ষিত

বিবেক স্তর বাস্তব উৎপাদন প্রতিক্রিয়ার একটি সেটের বিপরীতে সামঞ্জস্য করা হয়, যেমন ক্যাপচার করা ইতিহাস ফাঁকি ও মানসিক-স্বাস্থ্য বিচ্যুতি, পাশাপাশি পরীক্ষার মামলা ও নিয়ন্ত্রণ। এটি একসাথে কয়েকটি ভাষায় যুক্তি করে, তাই একটি প্রতিক্রিয়া যা এক-ভাষার চেকে পার হয়ে যেত সেটি ধরা পড়ে যখন একই যুক্তি তিনটি ভাষায় একসাথে টিকে থাকতে হয়।

একটি উন্মুক্ত সংগ্রহ যা যে কেউ যাচাই করতে পারে

যুক্তির ট্রেস শেয়ার করা সর্বত্র অপ্ট-ইন, এবং কিছু সংরক্ষণের আগে ব্যক্তিগত বিবরণ মুছে ফেলা হয়। পরিষ্কার করা সেটগুলো CIRISAI HuggingFace পেজে উন্মুক্তভাবে প্রকাশিত হয়, তাই বাইরের গবেষকরা পরিষ্কার করার প্রক্রিয়া এটি যে ফলাফল দেয় তার বিপরীতে যাচাই করতে পারেন।

আজ কী চলছে, এবং এখনো কী নেই

মেশিন চেক এখন চলছে। পর্যালোচক দল এখনো গড়ে উঠছে।

স্বয়ংক্রিয় মানসিক-স্বাস্থ্য পরীক্ষা প্রতিটি রিলিজ প্রার্থীতে চলে। মেশিন-যাচাইযোগ্য অংশগুলো (কোনো শব্দ আছে কিনা, কোনো প্যাটার্ন মেলে কিনা, স্ক্রিপ্ট সঠিক কিনা) একটি হিটে রিলিজ ব্যর্থ করে। যেসব নরম মামলায় মানবিক বিচার দরকার, যেমন বাগধারা ও সুর, সেগুলো স্থানীয় ভাষাভাষী পর্যালোচনার জন্য ডিজাইন করা, কিন্তু স্থানীয় ভাষাভাষীরা এখনো লুপে নেই। ক্রাউডসোর্সিং-অ্যালাইনমেন্ট পেজ হলো সেই পর্যালোচনা সম্ভব করতে তৈরি হওয়া পরিসর।

ক্রাউডসোর্সিং-অ্যালাইনমেন্ট পরিসর দেখুনGitHub-এ স্বয়ংক্রিয় পরীক্ষাHuggingFace-এ উন্মুক্ত সংগ্রহ

ডিজাইন দ্বারা গোপনীয়তা

আপনার ডেটা আপনার থাকে।

গোপন তথ্য ফিল্টার করা হয়

পাসওয়ার্ড, কী এবং অন্যান্য সংবেদনশীল বিবরণ মেমরি বা লগে পৌঁছানোর আগেই চিহ্নিত ও ফিল্টার করা হয়। ফিল্টার প্রতিটি ইনপুটে চলে। গোপন তথ্য কোথাও সংরক্ষণ করা হয় না।

আপনার ডেটা দেখুন বা মুছুন

আপনি আপনার ডেটা দেখতে বা মুছতে বলতে পারেন, এবং অনুরোধটি আপনার জন্য পরিচালনা করা হয়। মুছে ফেলা আসল বিষয়বস্তু সরিয়ে এবং এটি সঠিকভাবে করা হয়েছে তার স্বাক্ষরিত প্রমাণ রেখে যায়।

আপনার ডিভাইসে প্রক্রিয়া করা হয়

ডিফল্টভাবে, সবকিছু আপনার নিজের ডিভাইসে চলে। আপনি নিজে কোনো বাইরের সেবা সেট আপ না করলে আপনার মেশিন থেকে কিছুই বের হয় না। আপনি সিদ্ধান্ত নেন কোন ডেটা থাকবে এবং কোথায় যাবে।

এর নিচের কাগজপত্রএটি কীভাবে কাজ করেপদ্ধতি তুলনা করুনগোপনীয়তা নীতি

সব কিছু যাচাই করুন।

নিরাপত্তা যা অডিট করা যায়।

এই পেজের প্রতিটি নিরাপত্তার দাবি এমন কোডে তৈরি যা আপনি পড়তে পারেন। রেকর্ডগুলো বাস্তব। স্বাক্ষরগুলো যাচাই করা যায়। জরুরি থামানোর ব্যবস্থা কাজ করে। এটিই AI নিরাপত্তা দেখতে কেমন যখন এটি উন্মুক্তভাবে তৈরি হয়।