CIRIS Agent သည် မဖြစ်မနေလိုအပ်သော စံနှုန်းငါးချက်ကို ပြည့်မီသော ပွင့်လင်းသောမော်ဒယ်အနည်းငယ်ပေါ်တွင် လည်ပတ်သည်။ လက်ရှိ production lineup မှာ Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, နှင့် Gemma 4 တို့ဖြစ်ပြီး၊ agent ၏ workload ၌ မတူညီသောအခန်းကဏ္ဍများအတွက် ရွေးချယ်ထားသည်။
အဓိက အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်သည့်မော်ဒယ်။ အလွန်ကြီးမားသော context ကို တစ်ချိန်တည်းတွင် ဆုပ်ကိုင်ထားနိုင်သောကြောင့်၊ တစ်ခုလုံးကို မြင်သာစေမှု အရေးဆုံးဖြစ်သော နက်ရှိုင်းသောအကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုအဆင့်များတွင် မူရင်းအဖြစ် သုံးသည်။
ဝန်ဆောင်မှုပေးသူများ: OpenRouter, Groq, Together, DeepInfra
Llama 4 မိသားစုရှိ လျင်မြန်သောအဖော်။ Maverick ထက် ပိုသေးငယ်ပြီး ပိုမြန်ကာ tool calling ကောင်းမွန်သည်။ Maverick ၏ context ဘတ်ဂျက် အပြည့်မလိုသောနှင့် latency အရေးကြီးသော interactive tier များတွင် သုံးသည်။
ဝန်ဆောင်မှုပေးသူများ: OpenRouter, Groq
ဘာသာစကားစုံနှင့် ခိုင်မာသော structured output။ polyglot Accord လိုအပ်သော အင်္ဂလိပ်မဟုတ်သော အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုလမ်းကြောင်းများတွင် ကူညီထမ်းဆောင်သည်၊ Llama မိသားစုနှင့် မဆိုင်သော သီးခြားဝန်ဆောင်မှုပေးသူ base သည် fallback chain ၌ redundancy ထည့်သွင်းသည်။
ဝန်ဆောင်မှုပေးသူများ: OpenRouter, DashScope, DeepInfra
commodity hardware ပေါ်တွင် လည်ပတ်နိုင်လောက်သောကြီးမားမှု။ raw capacity ထက် reach ပိုအရေးကြီးသော (on-device, low-bandwidth, နှင့် network ချို့တဲ့သော) deployment များတွင် နှင့် Llama နှင့် Qwen နှင့်အတူ third-family fallback အဖြစ် သုံးသည်။
ဝန်ဆောင်မှုပေးသူများ: OpenRouter, Google
Interaction တစ်ခုတွင် tool call ၁၂ မှ ၇၀ ကြားအတွင်း function calling ကို ပင်ကိုပံ့ပိုးကာ valid JSON ပြန်ပေးရမည်။ CIRIS သည် orchestrator တစ်ခုဖြစ်သည်။ ကျွန်တော်တို့ chatty conversation မဟုတ်ဘဲ တည်ငြိမ်သော tool semantics လိုသည်။
CIRIS သည် Accord နှင့် Guide အပြည့်ကို prompt တိုင်းတွင် ထည့်သွင်းသည်။ 128K သည် အနည်းဆုံး၊ ရှည်လျားသောစကားဝိုင်း၊ tool output များ နှင့် audit trail များအတွက် 256K+ ကို များစွာနှစ်သက်သည်။
ပစ်မှတ်: token ၁M ပေါင်းစပ်ကုန်ကျ $1.00 အောက်။ ကျွန်တော်တို့ benchmark winner အကောင်းဆုံးမဟုတ်ဘဲ အလုပ်ဖြစ်သော အသက်သာဆုံးနည်းလမ်းကို ရွေးသည်။ JSON ဘယ်တော့မမကျိုးသော ယုံကြည်ရသောမော်ဒယ်သည် ၁၀ ကြိမ်တွင် ၁ ကြိမ် ကျရှုံးသော ဈေးသာသောမော်ဒယ်ထက် ပိုကောင်းသည်။
ခိုင်မာသော fallback chain များအတွက် သီးခြားဝန်ဆောင်မှုပေးသူ အနည်းဆုံးနှစ်ခုမှ ရရှိနိုင်ရမည်။ CIRIS သည် outage များအတွင်း hard fail မဖြစ်ဘဲ gracefully degradation ဖြစ်သည်။
Response မြန်ဆန်မှုသည် လူများကို ethical review workflow များတွင် loop ၌ ထိန်းထားနိုင်သည်။ background task များအတွက် နှေးသော backend ကို လက်ခံနေချိန်၌ interactive tier များတွင် low-latency ဝန်ဆောင်မှုပေးသူများကို ဦးစားပေးသည်။
Llama 4 Maverick ကို cost-optimized ဝန်ဆောင်မှုပေးသူမှတဆင့် context ဘတ်ဂျက်အပြည့်လိုသော နက်ရှိုင်းသောအကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုအဆင့်များအတွက် သုံးသည်။
Llama 4 Scout ကို speed-optimized ဝန်ဆောင်မှုပေးသူ (Groq) မှတဆင့် interactive use အတွက် သုံးကာ၊ Maverick on Groq ကို context ပိုကြီးသော alternative အဖြစ် သုံးသည်။
Qwen 3.6 သည် polyglot Accord လိုသော အင်္ဂလိပ်မဟုတ်သော အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုလမ်းကြောင်းများတွင် ကူညီထမ်းဆောင်ပြီး chain ၌ non-Llama fallback ပေးသည်။
Gemma 4 ကို မော်ဒယ်အရွယ်ထက် သုံးစွဲသူဆီ ရောက်ရှိမှု ပိုအရေးကြီးသော on-device, low-bandwidth နှင့် network ချို့တဲ့သော deployment များတွင် သုံးသည်။
Maverick → Scout → Qwen 3.6 → Gemma 4 ကို ဝန်ဆောင်မှုပေးသူများစွာမှတဆင့်၊ agent သည် hard fail မဖြစ်ဘဲ မော်ဒယ်မိသားစုများနှင့် infrastructure နယ်နိမိတ်များကြားတွင် gracefully degradation ဖြစ်သည်။
Maverick သည် context ဘတ်ဂျက်အပြည့်အရေးကြီးသော နက်ရှိုင်းသောအကြောင်းအရင်းဆင်ခြင်ကို ဆောင်ရွက်သည်။ Scout သည် latency ဦးဆောင်သော interactive tier ကို သယ်ဆောင်သည်။ Qwen 3.6 သည် Accord ၂၉ ဘာသာစကားတွင် လိုသော polyglot အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုလမ်းကြောင်းများဆီ ရောက်သည်။ Gemma 4 သည် agent ကို commodity hardware ဆီ ရောက်နိုင်သော small-footprint နည်းလမ်းဖြစ်သည်။ Lineup ကို မတူညီသော tier များ၏ work သည် တစ်ခုတည်းသောမော်ဒယ်ကို အားလုံးလုပ်ခိုင်းမည့်အစား အမှန်တကယ်ကိုက်ညီသောမော်ဒယ်ဆီ သွားရောက်သည့်ပုံစံဖြင့် ရွေးထားသည်။
Llama (Maverick + Scout), Qwen နှင့် Gemma တို့သည် သီးခြားသင်တန်း pipeline သုံးခုနှင့် သီးခြားဝန်ဆောင်မှုပေးသူ ecosystem သုံးခုမှ ဆင်းသက်သည်။ fallback chain များအတွက် ၎င်းသည် အရေးကြီးသည်: မိသားစုတစ်ခုတွင် CVE, လိုင်စင်ပြောင်းလဲမှု သို့မဟုတ် ဝန်ဆောင်မှုပေးသူ outage တစ်ခု ဖြစ်ပေါ်သော်လည်း agent ကို ကျဆင်းမသွားစေပါ။ မော်ဒယ် layer တွင် independence သည် IDMA component ကို reasoning layer တွင် ခိုင်မာစေသော property နှင့်တူညီသည်။
စံနှုန်းငါးချက်ကို မပြည့်မီနိုင်သောမော်ဒယ်များ၊ အများအားဖြင့် token ဈေးနှုန်းတွင် ဆွဲဆောင်မှုရှိသော်လည်း structured output နှင့် tool calling တွင် ကျရှုံးသောမော်ဒယ်များ။
ကိုယ်စားပြုသည့် ကျရှုံးမှုပုံစံ (GPT-OSS-20B): "tool choice လိုအပ်သည်၊ သို့သော် မော်ဒယ်သည် tool ကို မခေါ်ဆောင်ဘူး"
Interaction တစ်ခုတွင် tool call ၁၂ မှ ၇၀ ပေါ်မူတည်သောframework တစ်ခုအတွက် ဤ error ကို လက်ခံ၍မရ။ token ဈေးနှုန်း ၃ မှ ၁၀ ဆပင် ပိုသက်သာသော်လည်း operational ကျရှုံးမှုများသည် မကောင်းပါ။
CIRIS သည် Accord အပြည့် နှင့် Comprehensive Guide တစ်ခုလုံးကို prompt တိုင်းတွင် ထည့်သွင်းသည်။ အနှစ်ချုပ်မဟုတ်။ ကျုပ်ထုတ်နှုတ်ထားသောဗားရှင်းမဟုတ်။ governance စာသားတစ်ခုလုံး။
ဤနည်းဖြင့် Accord သို့မဟုတ် Guide ကို အဆင့်မြှင့်သောအခါ၊ fine-tune သစ် သို့မဟုတ် prompt compression strategy များကို စောင့်ဆိုင်းမနေဘဲ agent အားလုံးတွင် ချက်ချင်းသက်ရောက်မှုဖြစ်သည်။
CIRIS Agent များသည် အောက်ပါတို့ကို ပြိုင်တဆက်ဆောင်ရွက်သော tool-heavy orchestrator များဖြစ်သည်:
ဒီပေါင်းစပ် context သည် ရှည်လျားသော session များ သို့မဟုတ် ရှုပ်ထွေးသော investigation များတွင် 32K-64K ကို လွယ်လင့်တကူ ကျော်လွန်သည်။ ထို့ကြောင့် 128K သည် အနည်းဆုံးဖြစ်ပြီး 256K+ ကို နှစ်သက်သည်။
အနှစ်ချုပ်:
CIRIS သည် မော်ဒယ်ကို ကိုက်ညီစေရန် ၎င်း၏တန်ဖိုးများ သို့မဟုတ် လုပ်ထုံးလုပ်နည်းများကို ဖြတ်တောက်မည်မဟုတ်။ ယင်းအစား CIRIS သည် call တိုင်းတွင် ethical နှင့် operational framework တစ်ခုလုံးကို သယ်ဆောင်နိုင်လောက်သောကြီးမားသောမော်ဒယ်များကို ရွေးသည်။ context window ပိုသေးသောမော်ဒယ်များ (ပိုသက်သာပြီး ပိုနာမည်ကြီးသော်လည်း) ကို production use မှ ဖယ်ထားသည်။
CIRIS သည် Llama 4 Maverick, Llama 4 Scout, Qwen 3.6 နှင့် Gemma 4 တို့ကို production တွင် လည်ပတ်သောကြောင့် Accord သတ်မှတ်သော operational နှင့် economic constraint များကို တစ်ပါတည်း ဖြည့်ဆည်းနိုင်သည်: long context, ယုံကြည်ရသော tool calling, polyglot coverage နှင့် commodity hardware ဆီ ရောက်ရှိမှု၊ သီးခြားမော်ဒယ်မိသားစုသုံးခုမှတဆင့်။ မော်ဒယ်သစ်များကို ဆက်တိုက်စောင့်ကြည့်စစ်ဆေးသည်၊ ပိုကောင်းသောအရာသည် စံနှုန်းငါးချက်ကို အမှန်တကယ်ဖြည့်မီသည့်အခါ lineup ပြောင်းသည်။
ဒါသည် benchmark အမှတ်များကို လိုက်ခြေရာခံခြင်း သို့မဟုတ် hype cycle ကို လိုက်နာခြင်းမဟုတ်ပါ။ production ၌ accountable, tool-centric agent များအတွက် အမှန်တကယ်အလုပ်ဖြစ်ပြီး call တိုင်းတွင် Accord ကို သယ်ဆောင်ရန် လုံလောက်သောလေးစားမှုရှိသောမော်ဒယ်များကို ရွေးခြင်းဖြစ်သည်။