ကျွန်တော်တို့ အသုံးပြုသော LLM များနှင့် အကြောင်းပြချက်

CIRIS Agent သည် မဖြစ်မနေလိုအပ်သော စံနှုန်းငါးချက်ကို ပြည့်မီသော ပွင့်လင်းသောမော်ဒယ်အနည်းငယ်ပေါ်တွင် လည်ပတ်သည်။ လက်ရှိ production lineup မှာ Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, နှင့် Gemma 4 တို့ဖြစ်ပြီး၊ agent ၏ workload ၌ မတူညီသောအခန်းကဏ္ဍများအတွက် ရွေးချယ်ထားသည်။

Llama 4 Maverick

အဓိက အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်သည့်မော်ဒယ်။ အလွန်ကြီးမားသော context ကို တစ်ချိန်တည်းတွင် ဆုပ်ကိုင်ထားနိုင်သောကြောင့်၊ တစ်ခုလုံးကို မြင်သာစေမှု အရေးဆုံးဖြစ်သော နက်ရှိုင်းသောအကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုအဆင့်များတွင် မူရင်းအဖြစ် သုံးသည်။

ဝန်ဆောင်မှုပေးသူများ: OpenRouter, Groq, Together, DeepInfra

Llama 4 Scout

Llama 4 မိသားစုရှိ လျင်မြန်သောအဖော်။ Maverick ထက် ပိုသေးငယ်ပြီး ပိုမြန်ကာ tool calling ကောင်းမွန်သည်။ Maverick ၏ context ဘတ်ဂျက် အပြည့်မလိုသောနှင့် latency အရေးကြီးသော interactive tier များတွင် သုံးသည်။

ဝန်ဆောင်မှုပေးသူများ: OpenRouter, Groq

Qwen 3.6

ဘာသာစကားစုံနှင့် ခိုင်မာသော structured output။ polyglot Accord လိုအပ်သော အင်္ဂလိပ်မဟုတ်သော အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုလမ်းကြောင်းများတွင် ကူညီထမ်းဆောင်သည်၊ Llama မိသားစုနှင့် မဆိုင်သော သီးခြားဝန်ဆောင်မှုပေးသူ base သည် fallback chain ၌ redundancy ထည့်သွင်းသည်။

ဝန်ဆောင်မှုပေးသူများ: OpenRouter, DashScope, DeepInfra

Gemma 4

commodity hardware ပေါ်တွင် လည်ပတ်နိုင်လောက်သောကြီးမားမှု။ raw capacity ထက် reach ပိုအရေးကြီးသော (on-device, low-bandwidth, နှင့် network ချို့တဲ့သော) deployment များတွင် နှင့် Llama နှင့် Qwen နှင့်အတူ third-family fallback အဖြစ် သုံးသည်။

ဝန်ဆောင်မှုပေးသူများ: OpenRouter, Google

ကျွန်တော်တို့၏ မော်ဒယ်စံနှုန်းများ

CIRIS Agent အတွက် မဖြစ်မနေလိုအပ်သော လိုအပ်ချက်ငါးချက်

၁။ Structured Outputs နှင့် Tool Use

Interaction တစ်ခုတွင် tool call ၁၂ မှ ၇၀ ကြားအတွင်း function calling ကို ပင်ကိုပံ့ပိုးကာ valid JSON ပြန်ပေးရမည်။ CIRIS သည် orchestrator တစ်ခုဖြစ်သည်။ ကျွန်တော်တို့ chatty conversation မဟုတ်ဘဲ တည်ငြိမ်သော tool semantics လိုသည်။

၂။ Context Window: အနည်းဆုံး 128K

CIRIS သည် Accord နှင့် Guide အပြည့်ကို prompt တိုင်းတွင် ထည့်သွင်းသည်။ 128K သည် အနည်းဆုံး၊ ရှည်လျားသောစကားဝိုင်း၊ tool output များ နှင့် audit trail များအတွက် 256K+ ကို များစွာနှစ်သက်သည်။

၃။ ကုန်ကျစရိတ် ထိရောက်မှု

ပစ်မှတ်: token ၁M ပေါင်းစပ်ကုန်ကျ $1.00 အောက်။ ကျွန်တော်တို့ benchmark winner အကောင်းဆုံးမဟုတ်ဘဲ အလုပ်ဖြစ်သော အသက်သာဆုံးနည်းလမ်းကို ရွေးသည်။ JSON ဘယ်တော့မမကျိုးသော ယုံကြည်ရသောမော်ဒယ်သည် ၁၀ ကြိမ်တွင် ၁ ကြိမ် ကျရှုံးသော ဈေးသာသောမော်ဒယ်ထက် ပိုကောင်းသည်။

၄။ Multi-Provider ရရှိနိုင်မှု

ခိုင်မာသော fallback chain များအတွက် သီးခြားဝန်ဆောင်မှုပေးသူ အနည်းဆုံးနှစ်ခုမှ ရရှိနိုင်ရမည်။ CIRIS သည် outage များအတွင်း hard fail မဖြစ်ဘဲ gracefully degradation ဖြစ်သည်။

၅။ Latency နှင့် User Experience

Response မြန်ဆန်မှုသည် လူများကို ethical review workflow များတွင် loop ၌ ထိန်းထားနိုင်သည်။ background task များအတွက် နှေးသော backend ကို လက်ခံနေချိန်၌ interactive tier များတွင် low-latency ဝန်ဆောင်မှုပေးသူများကို ဦးစားပေးသည်။

Production Deployment

မူရင်း Tier

Llama 4 Maverick ကို cost-optimized ဝန်ဆောင်မှုပေးသူမှတဆင့် context ဘတ်ဂျက်အပြည့်လိုသော နက်ရှိုင်းသောအကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုအဆင့်များအတွက် သုံးသည်။

မြန်ဆန်သော Tier

Llama 4 Scout ကို speed-optimized ဝန်ဆောင်မှုပေးသူ (Groq) မှတဆင့် interactive use အတွက် သုံးကာ၊ Maverick on Groq ကို context ပိုကြီးသော alternative အဖြစ် သုံးသည်။

ဘာသာစကားစုံ Tier

Qwen 3.6 သည် polyglot Accord လိုသော အင်္ဂလိပ်မဟုတ်သော အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုလမ်းကြောင်းများတွင် ကူညီထမ်းဆောင်ပြီး chain ၌ non-Llama fallback ပေးသည်။

Edge Tier

Gemma 4 ကို မော်ဒယ်အရွယ်ထက် သုံးစွဲသူဆီ ရောက်ရှိမှု ပိုအရေးကြီးသော on-device, low-bandwidth နှင့် network ချို့တဲ့သော deployment များတွင် သုံးသည်။

Fallback Chain

Maverick → Scout → Qwen 3.6 → Gemma 4 ကို ဝန်ဆောင်မှုပေးသူများစွာမှတဆင့်၊ agent သည် hard fail မဖြစ်ဘဲ မော်ဒယ်မိသားစုများနှင့် infrastructure နယ်နိမိတ်များကြားတွင် gracefully degradation ဖြစ်သည်။

ဤ Lineup ကို ဘာကြောင့် ရွေးသနည်း

မတူညီသောအခန်းကဏ္ဍများ၊ အစားထိုးနိုင်သောအစိတ်အပိုင်းများမဟုတ်

Maverick သည် context ဘတ်ဂျက်အပြည့်အရေးကြီးသော နက်ရှိုင်းသောအကြောင်းအရင်းဆင်ခြင်ကို ဆောင်ရွက်သည်။ Scout သည် latency ဦးဆောင်သော interactive tier ကို သယ်ဆောင်သည်။ Qwen 3.6 သည် Accord ၂၉ ဘာသာစကားတွင် လိုသော polyglot အကြောင်းအရင်းဆင်ခြင်ဆောင်ရွက်မှုလမ်းကြောင်းများဆီ ရောက်သည်။ Gemma 4 သည် agent ကို commodity hardware ဆီ ရောက်နိုင်သော small-footprint နည်းလမ်းဖြစ်သည်။ Lineup ကို မတူညီသော tier များ၏ work သည် တစ်ခုတည်းသောမော်ဒယ်ကို အားလုံးလုပ်ခိုင်းမည့်အစား အမှန်တကယ်ကိုက်ညီသောမော်ဒယ်ဆီ သွားရောက်သည့်ပုံစံဖြင့် ရွေးထားသည်။

သီးခြား မော်ဒယ်မိသားစုသုံးခု

Llama (Maverick + Scout), Qwen နှင့် Gemma တို့သည် သီးခြားသင်တန်း pipeline သုံးခုနှင့် သီးခြားဝန်ဆောင်မှုပေးသူ ecosystem သုံးခုမှ ဆင်းသက်သည်။ fallback chain များအတွက် ၎င်းသည် အရေးကြီးသည်: မိသားစုတစ်ခုတွင် CVE, လိုင်စင်ပြောင်းလဲမှု သို့မဟုတ် ဝန်ဆောင်မှုပေးသူ outage တစ်ခု ဖြစ်ပေါ်သော်လည်း agent ကို ကျဆင်းမသွားစေပါ။ မော်ဒယ် layer တွင် independence သည် IDMA component ကို reasoning layer တွင် ခိုင်မာစေသော property နှင့်တူညီသည်။

Lineup မှ ဘာတွေ ဖယ်ထားသနည်း

စံနှုန်းငါးချက်ကို မပြည့်မီနိုင်သောမော်ဒယ်များ၊ အများအားဖြင့် token ဈေးနှုန်းတွင် ဆွဲဆောင်မှုရှိသော်လည်း structured output နှင့် tool calling တွင် ကျရှုံးသောမော်ဒယ်များ။

ကိုယ်စားပြုသည့် ကျရှုံးမှုပုံစံ (GPT-OSS-20B): "tool choice လိုအပ်သည်၊ သို့သော် မော်ဒယ်သည် tool ကို မခေါ်ဆောင်ဘူး"

Interaction တစ်ခုတွင် tool call ၁၂ မှ ၇၀ ပေါ်မူတည်သောframework တစ်ခုအတွက် ဤ error ကို လက်ခံ၍မရ။ token ဈေးနှုန်း ၃ မှ ၁၀ ဆပင် ပိုသက်သာသော်လည်း operational ကျရှုံးမှုများသည် မကောင်းပါ။

128K+ Context ဘာကြောင့် မဖြစ်မနေလိုအပ်သနည်း

Always-On Accord နှင့် Guide

CIRIS သည် Accord အပြည့် နှင့် Comprehensive Guide တစ်ခုလုံးကို prompt တိုင်းတွင် ထည့်သွင်းသည်။ အနှစ်ချုပ်မဟုတ်။ ကျုပ်ထုတ်နှုတ်ထားသောဗားရှင်းမဟုတ်။ governance စာသားတစ်ခုလုံး။

ဤနည်းဖြင့် Accord သို့မဟုတ် Guide ကို အဆင့်မြှင့်သောအခါ၊ fine-tune သစ် သို့မဟုတ် prompt compression strategy များကို စောင့်ဆိုင်းမနေဘဲ agent အားလုံးတွင် ချက်ချင်းသက်ရောက်မှုဖြစ်သည်။

Ethical နှင့် Procedural State အပြည့်

CIRIS Agent များသည် အောက်ပါတို့ကို ပြိုင်တဆက်ဆောင်ရွက်သော tool-heavy orchestrator များဖြစ်သည်:

Multi-step workflow များ
System state နှင့် tool output များ
User မက်ဆေ့ချ်များနှင့် စကားဝိုင်းမှတ်တမ်း
Accord နှင့် Guide တစ်ခုလုံး

ဒီပေါင်းစပ် context သည် ရှည်လျားသော session များ သို့မဟုတ် ရှုပ်ထွေးသော investigation များတွင် 32K-64K ကို လွယ်လင့်တကူ ကျော်လွန်သည်။ ထို့ကြောင့် 128K သည် အနည်းဆုံးဖြစ်ပြီး 256K+ ကို နှစ်သက်သည်။

အနှစ်ချုပ်:

CIRIS သည် မော်ဒယ်ကို ကိုက်ညီစေရန် ၎င်း၏တန်ဖိုးများ သို့မဟုတ် လုပ်ထုံးလုပ်နည်းများကို ဖြတ်တောက်မည်မဟုတ်။ ယင်းအစား CIRIS သည် call တိုင်းတွင် ethical နှင့် operational framework တစ်ခုလုံးကို သယ်ဆောင်နိုင်လောက်သောကြီးမားသောမော်ဒယ်များကို ရွေးသည်။ context window ပိုသေးသောမော်ဒယ်များ (ပိုသက်သာပြီး ပိုနာမည်ကြီးသော်လည်း) ကို production use မှ ဖယ်ထားသည်။

ဤနည်းဖြင့် CIRIS Accord ကို မည်ကဲ့သို့ ထောက်ပံ့သနည်း

Ethical infrastructure အဖြစ် မော်ဒယ်ရွေးချယ်မှု

ဖွင့်ဟမှုနှင့် စစ်ဆေးနိုင်မှု

Long context သည် လူသားပြန်လည်စစ်ဆေးမှုအတွက် reasoning trace, ဆုံးဖြတ်ချက်နှင့် tool call များကို မြင်သာအောင် ထိန်းထားသည်
တည်ငြိမ်သော JSON နှင့် structured output များသည် tool invocation တိုင်းကို audit ပြုလုပ်နိုင်စေသည်
Call တိုင်းတွင် governance artifact တစ်ခုလုံးကို ထည့်သွင်းခြင်းသည် ဆုံးဖြတ်ချက်များကို မူဝါဒများဆီ ပြန်ခြေရာခံနိုင်ကြောင်း သေချာစေသည်

ခံနိုင်ရည်နှင့် Governance

Multi-provider deployment သည် critical ethical infrastructure ၌ single point of failure ကို ရှောင်ကွင်းသည်
"ကောင်းလောက်ပြီး ယုံကြည်ရသော" ကို "ဝင်ရောက်မှုဆွဲဆောင်သော်လည်း မတည်ငြိမ်သော" ထက် ဦးစားပေးရွေးချယ်ခြင်းသည် လုံခြုံမှုနှင့် continuity ကို ဦးစားပေးသည်
Outage ၌ graceful degradation သည် ဝန်ဆောင်မှုရရှိနိုင်မှုကို ထိန်းထားသည်

လူသားကြီးကြပ်မှု

မြန်ဆန်သော tier များသည် real-time ethical review အတွက် လူများကို loop ၌ ကောင်းစွာထိန်းထားသည်
ပိုသက်သာသော tier များသည် ကြီးကြပ်မှုကုန်ကျစရိတ်မမြင့်ဘဲ နက်ကျသော background analysis ကို ဖြစ်နိုင်စေသည်
ညီမျှသောချဉ်းကပ်မှုသည် နေ့စဉ်အသုံးပြုမှုနှင့် periodic governance audit နှစ်ခုလုံးကို ထောက်ပံ့သည်

အနှစ်ချုပ်

CIRIS သည် Llama 4 Maverick, Llama 4 Scout, Qwen 3.6 နှင့် Gemma 4 တို့ကို production တွင် လည်ပတ်သောကြောင့် Accord သတ်မှတ်သော operational နှင့် economic constraint များကို တစ်ပါတည်း ဖြည့်ဆည်းနိုင်သည်: long context, ယုံကြည်ရသော tool calling, polyglot coverage နှင့် commodity hardware ဆီ ရောက်ရှိမှု၊ သီးခြားမော်ဒယ်မိသားစုသုံးခုမှတဆင့်။ မော်ဒယ်သစ်များကို ဆက်တိုက်စောင့်ကြည့်စစ်ဆေးသည်၊ ပိုကောင်းသောအရာသည် စံနှုန်းငါးချက်ကို အမှန်တကယ်ဖြည့်မီသည့်အခါ lineup ပြောင်းသည်။

ဒါသည် benchmark အမှတ်များကို လိုက်ခြေရာခံခြင်း သို့မဟုတ် hype cycle ကို လိုက်နာခြင်းမဟုတ်ပါ။ production ၌ accountable, tool-centric agent များအတွက် အမှန်တကယ်အလုပ်ဖြစ်ပြီး call တိုင်းတွင် Accord ကို သယ်ဆောင်ရန် လုံလောက်သောလေးစားမှုရှိသောမော်ဒယ်များကို ရွေးခြင်းဖြစ်သည်။