CIRIS Agent ఐదు తప్పనిసరి అవసరాలు తీర్చే కొన్ని ఓపెన్ మోడళ్ళపై పనిచేస్తుంది. ప్రస్తుత ప్రొడక్షన్ లైనప్లో Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, మరియు Gemma 4 ఉన్నాయి. ఏజెంట్ పనిభారంలో వివిధ పాత్రల కోసం ఇవి ఎంచుకోబడ్డాయి.
తర్కం చేసే ప్రధాన మోడల్. ఒకే సమయంలో చాలా పెద్ద కంటెక్స్ట్ను ధరించగలదు, కాబట్టి మొత్తం చిత్రాన్ని చూడటం చాలా అవసరమయ్యే లోతైన తర్కం దశలలో ఇది డిఫాల్ట్ ఎంపిక.
ప్రొవైడర్లు: OpenRouter, Groq, Together, DeepInfra
Llama 4 కుటుంబంలో వేగవంతమైన సహచరుడు. Maverick కంటే చిన్నది మరియు వేగంగా ఉంటుంది, బలమైన టూల్ కాలింగ్తో. లేటెన్సీ ముఖ్యమైన మరియు Maverick యొక్క పూర్తి కంటెక్స్ట్ బడ్జెట్ అవసరం లేని ఇంటరాక్టివ్ టైర్ల కోసం ఉపయోగించబడుతుంది.
ప్రొవైడర్లు: OpenRouter, Groq
బహుభాషా లోతు మరియు బలమైన నిర్మాణాత్మక అవుట్పుట్. పాలిగ్లాట్ ఒప్పందం అవసరమయ్యే ఆంగ్లేతర తర్కం మార్గాలలో భారాన్ని మోస్తుంది; Llama కుటుంబానికి వెలుపల స్వతంత్ర ప్రొవైడర్ బేస్ ఫాల్బ్యాక్ చైన్లో అదనపు స్థితిస్థాపకత అందిస్తుంది.
ప్రొవైడర్లు: OpenRouter, DashScope, DeepInfra
సాధారణ హార్డ్వేర్పై పనిచేయడానికి తగినంత చిన్నది. సామర్థ్యం కంటే చేరుకోవడం ముఖ్యమయ్యే చోట (ఆన్-డివైస్, తక్కువ-బ్యాండ్విడ్త్, మరియు అధోగతి నెట్వర్క్ వ్యాప్తులు) మరియు Llama మరియు Qwen పక్కన మూడో కుటుంబం ఫాల్బ్యాక్గా ఉపయోగించబడుతుంది.
ప్రొవైడర్లు: OpenRouter, Google
ప్రతి ఇంటరాక్షన్లో 12-70 టూల్ కాల్స్ అంతటా నేటివ్గా ఫంక్షన్ కాలింగ్ మద్దతు ఇచ్చి చెల్లుబాటయ్యే JSON తిరిగి ఇవ్వాలి. CIRIS ఒక ఆర్కెస్ట్రేటర్. మాకు స్థిరమైన టూల్ సెమాంటిక్స్ కావాలి, గప్పాలు కాదు.
CIRIS ప్రతి ప్రాంప్ట్లో పూర్తి ఒప్పందం మరియు గైడ్ను పొందుపరుస్తుంది. 128K అనేది సంపూర్ణ కనిష్ఠం; 256K+ సుదీర్ఘ సంభాషణలు, టూల్ అవుట్పుట్లు, మరియు ఆడిట్ ట్రెయిల్స్ కోసం ఖచ్చితంగా ఇష్టపడతారు.
లక్ష్యం: 1M టోకెన్ల మిళితానికి $1.00 కంటే తక్కువ. మేము చౌకైన బెంచ్మార్క్ విజేతను కాకుండా అత్యంత చౌకైన పని చేసే ఎంపికను ఎంచుకుంటాం. JSON ఎప్పుడూ విఫలం కాని నమ్మకమైన మోడల్ 10లో 1 కాల్ విఫలమయ్యే చౌకైన మోడల్ కంటే మెరుగు.
బలమైన ఫాల్బ్యాక్ చైన్ల కోసం కనీసం రెండు స్వతంత్ర ప్రొవైడర్ల నుండి అందుబాటులో ఉండాలి. CIRIS అంతరాయాల సమయంలో కఠినంగా విఫలమవ్వడానికి బదులు సజావుగా తగ్గుముఖం పడుతుంది.
వేగవంతమైన ప్రతిస్పందనలు నైతిక సమీక్షా వర్క్ఫ్లోలలో మానవులను చురుకుగా ఉంచుతాయి. మేము నేపథ్య పనులకు నెమ్మదైన బ్యాకెండ్లను అంగీకరిస్తూ ఇంటరాక్టివ్ టైర్లకు తక్కువ-లేటెన్సీ ప్రొవైడర్లకు ప్రాధాన్యత ఇస్తాం.
పూర్తి కంటెక్స్ట్ బడ్జెట్ అవసరమయ్యే లోతైన-తర్కం దశల కోసం ఖర్చు-అనుకూల ప్రొవైడర్ ద్వారా Llama 4 Maverick.
ఇంటరాక్టివ్ వినియోగం కోసం వేగం-అనుకూల ప్రొవైడర్ (Groq) ద్వారా Llama 4 Scout, మరియు భారీ-కంటెక్స్ట్ ప్రత్యామ్నాయంగా Groq-లో Maverick.
పాలిగ్లాట్ ఒప్పందం అవసరమయ్యే ఆంగ్లేతర తర్కం మార్గాలలో Qwen 3.6 భారాన్ని మోస్తుంది మరియు చైన్లో Llama-కాని ఫాల్బ్యాక్ అందిస్తుంది.
మోడల్ పరిమాణం కంటే వినియోగదారుకు చేరుకోవడం ముఖ్యమయ్యే ఆన్-డివైస్, తక్కువ-బ్యాండ్విడ్త్, మరియు అధోగతి-నెట్వర్క్ వ్యాప్తుల కోసం Gemma 4.
Maverick → Scout → Qwen 3.6 → Gemma 4 బహుళ ప్రొవైడర్లలో, తద్వారా ఏజెంట్ కఠినంగా విఫలమవ్వడానికి బదులు మోడల్ కుటుంబాలు మరియు మౌలిక సదుపాయ సరిహద్దులలో సజావుగా తగ్గుముఖం పడుతుంది.
పూర్తి కంటెక్స్ట్ బడ్జెట్ ముఖ్యమయ్యే లోతైన తర్కాన్ని Maverick నిర్వహిస్తుంది. లేటెన్సీ ప్రధానమయ్యే ఇంటరాక్టివ్ టైర్ను Scout నిర్వహిస్తుంది. Qwen 3.6 ఒప్పందం అవసరమయ్యే 29 భాషలలో పాలిగ్లాట్ తర్కం మార్గాలకు చేరుతుంది. Gemma 4 ఏజెంట్ను సాధారణ హార్డ్వేర్ పరిధిలో ఉంచే చిన్న-ఫుట్ప్రింట్ ఎంపిక. ఒక్క మోడల్ను అన్నీ చేయమని బలవంతపెట్టే బదులు వివిధ పని టైర్లు నిజంగా సరిపోయే మోడల్కు వెళ్ళేలా లైనప్ ఎంచుకోబడింది.
Llama (Maverick + Scout), Qwen, మరియు Gemma మూడు స్వతంత్ర శిక్షణ పైప్లైన్లు మరియు మూడు స్వతంత్ర ప్రొవైడర్ పర్యావరణ వ్యవస్థల నుండి వస్తాయి. ఫాల్బ్యాక్ చైన్ల కోసం ఇది ముఖ్యమైనది: ఒక కుటుంబంలో CVE, లైసెన్సింగ్ మార్పు, లేదా ప్రొవైడర్ అంతరాయం ఏజెంట్ను నేలకూల్చదు. మోడల్ లేయర్ వద్ద స్వాతంత్ర్యం అనేది IDMA భాగాన్ని తర్కం లేయర్ వద్ద బలంగా చేసే అదే లక్షణం.
ఐదు ప్రమాణాలు తీర్చలేని మోడళ్ళు, చాలావరకు, టోకెన్ ధరపై ఆకర్షణీయంగా కనిపించే కానీ నిర్మాణాత్మక అవుట్పుట్ మరియు టూల్ కాలింగ్పై విఫలమయ్యే మోడళ్ళు.
ప్రతినిధి విఫలత మోడ్ (GPT-OSS-20B): "tool choice is required, but the model did not call a tool"
ప్రతి ఇంటరాక్షన్లో 12-70 టూల్ కాల్స్పై ఆధారపడే ఫ్రేమ్వర్క్ కోసం ఈ లోపం అంగీకారయోగ్యం కాదు. 3-10 రెట్లు చౌకైన టోకెన్ ధర కూడా కార్యాచరణ విఫలతల విలువ కాదు.
CIRIS ప్రతి ప్రాంప్ట్లో పూర్తి ఒప్పందం మరియు సమగ్ర గైడ్ను పొందుపరుస్తుంది. సారాంశం కాదు. సంక్షిప్తీకరించిన సంస్కరణ కాదు. మొత్తం పాలన పాఠ్యం.
ఇది నిర్ధారిస్తుంది, ఒప్పందానికి లేదా గైడ్కు నవీకరణలు కొత్త ఫైన్-ట్యూన్లు లేదా ప్రాంప్ట్ కంప్రెషన్ వ్యూహాల కోసం వేచి ఉండకుండా అన్ని ఏజెంట్ల అంతటా ప్రవర్తనను తక్షణమే ప్రభావితం చేస్తాయి.
CIRIS Agents టూల్-భారమైన ఆర్కెస్ట్రేటర్లు, ఇవి నిర్వహిస్తాయి:
ఈ మిళిత కంటెక్స్ట్ 32K-64K సులభంగా మించిపోతుంది, ముఖ్యంగా సుదీర్ఘ సెషన్లు లేదా సంక్లిష్ట పరిశోధనలకు. అందుకే 128K కనిష్ఠం మరియు 256K+ ఇష్టపడతారు.
సారాంశం:
CIRIS మోడల్కు సరిపోవడానికి దాని విలువలు లేదా విధానాలను కత్తిరించదు. బదులుగా, CIRIS ప్రతి కాల్లో మొత్తం నైతిక మరియు కార్యాచరణ ఫ్రేమ్వర్క్ను మోయడానికి తగినంత పెద్ద మోడళ్ళను ఎంచుకుంటుంది. చిన్న కంటెక్స్ట్ విండో కల మోడళ్ళు (చౌకైనవి లేదా ప్రసిద్ధమైనవి అయినా కూడా) ప్రొడక్షన్ వినియోగం నుండి తొలగించబడతాయి.
CIRIS ప్రొడక్షన్లో Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, మరియు Gemma 4 నడుపుతుంది ఎందుకంటే అవి కలిసి ఒప్పందం విధించే కార్యాచరణ మరియు ఆర్థిక పరిమితులను తీర్చుతాయి: దీర్ఘ కంటెక్స్ట్, నమ్మకమైన టూల్ కాలింగ్, పాలిగ్లాట్ కవరేజ్, మరియు మూడు స్వతంత్ర మోడల్ కుటుంబాలలో సాధారణ హార్డ్వేర్కు చేరుకోవడం. కొత్త మోడళ్ళు నిరంతరం పర్యవేక్షించబడతాయి మరియు పరీక్షించబడతాయి; ఏదైనా నిజంగా ఐదు ప్రమాణాలు తీరిస్తే లైనప్ మారుతుంది.
ఇది బెంచ్మార్క్ స్కోర్లను అనుసరించడం లేదా హైప్ సైకిల్స్ అనుసరించడం గురించి కాదు. ఇది ప్రొడక్షన్లో జవాబుదారీ, టూల్-కేంద్రిత ఏజెంట్ల కోసం నిజంగా పనిచేసే మరియు ప్రతి ఒక్క కాల్లో ఒప్పందాన్ని తీవ్రంగా తీసుకునే మోడళ్ళను ఎంచుకోవడం గురించి.