మొదటి సంప్రదింపుఇన్‌స్టాల్సంఘటన రాచెట్ఫెడరేషన్పోల్చండిపరిశోధనఒప్పందంGitHub
ఈ పేజీని యంత్రం అనువదించింది. ఏదైనా తప్పుగా చదివితే, దయచేసి ఒక సమస్య తెరవండి — రెపో ఒక కారణంతో బహిరంగంగా ఉంది. అనువాద సమస్యను నివేదించండి

మేము ఏ LLMలు ఉపయోగిస్తున్నాం మరియు ఎందుకు

CIRIS Agent ఐదు తప్పనిసరి అవసరాలు తీర్చే కొన్ని ఓపెన్ మోడళ్ళపై పనిచేస్తుంది. ప్రస్తుత ప్రొడక్షన్ లైనప్‌లో Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, మరియు Gemma 4 ఉన్నాయి. ఏజెంట్ పనిభారంలో వివిధ పాత్రల కోసం ఇవి ఎంచుకోబడ్డాయి.

Llama 4 Maverick

తర్కం చేసే ప్రధాన మోడల్. ఒకే సమయంలో చాలా పెద్ద కంటెక్స్ట్‌ను ధరించగలదు, కాబట్టి మొత్తం చిత్రాన్ని చూడటం చాలా అవసరమయ్యే లోతైన తర్కం దశలలో ఇది డిఫాల్ట్ ఎంపిక.

ప్రొవైడర్లు: OpenRouter, Groq, Together, DeepInfra

Llama 4 Scout

Llama 4 కుటుంబంలో వేగవంతమైన సహచరుడు. Maverick కంటే చిన్నది మరియు వేగంగా ఉంటుంది, బలమైన టూల్ కాలింగ్‌తో. లేటెన్సీ ముఖ్యమైన మరియు Maverick యొక్క పూర్తి కంటెక్స్ట్ బడ్జెట్ అవసరం లేని ఇంటరాక్టివ్ టైర్ల కోసం ఉపయోగించబడుతుంది.

ప్రొవైడర్లు: OpenRouter, Groq

Qwen 3.6

బహుభాషా లోతు మరియు బలమైన నిర్మాణాత్మక అవుట్‌పుట్. పాలిగ్లాట్ ఒప్పందం అవసరమయ్యే ఆంగ్లేతర తర్కం మార్గాలలో భారాన్ని మోస్తుంది; Llama కుటుంబానికి వెలుపల స్వతంత్ర ప్రొవైడర్ బేస్ ఫాల్‌బ్యాక్ చైన్‌లో అదనపు స్థితిస్థాపకత అందిస్తుంది.

ప్రొవైడర్లు: OpenRouter, DashScope, DeepInfra

Gemma 4

సాధారణ హార్డ్‌వేర్‌పై పనిచేయడానికి తగినంత చిన్నది. సామర్థ్యం కంటే చేరుకోవడం ముఖ్యమయ్యే చోట (ఆన్-డివైస్, తక్కువ-బ్యాండ్‌విడ్త్, మరియు అధోగతి నెట్‌వర్క్ వ్యాప్తులు) మరియు Llama మరియు Qwen పక్కన మూడో కుటుంబం ఫాల్‌బ్యాక్‌గా ఉపయోగించబడుతుంది.

ప్రొవైడర్లు: OpenRouter, Google

మా మోడల్ ప్రమాణాలు

CIRIS Agent కోసం ఐదు తప్పనిసరి అవసరాలు

1. నిర్మాణాత్మక అవుట్‌పుట్లు & టూల్ వినియోగం

ప్రతి ఇంటరాక్షన్‌లో 12-70 టూల్ కాల్స్ అంతటా నేటివ్‌గా ఫంక్షన్ కాలింగ్ మద్దతు ఇచ్చి చెల్లుబాటయ్యే JSON తిరిగి ఇవ్వాలి. CIRIS ఒక ఆర్కెస్ట్రేటర్. మాకు స్థిరమైన టూల్ సెమాంటిక్స్ కావాలి, గప్పాలు కాదు.

2. కంటెక్స్ట్ విండో: కనీసం 128K

CIRIS ప్రతి ప్రాంప్ట్‌లో పూర్తి ఒప్పందం మరియు గైడ్‌ను పొందుపరుస్తుంది. 128K అనేది సంపూర్ణ కనిష్ఠం; 256K+ సుదీర్ఘ సంభాషణలు, టూల్ అవుట్‌పుట్లు, మరియు ఆడిట్ ట్రెయిల్స్ కోసం ఖచ్చితంగా ఇష్టపడతారు.

3. ఖర్చు సమర్థత

లక్ష్యం: 1M టోకెన్ల మిళితానికి $1.00 కంటే తక్కువ. మేము చౌకైన బెంచ్‌మార్క్ విజేతను కాకుండా అత్యంత చౌకైన పని చేసే ఎంపికను ఎంచుకుంటాం. JSON ఎప్పుడూ విఫలం కాని నమ్మకమైన మోడల్ 10లో 1 కాల్ విఫలమయ్యే చౌకైన మోడల్ కంటే మెరుగు.

4. బహుళ-ప్రొవైడర్ అందుబాటు

బలమైన ఫాల్‌బ్యాక్ చైన్ల కోసం కనీసం రెండు స్వతంత్ర ప్రొవైడర్ల నుండి అందుబాటులో ఉండాలి. CIRIS అంతరాయాల సమయంలో కఠినంగా విఫలమవ్వడానికి బదులు సజావుగా తగ్గుముఖం పడుతుంది.

5. లేటెన్సీ & వినియోగదారు అనుభవం

వేగవంతమైన ప్రతిస్పందనలు నైతిక సమీక్షా వర్క్‌ఫ్లోలలో మానవులను చురుకుగా ఉంచుతాయి. మేము నేపథ్య పనులకు నెమ్మదైన బ్యాకెండ్లను అంగీకరిస్తూ ఇంటరాక్టివ్ టైర్లకు తక్కువ-లేటెన్సీ ప్రొవైడర్లకు ప్రాధాన్యత ఇస్తాం.

ప్రొడక్షన్ వ్యాప్తి

డిఫాల్ట్ టైర్

పూర్తి కంటెక్స్ట్ బడ్జెట్ అవసరమయ్యే లోతైన-తర్కం దశల కోసం ఖర్చు-అనుకూల ప్రొవైడర్ ద్వారా Llama 4 Maverick.

వేగవంతమైన టైర్

ఇంటరాక్టివ్ వినియోగం కోసం వేగం-అనుకూల ప్రొవైడర్ (Groq) ద్వారా Llama 4 Scout, మరియు భారీ-కంటెక్స్ట్ ప్రత్యామ్నాయంగా Groq-లో Maverick.

బహుభాషా టైర్

పాలిగ్లాట్ ఒప్పందం అవసరమయ్యే ఆంగ్లేతర తర్కం మార్గాలలో Qwen 3.6 భారాన్ని మోస్తుంది మరియు చైన్‌లో Llama-కాని ఫాల్‌బ్యాక్ అందిస్తుంది.

ఎడ్జ్ టైర్

మోడల్ పరిమాణం కంటే వినియోగదారుకు చేరుకోవడం ముఖ్యమయ్యే ఆన్-డివైస్, తక్కువ-బ్యాండ్‌విడ్త్, మరియు అధోగతి-నెట్‌వర్క్ వ్యాప్తుల కోసం Gemma 4.

ఫాల్‌బ్యాక్ చైన్

Maverick → Scout → Qwen 3.6 → Gemma 4 బహుళ ప్రొవైడర్లలో, తద్వారా ఏజెంట్ కఠినంగా విఫలమవ్వడానికి బదులు మోడల్ కుటుంబాలు మరియు మౌలిక సదుపాయ సరిహద్దులలో సజావుగా తగ్గుముఖం పడుతుంది.

ఈ లైనప్ ఎందుకు

మార్పిడి చేయలేని భాగాలు కాదు, వివిధ పాత్రలు

పూర్తి కంటెక్స్ట్ బడ్జెట్ ముఖ్యమయ్యే లోతైన తర్కాన్ని Maverick నిర్వహిస్తుంది. లేటెన్సీ ప్రధానమయ్యే ఇంటరాక్టివ్ టైర్‌ను Scout నిర్వహిస్తుంది. Qwen 3.6 ఒప్పందం అవసరమయ్యే 29 భాషలలో పాలిగ్లాట్ తర్కం మార్గాలకు చేరుతుంది. Gemma 4 ఏజెంట్‌ను సాధారణ హార్డ్‌వేర్ పరిధిలో ఉంచే చిన్న-ఫుట్‌ప్రింట్ ఎంపిక. ఒక్క మోడల్‌ను అన్నీ చేయమని బలవంతపెట్టే బదులు వివిధ పని టైర్లు నిజంగా సరిపోయే మోడల్‌కు వెళ్ళేలా లైనప్ ఎంచుకోబడింది.

మూడు స్వతంత్ర మోడల్ కుటుంబాలు

Llama (Maverick + Scout), Qwen, మరియు Gemma మూడు స్వతంత్ర శిక్షణ పైప్‌లైన్లు మరియు మూడు స్వతంత్ర ప్రొవైడర్ పర్యావరణ వ్యవస్థల నుండి వస్తాయి. ఫాల్‌బ్యాక్ చైన్ల కోసం ఇది ముఖ్యమైనది: ఒక కుటుంబంలో CVE, లైసెన్సింగ్ మార్పు, లేదా ప్రొవైడర్ అంతరాయం ఏజెంట్‌ను నేలకూల్చదు. మోడల్ లేయర్ వద్ద స్వాతంత్ర్యం అనేది IDMA భాగాన్ని తర్కం లేయర్ వద్ద బలంగా చేసే అదే లక్షణం.

లైనప్ నుండి ఏమి తొలగించబడింది

ఐదు ప్రమాణాలు తీర్చలేని మోడళ్ళు, చాలావరకు, టోకెన్ ధరపై ఆకర్షణీయంగా కనిపించే కానీ నిర్మాణాత్మక అవుట్‌పుట్ మరియు టూల్ కాలింగ్‌పై విఫలమయ్యే మోడళ్ళు.

ప్రతినిధి విఫలత మోడ్ (GPT-OSS-20B): "tool choice is required, but the model did not call a tool"

ప్రతి ఇంటరాక్షన్‌లో 12-70 టూల్ కాల్స్‌పై ఆధారపడే ఫ్రేమ్‌వర్క్ కోసం ఈ లోపం అంగీకారయోగ్యం కాదు. 3-10 రెట్లు చౌకైన టోకెన్ ధర కూడా కార్యాచరణ విఫలతల విలువ కాదు.

128K+ కంటెక్స్ట్ ఎందుకు తప్పనిసరి

ఎల్లప్పుడూ-ఆన్ ఒప్పందం మరియు గైడ్

CIRIS ప్రతి ప్రాంప్ట్‌లో పూర్తి ఒప్పందం మరియు సమగ్ర గైడ్ను పొందుపరుస్తుంది. సారాంశం కాదు. సంక్షిప్తీకరించిన సంస్కరణ కాదు. మొత్తం పాలన పాఠ్యం.

ఇది నిర్ధారిస్తుంది, ఒప్పందానికి లేదా గైడ్‌కు నవీకరణలు కొత్త ఫైన్-ట్యూన్‌లు లేదా ప్రాంప్ట్ కంప్రెషన్ వ్యూహాల కోసం వేచి ఉండకుండా అన్ని ఏజెంట్ల అంతటా ప్రవర్తనను తక్షణమే ప్రభావితం చేస్తాయి.

పూర్తి నైతిక మరియు విధాన స్థితి

CIRIS Agents టూల్-భారమైన ఆర్కెస్ట్రేటర్లు, ఇవి నిర్వహిస్తాయి:

  • బహుళ-దశ వర్క్‌ఫ్లోలు
  • సిస్టమ్ స్థితి మరియు టూల్ అవుట్‌పుట్లు
  • వినియోగదారు సందేశాలు మరియు సంభాషణ చరిత్ర
  • సమగ్ర ఒప్పందం మరియు గైడ్

ఈ మిళిత కంటెక్స్ట్ 32K-64K సులభంగా మించిపోతుంది, ముఖ్యంగా సుదీర్ఘ సెషన్లు లేదా సంక్లిష్ట పరిశోధనలకు. అందుకే 128K కనిష్ఠం మరియు 256K+ ఇష్టపడతారు.

సారాంశం:

CIRIS మోడల్‌కు సరిపోవడానికి దాని విలువలు లేదా విధానాలను కత్తిరించదు. బదులుగా, CIRIS ప్రతి కాల్‌లో మొత్తం నైతిక మరియు కార్యాచరణ ఫ్రేమ్‌వర్క్‌ను మోయడానికి తగినంత పెద్ద మోడళ్ళను ఎంచుకుంటుంది. చిన్న కంటెక్స్ట్ విండో కల మోడళ్ళు (చౌకైనవి లేదా ప్రసిద్ధమైనవి అయినా కూడా) ప్రొడక్షన్ వినియోగం నుండి తొలగించబడతాయి.

ఇది CIRIS ఒప్పందాన్ని ఎలా మద్దతు ఇస్తుంది

నైతిక మౌలిక సదుపాయంగా మోడల్ ఎంపిక

పారదర్శకత మరియు తనిఖీ సామర్థ్యం

  • దీర్ఘ కంటెక్స్ట్ తర్కం ట్రేస్‌లు, నిర్ణయాలు, మరియు టూల్ కాల్స్‌ను మానవ సమీక్షకు కనిపించేలా ఉంచుతుంది
  • స్థిరమైన JSON మరియు నిర్మాణాత్మక అవుట్‌పుట్లు ప్రతి టూల్ ఆహ్వానాన్ని ఆడిట్ చేయగలిగేలా చేస్తాయి
  • ప్రతి కాల్‌లో సంపూర్ణ పాలన ఆర్టిఫాక్ట్లు నిర్ణయాలు సూత్రాలకు తిరిగి జాడించగలిగేలా నిర్ధారిస్తాయి

స్థితిస్థాపకత మరియు పాలన

  • బహుళ-ప్రొవైడర్ వ్యాప్తి క్లిష్టమైన నైతిక మౌలిక సదుపాయంలో విఫలతకు ఒకే కారణాలను నివారిస్తుంది
  • "మెరిసే కానీ పెళుసైన" దానికి బదులు "తగినంత మంచి మరియు నమ్మకమైన" ఎంచుకోవడం భద్రత మరియు కొనసాగింపుకు ప్రాధాన్యత ఇస్తుంది
  • అంతరాయాల సమయంలో సజావైన తగ్గుముఖం సేవ అందుబాటును నిలుపుకుంటుంది

మానవ పర్యవేక్షణ

  • వేగవంతమైన టైర్లు నిజ-సమయ నైతిక సమీక్షకు మానవులను సౌకర్యంగా చురుకుగా ఉంచుతాయి
  • చౌకైన టైర్లు నిషేధాత్మక ఖర్చు లేకుండా విస్తృత నేపథ్య విశ్లేషణను సాధ్యం చేస్తాయి
  • సమతుల్య విధానం రోజువారీ వినియోగం మరియు ఆవర్తన పాలన ఆడిట్లు రెండింటికీ మద్దతు ఇస్తుంది

సారాంశం

CIRIS ప్రొడక్షన్‌లో Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, మరియు Gemma 4 నడుపుతుంది ఎందుకంటే అవి కలిసి ఒప్పందం విధించే కార్యాచరణ మరియు ఆర్థిక పరిమితులను తీర్చుతాయి: దీర్ఘ కంటెక్స్ట్, నమ్మకమైన టూల్ కాలింగ్, పాలిగ్లాట్ కవరేజ్, మరియు మూడు స్వతంత్ర మోడల్ కుటుంబాలలో సాధారణ హార్డ్‌వేర్‌కు చేరుకోవడం. కొత్త మోడళ్ళు నిరంతరం పర్యవేక్షించబడతాయి మరియు పరీక్షించబడతాయి; ఏదైనా నిజంగా ఐదు ప్రమాణాలు తీరిస్తే లైనప్ మారుతుంది.

ఇది బెంచ్‌మార్క్ స్కోర్లను అనుసరించడం లేదా హైప్ సైకిల్స్ అనుసరించడం గురించి కాదు. ఇది ప్రొడక్షన్‌లో జవాబుదారీ, టూల్-కేంద్రిత ఏజెంట్ల కోసం నిజంగా పనిచేసే మరియు ప్రతి ఒక్క కాల్‌లో ఒప్పందాన్ని తీవ్రంగా తీసుకునే మోడళ్ళను ఎంచుకోవడం గురించి.