CIRIS Agent ஐந்து கட்டாய நிபந்தனைகளை பூர்த்தி செய்யும் சில திறந்த மாடல்களில் இயங்குகிறது. தற்போதைய உற்பத்தி வரிசையில் Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, மற்றும் Gemma 4 உள்ளன, இவை முகவரின் பணிச்சுமையில் வெவ்வேறு பங்கிற்காக தேர்ந்தெடுக்கப்பட்டன.
ஆழமான சிந்தனைக்கான முதன்மை கருவி. இது மிகவும் அதிகமான சூழல் ஒரே நேரத்தில் கையாள முடியும், எனவே முழு படத்தையும் பார்வையில் வைத்திருப்பது மிக முக்கியமான ஆழமான சிந்தனை படிகளில் இது இயல்பான தேர்வாகும்.
வழங்குநர்கள்: OpenRouter, Groq, Together, DeepInfra
Llama 4 குடும்பத்தில் வேகமான துணை. Maverick ஐ விட சிறியது மற்றும் வேகமானது, வலுவான கருவி அழைப்புடன். முழு Maverick சூழல் வரவு செலவு தேவையில்லாத, தாமதம் முக்கியமான தொடர்பு அடுக்குகளுக்கு பயன்படுத்தப்படுகிறது.
வழங்குநர்கள்: OpenRouter, Groq
பன்மொழி ஆழமும் வலுவான கட்டமைக்கப்பட்ட வெளியீடும். பல்மொழி Accord தேவைப்படும் ஆங்கிலம் அல்லாத சிந்தனை பாதைகளில் முக்கிய பங்கு வகிக்கிறது; Llama குடும்பத்திற்கு வெளியே சுயாதீனமான வழங்குநர் அடிப்படை பின்னடைவு சங்கிலியில் உபரி வழங்குகிறது.
வழங்குநர்கள்: OpenRouter, DashScope, DeepInfra
சாதாரண வன்பொருளில் இயங்கும் அளவு சிறியது. கச்சிதமான திறன் அளவை விட எட்டுவது முக்கியமான இடங்களில் (சாதனத்தில், குறைந்த அலைவரிசையில் மற்றும் பலவீனமான பிணையத்தில்) மற்றும் Llama மற்றும் Qwen உடன் மூன்றாவது குடும்ப பின்னடைவாக பயன்படுத்தப்படுகிறது.
வழங்குநர்கள்: OpenRouter, Google
ஒவ்வொரு தொடர்பிலும் 12-70 கருவி அழைப்புகளில் செயல்பாட்டு அழைப்பை இயல்பாக ஆதரித்து சரியான JSON திரும்ப வழங்க வேண்டும். CIRIS ஒரு ஒருங்கிணைப்பாளர். நாம் வெறும் உரையாடல் அல்ல, நிலையான கருவி அர்த்தவியல் வேண்டும்.
CIRIS ஒவ்வொரு வினாவிலும் முழு Accord மற்றும் Guide ஐ உட்பொதிக்கிறது. 128K என்பது கட்டாய குறைந்தபட்சம்; நீண்ட உரையாடல்கள், கருவி வெளியீடுகள் மற்றும் தணிக்கை பதிவேடுகளுக்கு 256K+ மிகவும் விரும்பப்படுகிறது.
இலக்கு: 1M டோக்கன் ஒருங்கிணைத்தலுக்கு $1.00 க்கும் குறைவு. மிக மலிவான அல்ல, செயல்படும் மிக மலிவான தேர்வை நாம் தேர்ந்தெடுக்கிறோம். JSON ஐ ஒருபோதும் உடைக்காத நம்பகமான மாடல், 10 அழைப்புகளில் 1 தோல்வியடையும் மலிவான மாடலை விட சிறந்தது.
வலுவான பின்னடைவு சங்கிலிகளுக்கு குறைந்தது இரண்டு சுயாதீன வழங்குநர்களிடம் கிடைக்க வேண்டும். CIRIS இடையூறுகளின் போது கடினமாக தோல்வியடைவதற்கு பதிலாக படிப்படியாக தரமிறங்கும்.
வேகமான பதில்கள் நெறிமுறை மறுஆய்வு செயல்முறைகளில் மனிதர்களை வளையத்தில் வைத்திருக்கும். பின்னணி பணிகளுக்கு மெதுவான பின்தளங்களை ஏற்றுக்கொள்ளும்போது தொடர்பு அடுக்குகளுக்கு குறைந்த தாமத வழங்குநர்களுக்கு முன்னுரிமை அளிக்கிறோம்.
முழு சூழல் வரவு செலவு தேவைப்படும் ஆழமான சிந்தனை படிகளுக்கு செலவு உகந்த வழங்குநர் வழியாக Llama 4 Maverick.
தொடர்பு பயன்பாட்டிற்கு வேக உகந்த வழங்குநர் (Groq) வழியாக Llama 4 Scout, அதிக சூழல் மாற்றீடாக Groq இல் Maverick உடன்.
Qwen 3.6 பல்மொழி Accord தேவைப்படும் ஆங்கிலம் அல்லாத சிந்தனை பாதைகளில் முக்கிய பங்கு வகிக்கிறது, மற்றும் சங்கிலியில் Llama அல்லாத பின்னடைவு வழங்குகிறது.
பயனரை அடைவது மாடலின் அளவை விட முக்கியமான சாதனத்தில், குறைந்த அலைவரிசையில் மற்றும் பலவீனமான பிணைய பயன்படுத்தலுக்கு Gemma 4.
Maverick → Scout → Qwen 3.6 → Gemma 4 பல வழங்குநர்களில், இதனால் முகவர் கடினமாக தோல்வியடைவதற்கு பதிலாக மாடல் குடும்பங்கள் மற்றும் உள்கட்டமைப்பு எல்லைகளில் படிப்படியாக தரமிறங்கும்.
Maverick முழு சூழல் வரவு செலவு முக்கியமான ஆழமான சிந்தனையை கையாளுகிறது. Scout தாமதம் முக்கியமான தொடர்பு அடுக்கை தாங்குகிறது. Qwen 3.6 Accord 29 மொழிகளில் தேவைப்படும் பல்மொழி சிந்தனை பாதைகளை அடைகிறது. Gemma 4 சாதாரண வன்பொருளுக்கு முகவரை எட்டும் சிறிய தடம் விருப்பமாகும். ஒரு மாடலை எல்லாவற்றையும் செய்யவேண்டும் என்று கட்டாயப்படுத்துவதற்கு பதிலாக வெவ்வேறு வேலை அடுக்குகள் உண்மையில் பொருந்தும் மாடலுக்கு செல்லும் வகையில் வரிசை தேர்ந்தெடுக்கப்பட்டுள்ளது.
Llama (Maverick + Scout), Qwen மற்றும் Gemma மூன்று சுயாதீன பயிற்சி குழாய்வழிகள் மற்றும் மூன்று சுயாதீன வழங்குநர் சுற்றுச்சூழல் அமைப்புகளிலிருந்து வருகின்றன. இது பின்னடைவு சங்கிலிகளுக்கு முக்கியம்: ஒரு குடும்பத்தில் CVE, உரிமம் மாற்றம் அல்லது வழங்குநர் இடையூறு முகவரை தள்ளாட வைக்காது. மாடல் அடுக்கில் சுயாதீனம் என்பது சிந்தனை அடுக்கில் IDMA கூறை வலுவாக்கும் அதே பண்பு.
ஐந்து அளவுகோல்களை பூர்த்தி செய்ய முடியாத மாடல்கள், பெரும்பாலும், டோக்கன் விலையில் கவர்ச்சியாக தோன்றும் ஆனால் கட்டமைக்கப்பட்ட வெளியீடு மற்றும் கருவி அழைப்பில் தோல்வியடையும் மாடல்கள்.
பிரதிநிதி தோல்வி முறை (GPT-OSS-20B): "கருவி தேர்வு தேவை, ஆனால் மாடல் கருவியை அழைக்கவில்லை"
இந்த பிழை ஒரு தொடர்பிற்கு 12-70 கருவி அழைப்புகளை சார்ந்திருக்கும் ஒரு கட்டமைப்பிற்கு ஏற்றுக்கொள்ள முடியாதது. 3-10 மடங்கு மலிவான டோக்கன் விலை கூட செயல்பாட்டு தோல்விகளுக்கு மதிப்புடையதல்ல.
CIRIS ஒவ்வொரு வினாவிலும் முழு Accord மற்றும் முழுமையான விரிவான வழிகாட்டி உட்பொதிக்கிறது. சுருக்கம் அல்ல. வடிகட்டிய பதிப்பு அல்ல. முழு ஆட்சி உரை.
இது Accord அல்லது Guide இல் புதுப்பிப்புகள் புதிய நுண்ணமை செய்கைகள் அல்லது வினா சுருக்க உத்திகளுக்காக காத்திருக்காமல் உடனடியாக அனைத்து முகவர்களிலும் நடத்தையை பாதிக்கும் என்பதை உறுதி செய்கிறது.
CIRIS Agents கருவி-கனமான ஒருங்கிணைப்பாளர்கள் இவற்றை சமாளிக்கிறார்கள்:
இந்த ஒருங்கிணைந்த சூழல் எளிதாக 32K-64K ஐ தாண்டுகிறது, குறிப்பாக நீண்ட கால அமர்வுகள் அல்லது சிக்கலான விசாரணைகளுக்கு. அதனால்தான் 128K குறைந்தபட்சம் மற்றும் 256K+ விரும்பப்படுகிறது.
சாரம்:
CIRIS அதன் மதிப்புகளையோ நடைமுறைகளையோ மாடலுக்கு பொருந்தும்படி கத்தரிக்கவில்லை. மாறாக, CIRIS ஒவ்வொரு அழைப்பிலும் முழு நெறிமுறை மற்றும் செயல்பாட்டு கட்டமைப்பை தாங்கும் அளவு பெரிய மாடல்களை தேர்ந்தெடுக்கிறது. சிறிய சூழல் சாளரங்கள் கொண்ட மாடல்கள் (மலிவாக அல்லது பிரபலமாக இருந்தாலும்) உற்பத்தி பயன்பாட்டிலிருந்து விலக்கப்படுகின்றன.
CIRIS உற்பத்தியில் Llama 4 Maverick, Llama 4 Scout, Qwen 3.6 மற்றும் Gemma 4 இயக்குகிறது, ஏனென்றால் ஒன்றாக அவை Accord விதிக்கும் செயல்பாட்டு மற்றும் பொருளாதார கட்டுப்பாடுகளை பூர்த்தி செய்கின்றன: நீண்ட சூழல், நம்பகமான கருவி அழைப்பு, பல்மொழி கவரேஜ் மற்றும் மூன்று சுயாதீன மாடல் குடும்பங்களில் சாதாரண வன்பொருளை எட்டுவது. புதிய மாடல்கள் தொடர்ச்சியாக கண்காணிக்கப்பட்டு சோதிக்கப்படுகின்றன; ஏதாவது ஐந்து அளவுகோல்களை உண்மையில் பூர்த்தி செய்யும்போது வரிசை மாறும்.
இது வரையறை மதிப்பெண்களை தொடர்வது அல்லது பிரபலமான போக்குகளை பின்பற்றுவது அல்ல. இது உற்பத்தியில் பொறுப்பான, கருவி-மையமான முகவர்களுக்கு உண்மையில் வேலை செய்யும் மற்றும் ஒவ்வொரு அழைப்பிலும் Accord ஐ தாங்கும் அளவுக்கு அதை தீவிரமாக எடுத்துக்கொள்ளும் மாடல்களை தேர்ந்தெடுப்பது.