முதல் தொடர்புநிறுவுஒத்திசைவு சக்கரம்ஃபெடரேஷன்ஒப்பிடுஆராய்ச்சிஉடன்படிக்கைGitHub
இந்தப் பக்கம் இயந்திரத்தால் மொழிபெயர்க்கப்பட்டது. ஏதாவது தவறாக படித்தால், தயவுசெய்து ஒரு சிக்கலை திறங்கள் — பொது நலனுக்காக repo திறந்திருக்கிறது. மொழிபெயர்ப்பு சிக்கலை தெரிவிக்கவும்

நாம் பயன்படுத்தும் LLM-கள் மற்றும் ஏன்

CIRIS Agent ஐந்து கட்டாய நிபந்தனைகளை பூர்த்தி செய்யும் சில திறந்த மாடல்களில் இயங்குகிறது. தற்போதைய உற்பத்தி வரிசையில் Llama 4 Maverick, Llama 4 Scout, Qwen 3.6, மற்றும் Gemma 4 உள்ளன, இவை முகவரின் பணிச்சுமையில் வெவ்வேறு பங்கிற்காக தேர்ந்தெடுக்கப்பட்டன.

Llama 4 Maverick

ஆழமான சிந்தனைக்கான முதன்மை கருவி. இது மிகவும் அதிகமான சூழல் ஒரே நேரத்தில் கையாள முடியும், எனவே முழு படத்தையும் பார்வையில் வைத்திருப்பது மிக முக்கியமான ஆழமான சிந்தனை படிகளில் இது இயல்பான தேர்வாகும்.

வழங்குநர்கள்: OpenRouter, Groq, Together, DeepInfra

Llama 4 Scout

Llama 4 குடும்பத்தில் வேகமான துணை. Maverick ஐ விட சிறியது மற்றும் வேகமானது, வலுவான கருவி அழைப்புடன். முழு Maverick சூழல் வரவு செலவு தேவையில்லாத, தாமதம் முக்கியமான தொடர்பு அடுக்குகளுக்கு பயன்படுத்தப்படுகிறது.

வழங்குநர்கள்: OpenRouter, Groq

Qwen 3.6

பன்மொழி ஆழமும் வலுவான கட்டமைக்கப்பட்ட வெளியீடும். பல்மொழி Accord தேவைப்படும் ஆங்கிலம் அல்லாத சிந்தனை பாதைகளில் முக்கிய பங்கு வகிக்கிறது; Llama குடும்பத்திற்கு வெளியே சுயாதீனமான வழங்குநர் அடிப்படை பின்னடைவு சங்கிலியில் உபரி வழங்குகிறது.

வழங்குநர்கள்: OpenRouter, DashScope, DeepInfra

Gemma 4

சாதாரண வன்பொருளில் இயங்கும் அளவு சிறியது. கச்சிதமான திறன் அளவை விட எட்டுவது முக்கியமான இடங்களில் (சாதனத்தில், குறைந்த அலைவரிசையில் மற்றும் பலவீனமான பிணையத்தில்) மற்றும் Llama மற்றும் Qwen உடன் மூன்றாவது குடும்ப பின்னடைவாக பயன்படுத்தப்படுகிறது.

வழங்குநர்கள்: OpenRouter, Google

எங்கள் மாடல் அளவுகோல்கள்

CIRIS Agent க்கான ஐந்து கட்டாய தேவைகள்

1. கட்டமைக்கப்பட்ட வெளியீடுகள் மற்றும் கருவி பயன்பாடு

ஒவ்வொரு தொடர்பிலும் 12-70 கருவி அழைப்புகளில் செயல்பாட்டு அழைப்பை இயல்பாக ஆதரித்து சரியான JSON திரும்ப வழங்க வேண்டும். CIRIS ஒரு ஒருங்கிணைப்பாளர். நாம் வெறும் உரையாடல் அல்ல, நிலையான கருவி அர்த்தவியல் வேண்டும்.

2. சூழல் சாளரம்: குறைந்தது 128K

CIRIS ஒவ்வொரு வினாவிலும் முழு Accord மற்றும் Guide ஐ உட்பொதிக்கிறது. 128K என்பது கட்டாய குறைந்தபட்சம்; நீண்ட உரையாடல்கள், கருவி வெளியீடுகள் மற்றும் தணிக்கை பதிவேடுகளுக்கு 256K+ மிகவும் விரும்பப்படுகிறது.

3. செலவு திறன்

இலக்கு: 1M டோக்கன் ஒருங்கிணைத்தலுக்கு $1.00 க்கும் குறைவு. மிக மலிவான அல்ல, செயல்படும் மிக மலிவான தேர்வை நாம் தேர்ந்தெடுக்கிறோம். JSON ஐ ஒருபோதும் உடைக்காத நம்பகமான மாடல், 10 அழைப்புகளில் 1 தோல்வியடையும் மலிவான மாடலை விட சிறந்தது.

4. பல வழங்குநர் கிடைக்கும் தன்மை

வலுவான பின்னடைவு சங்கிலிகளுக்கு குறைந்தது இரண்டு சுயாதீன வழங்குநர்களிடம் கிடைக்க வேண்டும். CIRIS இடையூறுகளின் போது கடினமாக தோல்வியடைவதற்கு பதிலாக படிப்படியாக தரமிறங்கும்.

5. தாமதம் மற்றும் பயனர் அனுபவம்

வேகமான பதில்கள் நெறிமுறை மறுஆய்வு செயல்முறைகளில் மனிதர்களை வளையத்தில் வைத்திருக்கும். பின்னணி பணிகளுக்கு மெதுவான பின்தளங்களை ஏற்றுக்கொள்ளும்போது தொடர்பு அடுக்குகளுக்கு குறைந்த தாமத வழங்குநர்களுக்கு முன்னுரிமை அளிக்கிறோம்.

உற்பத்தி பயன்படுத்தல்

இயல்புநிலை அடுக்கு

முழு சூழல் வரவு செலவு தேவைப்படும் ஆழமான சிந்தனை படிகளுக்கு செலவு உகந்த வழங்குநர் வழியாக Llama 4 Maverick.

வேகமான அடுக்கு

தொடர்பு பயன்பாட்டிற்கு வேக உகந்த வழங்குநர் (Groq) வழியாக Llama 4 Scout, அதிக சூழல் மாற்றீடாக Groq இல் Maverick உடன்.

பன்மொழி அடுக்கு

Qwen 3.6 பல்மொழி Accord தேவைப்படும் ஆங்கிலம் அல்லாத சிந்தனை பாதைகளில் முக்கிய பங்கு வகிக்கிறது, மற்றும் சங்கிலியில் Llama அல்லாத பின்னடைவு வழங்குகிறது.

விளிம்பு அடுக்கு

பயனரை அடைவது மாடலின் அளவை விட முக்கியமான சாதனத்தில், குறைந்த அலைவரிசையில் மற்றும் பலவீனமான பிணைய பயன்படுத்தலுக்கு Gemma 4.

பின்னடைவு சங்கிலி

Maverick → Scout → Qwen 3.6 → Gemma 4 பல வழங்குநர்களில், இதனால் முகவர் கடினமாக தோல்வியடைவதற்கு பதிலாக மாடல் குடும்பங்கள் மற்றும் உள்கட்டமைப்பு எல்லைகளில் படிப்படியாக தரமிறங்கும்.

ஏன் இந்த வரிசை

வெவ்வேறு பங்குகள், மாற்றியமைக்கக்கூடிய பாகங்கள் அல்ல

Maverick முழு சூழல் வரவு செலவு முக்கியமான ஆழமான சிந்தனையை கையாளுகிறது. Scout தாமதம் முக்கியமான தொடர்பு அடுக்கை தாங்குகிறது. Qwen 3.6 Accord 29 மொழிகளில் தேவைப்படும் பல்மொழி சிந்தனை பாதைகளை அடைகிறது. Gemma 4 சாதாரண வன்பொருளுக்கு முகவரை எட்டும் சிறிய தடம் விருப்பமாகும். ஒரு மாடலை எல்லாவற்றையும் செய்யவேண்டும் என்று கட்டாயப்படுத்துவதற்கு பதிலாக வெவ்வேறு வேலை அடுக்குகள் உண்மையில் பொருந்தும் மாடலுக்கு செல்லும் வகையில் வரிசை தேர்ந்தெடுக்கப்பட்டுள்ளது.

மூன்று சுயாதீன மாடல் குடும்பங்கள்

Llama (Maverick + Scout), Qwen மற்றும் Gemma மூன்று சுயாதீன பயிற்சி குழாய்வழிகள் மற்றும் மூன்று சுயாதீன வழங்குநர் சுற்றுச்சூழல் அமைப்புகளிலிருந்து வருகின்றன. இது பின்னடைவு சங்கிலிகளுக்கு முக்கியம்: ஒரு குடும்பத்தில் CVE, உரிமம் மாற்றம் அல்லது வழங்குநர் இடையூறு முகவரை தள்ளாட வைக்காது. மாடல் அடுக்கில் சுயாதீனம் என்பது சிந்தனை அடுக்கில் IDMA கூறை வலுவாக்கும் அதே பண்பு.

வரிசைக்கு வெளியே இருப்பவை

ஐந்து அளவுகோல்களை பூர்த்தி செய்ய முடியாத மாடல்கள், பெரும்பாலும், டோக்கன் விலையில் கவர்ச்சியாக தோன்றும் ஆனால் கட்டமைக்கப்பட்ட வெளியீடு மற்றும் கருவி அழைப்பில் தோல்வியடையும் மாடல்கள்.

பிரதிநிதி தோல்வி முறை (GPT-OSS-20B): "கருவி தேர்வு தேவை, ஆனால் மாடல் கருவியை அழைக்கவில்லை"

இந்த பிழை ஒரு தொடர்பிற்கு 12-70 கருவி அழைப்புகளை சார்ந்திருக்கும் ஒரு கட்டமைப்பிற்கு ஏற்றுக்கொள்ள முடியாதது. 3-10 மடங்கு மலிவான டோக்கன் விலை கூட செயல்பாட்டு தோல்விகளுக்கு மதிப்புடையதல்ல.

ஏன் 128K+ சூழல் கட்டாயமானது

எப்போதும் இயக்கத்தில் உள்ள Accord மற்றும் Guide

CIRIS ஒவ்வொரு வினாவிலும் முழு Accord மற்றும் முழுமையான விரிவான வழிகாட்டி உட்பொதிக்கிறது. சுருக்கம் அல்ல. வடிகட்டிய பதிப்பு அல்ல. முழு ஆட்சி உரை.

இது Accord அல்லது Guide இல் புதுப்பிப்புகள் புதிய நுண்ணமை செய்கைகள் அல்லது வினா சுருக்க உத்திகளுக்காக காத்திருக்காமல் உடனடியாக அனைத்து முகவர்களிலும் நடத்தையை பாதிக்கும் என்பதை உறுதி செய்கிறது.

முழு நெறிமுறை மற்றும் நடைமுறை நிலை

CIRIS Agents கருவி-கனமான ஒருங்கிணைப்பாளர்கள் இவற்றை சமாளிக்கிறார்கள்:

  • பல படி செயல்முறைகள்
  • கணினி நிலை மற்றும் கருவி வெளியீடுகள்
  • பயனர் செய்திகள் மற்றும் உரையாடல் வரலாறு
  • முழு Accord மற்றும் Guide

இந்த ஒருங்கிணைந்த சூழல் எளிதாக 32K-64K ஐ தாண்டுகிறது, குறிப்பாக நீண்ட கால அமர்வுகள் அல்லது சிக்கலான விசாரணைகளுக்கு. அதனால்தான் 128K குறைந்தபட்சம் மற்றும் 256K+ விரும்பப்படுகிறது.

சாரம்:

CIRIS அதன் மதிப்புகளையோ நடைமுறைகளையோ மாடலுக்கு பொருந்தும்படி கத்தரிக்கவில்லை. மாறாக, CIRIS ஒவ்வொரு அழைப்பிலும் முழு நெறிமுறை மற்றும் செயல்பாட்டு கட்டமைப்பை தாங்கும் அளவு பெரிய மாடல்களை தேர்ந்தெடுக்கிறது. சிறிய சூழல் சாளரங்கள் கொண்ட மாடல்கள் (மலிவாக அல்லது பிரபலமாக இருந்தாலும்) உற்பத்தி பயன்பாட்டிலிருந்து விலக்கப்படுகின்றன.

இது CIRIS Accord ஐ எவ்வாறு ஆதரிக்கிறது

நெறிமுறை உள்கட்டமைப்பாக மாடல் தேர்வு

வெளிப்படைத்தன்மை மற்றும் ஆய்வுத்திறன்

  • நீண்ட சூழல் மனித மறுஆய்வுக்கு சிந்தனை தடயங்கள், முடிவுகள் மற்றும் கருவி அழைப்புகளை தெரியும்படி வைக்கிறது
  • நிலையான JSON மற்றும் கட்டமைக்கப்பட்ட வெளியீடுகள் ஒவ்வொரு கருவி அழைப்பையும் தணிக்கை செய்ய முடியும்படி செய்கிறது
  • ஒவ்வொரு அழைப்பிலும் முழுமையான ஆட்சி இடையூறுகள் முடிவுகளை கொள்கைகளுக்கு திரும்ப கண்டுபிடிக்க முடியும் என்பதை உறுதிசெய்கிறது

மீள்தன்மை மற்றும் ஆட்சி

  • பல வழங்குநர் பயன்படுத்தல் முக்கியமான நெறிமுறை உள்கட்டமைப்பில் தோல்வியின் ஒற்றைப் புள்ளிகளை தவிர்க்கிறது
  • "போதுமான மற்றும் நம்பகமான" ஐ "மின்னும் ஆனால் பலவீனமான" விட தேர்ந்தெடுப்பது பாதுகாப்பு மற்றும் தொடர்ச்சிக்கு முன்னுரிமை அளிக்கிறது
  • இடையூறுகளின் போது படிப்படியான தரமிறக்கம் சேவை கிடைக்கும் தன்மையை பராமரிக்கிறது

மனித மேற்பார்வை

  • வேகமான அடுக்குகள் நேரடி நெறிமுறை மறுஆய்வுக்கு மனிதர்களை வசதியாக வளையத்தில் வைக்கும்
  • மலிவான அடுக்குகள் தடைசெய்யும் செலவுகள் இல்லாமல் விரிவான பின்னணி பகுப்பாய்வை செயல்படுத்துகின்றன
  • சமச்சீரான அணுகுமுறை தினசரி பயன்பாடு மற்றும் கால இடைவெளி ஆட்சி தணிக்கைகள் இரண்டையும் ஆதரிக்கிறது

சாரம்

CIRIS உற்பத்தியில் Llama 4 Maverick, Llama 4 Scout, Qwen 3.6 மற்றும் Gemma 4 இயக்குகிறது, ஏனென்றால் ஒன்றாக அவை Accord விதிக்கும் செயல்பாட்டு மற்றும் பொருளாதார கட்டுப்பாடுகளை பூர்த்தி செய்கின்றன: நீண்ட சூழல், நம்பகமான கருவி அழைப்பு, பல்மொழி கவரேஜ் மற்றும் மூன்று சுயாதீன மாடல் குடும்பங்களில் சாதாரண வன்பொருளை எட்டுவது. புதிய மாடல்கள் தொடர்ச்சியாக கண்காணிக்கப்பட்டு சோதிக்கப்படுகின்றன; ஏதாவது ஐந்து அளவுகோல்களை உண்மையில் பூர்த்தி செய்யும்போது வரிசை மாறும்.

இது வரையறை மதிப்பெண்களை தொடர்வது அல்லது பிரபலமான போக்குகளை பின்பற்றுவது அல்ல. இது உற்பத்தியில் பொறுப்பான, கருவி-மையமான முகவர்களுக்கு உண்மையில் வேலை செய்யும் மற்றும் ஒவ்வொரு அழைப்பிலும் Accord ஐ தாங்கும் அளவுக்கு அதை தீவிரமாக எடுத்துக்கொள்ளும் மாடல்களை தேர்ந்தெடுப்பது.