Claude Opus 4.6 அளவுகோல் முடிவுகள்
Claude Opus 4.6 Anthropic-ன் மிகவும் திறன் வாய்ந்த மாடல் ஆகும், கோடிங், சிந்தனை, மற்றும் அறிவுசார் பணியில் புதிய சாதனைகளை நிகழ்த்துகிறது. இது Terminal-Bench 2.0-இல் மிக அதிக மதிப்பெண்ணை அடைகிறது, ஏஜென்டிக் கோடிங்கிற்கான முன்னணி அளவுகோல், மற்றும் Humanity's Last Exam-இல் அனைத்து ஃப்ரான்டியர் மாடல்களையும் விஞ்சுகிறது, பல்துறை சிந்தனை சோதனை.
கோடிங் பணிகளுக்கு ஏற்கனவே Claude Sonnet 4.6 பயன்படுத்தும் டெவலப்பர்களுக்கு, Opus 4.6 சிக்கலான, பல-படி ஏஜென்டிக் பணிக்கான அடுத்த நிலை செயல்திறனாகும்.
கோடிங் செயல்திறன்: Terminal-Bench 2.0-இல் #1
Opus 4.6 தனது முன்னோடியின் கோடிங் திறன்களை ஒவ்வொரு பரிமாணத்திலும் மேம்படுத்துகிறது:
- கவனமான திட்டமிடல்: குறியீடு எழுதுவதற்கு முன் அதிக சிந்தனையுடன் திட்டமிடல்
- நீடித்த ஏஜென்டிக் பணிகள்: நீண்ட கோடிங் அமர்வுகளில் சூழல் மற்றும் தரத்தை பராமரிப்பு
- பெரிய குறியீட்டு அடிப்படை வழிசெலுத்தல்: சிக்கலான, பல-கோப்பு திட்டங்களில் மிகவும் நம்பகமான செயல்பாடு
- சுய-திருத்தம்: தனது சொந்த தவறுகளைப் பிடிக்க சிறந்த குறியீடு மதிப்பாய்வு மற்றும் பிழைத்திருத்த திறன்கள்
Terminal-Bench 2.0-வில், நிஜ உலக சிஸ்டம் நிர்வாகம் மற்றும் கோடிங் பணிகளைச் சோதிக்கும், Opus 4.6 எந்த மாடலின் மிக அதிக மதிப்பெண்ணையும் அடைகிறது.
Claude Opus 4.6 vs GPT-5.2 vs Gemini 2.5
| அளவுகோல் | Opus 4.6 | GPT-5.2 | Gemini 2.5 |
|---|---|---|---|
| Terminal-Bench 2.0 | #1 | #2 | #3 |
| Humanity's Last Exam | #1 | #3 | #2 |
| GDPval-AA | #1 (+144 Elo vs GPT-5.2) | #2 | #3 |
| BrowseComp | #1 | #2 | — |
GDPval-AA-வில், நிதி, சட்டம், மற்றும் பிற துறைகளில் பொருளாதார மதிப்புள்ள அறிவுசார் பணியின் செயல்திறனை அளவிடும், Opus 4.6 GPT-5.2-ஐ 144 Elo புள்ளிகளாலும் தனது முன்னோடியை (Opus 4.5) 190 புள்ளிகளாலும் விஞ்சுகிறது.
Claude Opus 4.6-இல் புதிய டெவலப்பர் அம்சங்கள்
Claude Code-இல் ஏஜென்ட் குழுக்கள்
Claude Code-இல் பணிகளில் ஒன்றாக வேலை செய்ய ஏஜென்ட் குழுக்களை அமைக்கலாம். பல Claude நிகழ்வுகள் குறியீட்டு அடிப்படையின் வெவ்வேறு பகுதிகளில் ஒரே நேரத்தில் ஒத்துழைக்கின்றன, சிக்கலான மறுகட்டமைப்பு, அம்ச மேம்பாடு, மற்றும் பிழை திருத்தத்தை வேகப்படுத்துகின்றன. அதே ஏஜென்ட் குழுக்கள் திறன் Claude Code Security-க்கு சக்தியளிக்கிறது, இது பாதிப்புகளை ஸ்கேன், சரிபார்க்க, மற்றும் உறுதிப்படுத்த பல ஏஜென்ட்களைப் பயன்படுத்துகிறது.
நீண்ட நேர பணிகளுக்கான சுருக்கம்
Claude இப்போது நீண்ட நேரம் இயங்கும் பணிகளின் போது தனது சொந்த சூழலை சுருக்கமாக்க முடியும். இதன் பொருள் ஏஜென்டிக் கோடிங் அமர்வுகள் சூழல் சாளர வரம்புகளை அடையாமல் மிகவும் நீண்ட நேரம் இயங்க முடியும். நூற்றுக்கணக்கான கருவி அழைப்புகளை உள்ளடக்கிய சிக்கலான, பல-கோப்பு மாற்றங்களுக்கு, சுருக்கம் அமர்வை மீண்டும் தொடங்காமல் உற்பத்தியாக வைத்திருக்கிறது.
தகவமைப்பு சிந்தனை
மாடல் எவ்வளவு விரிவான சிந்தனை பயன்படுத்த வேண்டும் என்ற சூழல் குறிப்புகளைப் புரிந்துகொள்கிறது. எளிய கேள்விகளுக்கு விரைவாக பதிலளிக்கிறது. சிக்கலான கோடிங் சிக்கல்களுக்கு ஆழமாக சிந்திக்கிறது. டெவலப்பர்களுக்கு ஒவ்வொரு கோரிக்கைக்கும் செலவு, வேகம், மற்றும் நுண்ணறிவை சமநிலைப்படுத்த புதிய முயற்சி கட்டுப்பாடுகளும் கிடைக்கின்றன.
1M டோக்கன் சூழல் சாளரம்
Claude Sonnet 4.6 போலவே, Opus 4.6 பீட்டாவில் 1M டோக்கன் சூழல் சாளரத்தைக் கொண்டுள்ளது. Opus-வகுப்பு மாடல்களுக்கு இது முதல் முறை, ஒரே கோரிக்கையில் முழு பெரிய குறியீட்டு அடிப்படைகளை செயலாக்க உதவுகிறது.
Claude Opus 4.6 விலை மற்றும் கிடைக்கும் தன்மை
Opus 4.6 claude.ai, API (claude-opus-4-6), Amazon Bedrock, மற்றும் Google Cloud Vertex AI-இல் ஒரு மில்லியன் டோக்கன்களுக்கு $5/$25 விலையில் கிடைக்கிறது.
அடிக்கடி கேட்கப்படும் கேள்விகள்
Claude Opus 4.6 எந்த அளவுகோல்களில் முன்னணியில் உள்ளது?
Claude Code-இல் ஏஜென்ட் குழுக்கள் என்றால் என்ன?
Claude Opus 4.6-இல் சுருக்கம் என்றால் என்ன?
Claude Opus 4.6 எவ்வளவு செலவாகும்?
புதுப்பிப்புகளைப் பெறுங்கள்
சமீபத்திய AI செய்திகளை மின்னஞ்சலில் பெறுங்கள்.
