Claude Opus 4.6: கோடிங் மற்றும் சிந்தனை அளவுகோல்களில் #1

Claude Opus 4.6 அளவுகோல் முடிவுகள்

Claude Opus 4.6 Anthropic-ன் மிகவும் திறன் வாய்ந்த மாடல் ஆகும், கோடிங், சிந்தனை, மற்றும் அறிவுசார் பணியில் புதிய சாதனைகளை நிகழ்த்துகிறது. இது Terminal-Bench 2.0-இல் மிக அதிக மதிப்பெண்ணை அடைகிறது, ஏஜென்டிக் கோடிங்கிற்கான முன்னணி அளவுகோல், மற்றும் Humanity's Last Exam-இல் அனைத்து ஃப்ரான்டியர் மாடல்களையும் விஞ்சுகிறது, பல்துறை சிந்தனை சோதனை.

கோடிங் பணிகளுக்கு ஏற்கனவே Claude Sonnet 4.6 பயன்படுத்தும் டெவலப்பர்களுக்கு, Opus 4.6 சிக்கலான, பல-படி ஏஜென்டிக் பணிக்கான அடுத்த நிலை செயல்திறனாகும்.

கோடிங் செயல்திறன்: Terminal-Bench 2.0-இல் #1

Opus 4.6 தனது முன்னோடியின் கோடிங் திறன்களை ஒவ்வொரு பரிமாணத்திலும் மேம்படுத்துகிறது:

கவனமான திட்டமிடல்: குறியீடு எழுதுவதற்கு முன் அதிக சிந்தனையுடன் திட்டமிடல்
நீடித்த ஏஜென்டிக் பணிகள்: நீண்ட கோடிங் அமர்வுகளில் சூழல் மற்றும் தரத்தை பராமரிப்பு
பெரிய குறியீட்டு அடிப்படை வழிசெலுத்தல்: சிக்கலான, பல-கோப்பு திட்டங்களில் மிகவும் நம்பகமான செயல்பாடு
சுய-திருத்தம்: தனது சொந்த தவறுகளைப் பிடிக்க சிறந்த குறியீடு மதிப்பாய்வு மற்றும் பிழைத்திருத்த திறன்கள்

Terminal-Bench 2.0-வில், நிஜ உலக சிஸ்டம் நிர்வாகம் மற்றும் கோடிங் பணிகளைச் சோதிக்கும், Opus 4.6 எந்த மாடலின் மிக அதிக மதிப்பெண்ணையும் அடைகிறது.

Claude Opus 4.6 vs GPT-5.2 vs Gemini 2.5

அளவுகோல்	Opus 4.6	GPT-5.2	Gemini 2.5
Terminal-Bench 2.0	#1	#2	#3
Humanity's Last Exam	#1	#3	#2
GDPval-AA	#1 (+144 Elo vs GPT-5.2)	#2	#3
BrowseComp	#1	#2	—

GDPval-AA-வில், நிதி, சட்டம், மற்றும் பிற துறைகளில் பொருளாதார மதிப்புள்ள அறிவுசார் பணியின் செயல்திறனை அளவிடும், Opus 4.6 GPT-5.2-ஐ 144 Elo புள்ளிகளாலும் தனது முன்னோடியை (Opus 4.5) 190 புள்ளிகளாலும் விஞ்சுகிறது.

Claude Opus 4.6-இல் புதிய டெவலப்பர் அம்சங்கள்

Claude Code-இல் ஏஜென்ட் குழுக்கள்

Claude Code-இல் பணிகளில் ஒன்றாக வேலை செய்ய ஏஜென்ட் குழுக்களை அமைக்கலாம். பல Claude நிகழ்வுகள் குறியீட்டு அடிப்படையின் வெவ்வேறு பகுதிகளில் ஒரே நேரத்தில் ஒத்துழைக்கின்றன, சிக்கலான மறுகட்டமைப்பு, அம்ச மேம்பாடு, மற்றும் பிழை திருத்தத்தை வேகப்படுத்துகின்றன. அதே ஏஜென்ட் குழுக்கள் திறன் Claude Code Security-க்கு சக்தியளிக்கிறது, இது பாதிப்புகளை ஸ்கேன், சரிபார்க்க, மற்றும் உறுதிப்படுத்த பல ஏஜென்ட்களைப் பயன்படுத்துகிறது.

நீண்ட நேர பணிகளுக்கான சுருக்கம்

Claude இப்போது நீண்ட நேரம் இயங்கும் பணிகளின் போது தனது சொந்த சூழலை சுருக்கமாக்க முடியும். இதன் பொருள் ஏஜென்டிக் கோடிங் அமர்வுகள் சூழல் சாளர வரம்புகளை அடையாமல் மிகவும் நீண்ட நேரம் இயங்க முடியும். நூற்றுக்கணக்கான கருவி அழைப்புகளை உள்ளடக்கிய சிக்கலான, பல-கோப்பு மாற்றங்களுக்கு, சுருக்கம் அமர்வை மீண்டும் தொடங்காமல் உற்பத்தியாக வைத்திருக்கிறது.

தகவமைப்பு சிந்தனை

மாடல் எவ்வளவு விரிவான சிந்தனை பயன்படுத்த வேண்டும் என்ற சூழல் குறிப்புகளைப் புரிந்துகொள்கிறது. எளிய கேள்விகளுக்கு விரைவாக பதிலளிக்கிறது. சிக்கலான கோடிங் சிக்கல்களுக்கு ஆழமாக சிந்திக்கிறது. டெவலப்பர்களுக்கு ஒவ்வொரு கோரிக்கைக்கும் செலவு, வேகம், மற்றும் நுண்ணறிவை சமநிலைப்படுத்த புதிய முயற்சி கட்டுப்பாடுகளும் கிடைக்கின்றன.

1M டோக்கன் சூழல் சாளரம்

Claude Sonnet 4.6 போலவே, Opus 4.6 பீட்டாவில் 1M டோக்கன் சூழல் சாளரத்தைக் கொண்டுள்ளது. Opus-வகுப்பு மாடல்களுக்கு இது முதல் முறை, ஒரே கோரிக்கையில் முழு பெரிய குறியீட்டு அடிப்படைகளை செயலாக்க உதவுகிறது.

Claude Opus 4.6 விலை மற்றும் கிடைக்கும் தன்மை

Opus 4.6 claude.ai, API (claude-opus-4-6), Amazon Bedrock, மற்றும் Google Cloud Vertex AI-இல் ஒரு மில்லியன் டோக்கன்களுக்கு $5/$25 விலையில் கிடைக்கிறது.

அசல் மூலம்

https://www.anthropic.com/news/claude-opus-4-6

அடிக்கடி கேட்கப்படும் கேள்விகள்

Claude Opus 4.6 எந்த அளவுகோல்களில் முன்னணியில் உள்ளது?

Claude Opus 4.6 நான்கு முக்கிய அளவுகோல்களில் #1 நிலையைப் பெற்றுள்ளது: ஏஜென்டிக் கோடிங்கிற்கான Terminal-Bench 2.0, பல்துறை சிந்தனைக்கான Humanity's Last Exam, தகவல் மீட்டெடுப்புக்கான BrowseComp, மற்றும் அறிவுசார் பணிக்கான GDPval-AA. GDPval-AA-வில், இது GPT-5.2-ஐ 144 Elo புள்ளிகளாலும் அதன் முன்னோடி Opus 4.5-ஐ 190 புள்ளிகளாலும் விஞ்சுகிறது. இந்த முடிவுகள் இதை பிப்ரவரி 2026 நிலவரப்படி கோடிங் மற்றும் சிந்தனை இரண்டிலும் மிக அதிக மதிப்பெண் பெற்ற ஃப்ரான்டியர் மாடலாக்குகின்றன.

Claude Code-இல் ஏஜென்ட் குழுக்கள் என்றால் என்ன?

ஏஜென்ட் குழுக்கள் என்பது Claude Code-இல் உள்ள புதிய அம்சம் ஆகும், இது பல Claude நிகழ்வுகளை இணையாகப் பணிகளில் ஒத்துழைக்க அனுமதிக்கிறது. உதாரணமாக, ஒரு ஏஜென்ட் ஒரு தொகுதியை மறுகட்டமைக்கலாம், மற்றொன்று சோதனைகள் எழுதலாம், மூன்றாவது ஆவணங்களை புதுப்பிக்கலாம். இந்த இணையான அணுகுமுறை ஒரு ஏஜென்டுக்கு அதிக நேரம் எடுக்கும் சிக்கலான குறியீட்டு அடிப்படை மாற்றங்களை வேகப்படுத்துகிறது. ஏஜென்ட் குழுக்கள் Opus 4.6-உடன் அறிமுகமாகி Opus மற்றும் Sonnet இரண்டு மாடல்களிலும் வேலை செய்கின்றன.

Claude Opus 4.6-இல் சுருக்கம் என்றால் என்ன?

சுருக்கம் என்பது நீண்ட நேரம் இயங்கும் ஏஜென்டிக் பணிகளின் போது Claude தனது சொந்த உரையாடல் வரலாற்றை சுருக்கமாக்க அனுமதிக்கும் சூழல் மேலாண்மை அம்சமாகும். கோடிங் அமர்வு சூழல் சாளர வரம்பை நெருங்கும்போது, சுருக்கம் முந்தைய சூழலை சுருக்கமாக மாற்றுகிறது, இதனால் Claude பணியை இழக்காமல் தொடர்ந்து வேலை செய்ய முடியும். நூற்றுக்கணக்கான கருவி அழைப்புகள் மற்றும் கோப்பு வாசிப்புகளை உள்ளடக்கிய பல-கோப்பு மறுகட்டமைப்பு அமர்வுகளுக்கு இது குறிப்பாக பயனுள்ளது.

Claude Opus 4.6 எவ்வளவு செலவாகும்?

Claude Opus 4.6 ஒரு மில்லியன் உள்ளீட்டு டோக்கன்களுக்கு $5 மற்றும் ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $25 செலவாகும், முந்தைய Opus மாடல்களின் அதே விலை. இது claude.ai, மாடல் ID claude-opus-4-6 உடன் Anthropic API, Amazon Bedrock, மற்றும் Google Cloud Vertex AI-இல் கிடைக்கிறது. ஒப்பிடுகையில், Claude Sonnet 4.6 ஒரு மில்லியன் டோக்கன்களுக்கு $3/$15 விலையில் ஒத்த கோடிங் தரத்தை வழங்குகிறது.

புதுப்பிப்புகளைப் பெறுங்கள்

சமீபத்திய AI செய்திகளை மின்னஞ்சலில் பெறுங்கள்.

பகிர்