title: "Mga Tool ng Ahente: Pagpapabuti ng Pagganap ng AI sa Pag-optimize ng Claude" slug: "writing-tools-for-agents" date: "2026-03-08" lang: "fil" source: "https://www.anthropic.com/engineering/writing-tools-for-agents" category: "Mga Tool ng Developer" keywords:
- mga ahente ng AI
- mga tool ng LLM
- Anthropic Claude
- pag-optimize ng tool
- mga sistemang AI na agentic
- Model Context Protocol (MCP)
- ebalwasyon ng tool
- prompt engineering
- mga tool ng developer
- pagganap ng AI
- mga sistemang non-deterministic
- pagbuo ng software meta_description: "Tuklasin kung paano sumulat at mag-optimize ng mga de-kalidad na tool ng AI agent gamit ang Anthropic Claude. Matuto tungkol sa paggawa ng mga prototype, komprehensibong ebalwasyon, at pakikipagtulungan ng ahente para sa pinahusay na pagganap ng AI." image: "/images/articles/writing-tools-for-agents.png" image_alt: "Ilustrasyon ng ebalwasyon at pag-optimize ng tool ng AI agent gamit ang Claude Code para sa pinahusay na pagganap." quality_score: 94 content_score: 93 seo_score: 95 companies:
- Anthropic schema_type: "NewsArticle" reading_time: 7 faq:
- question: "Ano ang Model Context Protocol (MCP) at paano ito nauugnay sa mga ahente ng AI?" answer: "Ang Model Context Protocol (MCP) ay isang balangkas na idinisenyo upang palakasin ang mga ahente ng large language model (LLM) sa pamamagitan ng pagbibigay sa kanila ng access sa posibleng daan-daang tool, na nagbibigay-daan sa kanila na malutas ang mga kumplikadong gawain sa totoong mundo. Tinutukoy nito ang isang standardized na paraan para makipag-ugnayan ang mga ahente sa mga panlabas na sistema at mapagkukunan ng data, na nagbabago kung paano magagamit ng mga ahente ng AI ang deterministic na software. Sa halip na umasa lamang ang mga ahente sa kanilang panloob na kaalaman, pinahihintulutan sila ng MCP na gumamit ng mga espesyal na tool, tulad ng kung paano gumagamit ang isang tao ng iba't ibang aplikasyon o sanggunian upang makumpleto ang mga gawain, kaya't lubhang napapalawak ang kanilang mga kakayahan at pagiging epektibo sa iba't ibang domain."
- question: "Bakit naiiba ang pagdidisenyo ng mga tool partikular para sa mga non-deterministic na ahente ng AI mula sa tradisyonal na pagbuo ng software?" answer: "Ang tradisyonal na pagbuo ng software ay karaniwang nagsasangkot ng paglikha ng mga kontrata sa pagitan ng mga deterministic na sistema, kung saan ang isang ibinigay na input ay palaging nagbibigay ng parehong nahuhulaang output. Gayunpaman, ang mga ahente ng AI ay non-deterministic, nangangahulugang ang kanilang mga tugon ay maaaring mag-iba kahit na may magkaparehong panimulang kondisyon. Ang pangunahing pagkakaibang ito ay nangangailangan ng muling pag-iisip sa disenyo ng tool. Sa halip na ipagpalagay ang tumpak, static na pakikipag-ugnayan, ang mga tool para sa mga ahente ng AI ay dapat na sapat na matibay upang mahawakan ang iba't ibang agentic na pangangatwiran, posibleng hindi pagkakaunawaan, o maging ang mga halusinasyon. Ang layunin ay gawing 'ergonomic' ang mga tool para sa mga ahente, pinapadali ang kanilang magkakaibang diskarte sa paglutas ng problema, na madalas na nagreresulta sa nakakagulat na intuitive na tool para sa mga gumagamit ng tao rin."
- question: "Ano ang mga kritikal na hakbang sa pagsusuri ng pagganap ng mga tool ng AI agent?" answer: "Ang pagsusuri sa mga tool ng AI agent ay nagsasangkot ng isang sistematikong diskarte na nagsisimula sa pagbuo ng magkakaibang hanay ng mga gawain sa pagtatasa ng totoong mundo. Ang mga gawaing ito ay dapat na sapat na kumplikado upang subukan ang kakayahan ng mga tool, posibleng nangangailangan ng maraming tool call. Susunod, ang ebalwasyon ay isinasagawa nang programmatically, karaniwang gumagamit ng mga agentic loop na ginagaya kung paano makikipag-ugnayan ang isang ahente sa mga tool. Ang mga pangunahing sukatan na kinokolekta ay kinabibilangan ng katumpakan, kabuuang runtime, bilang ng mga tool call, pagkonsumo ng token, at mga error sa tool. Sa wakas, ang pagsusuri ng mga resulta ay nagsasangkot ng pagbibigay ng pangangatwiran at feedback ng mga ahente, pagsusuri ng mga raw na transkripsyon, at pagtukoy ng mga pattern sa paggamit ng tool o mga error upang matukoy ang mga lugar para sa pagpapabuti sa mga paglalarawan ng tool, schemas, o implementasyon."
- question: "Paano mapapahusay ng mga ahente ng AI tulad ni Claude ang kanilang sariling mga tool?" answer: "Ipinapakita ng Anthropic na ang mga ahente ng AI, partikular ang mga modelo tulad ng Claude Code, ay maaaring gumanap ng isang mahalagang papel sa pag-optimize ng mga tool na ginagamit nila. Naisasakatuparan ito sa pamamagitan ng pagpapakain sa ahente ng mga transkripsyon at resulta mula sa mga ebalwasyon ng tool. Pagkatapos ay susuriin ni Claude ang mga pakikipag-ugnayan na ito, tukuyin ang mga inefficiencies, inconsistencies, o mga lugar kung saan hindi malinaw ang mga paglalarawan ng tool, at magmumungkahi ng mga refactoring. Halimbawa, masisiguro nito na ang mga implementasyon at paglalarawan ng tool ay mananatiling self-consistent pagkatapos ng mga pagbabago o magrekomenda ng mga pagsasaayos sa mga parameter para sa mas mahusay na kahusayan ng token. Ang collaborative na diskarte na ito ay gumagamit ng mga kakayahan sa pagsusuri ng ahente upang patuloy na mapabuti ang kalidad at ergonomics ng kanyang toolset, na humahantong sa pinahusay na pagganap."
- question: "Ano ang mga pangunahing prinsipyo sa pagsusulat ng mga de-kalidad na tool para sa mga ahente ng AI?" answer: "Maraming pangunahing prinsipyo ang gumagabay sa paglikha ng mga epektibong tool para sa mga ahente ng AI. Una, ang maingat na pagpili kung aling mga tool ang ipapatupad (at kung alin ang aalisin) ay mahalaga para sa kalinawan at kahusayan ng ahente. Pangalawa, malinaw na tinutukoy ng namespacing ng mga tool ang kanilang mga hangganan sa pagganap, binabawasan ang kalabuan para sa ahente. Pangatlo, ang mga tool ay dapat magbalik ng makabuluhan at maigting na konteksto sa mga ahente, tinutulungan ang kanilang paggawa ng desisyon. Pang-apat, ang pag-optimize ng mga tugon ng tool para sa kahusayan ng token ay mahalaga para sa pamamahala ng mga gastos at bilis ng pagproseso sa mga pakikipag-ugnayan ng LLM. Sa wakas, ang maingat na prompt-engineering ng mga paglalarawan at detalye ng tool ay nagsisiguro na tumpak na nauunawaan at nagagamit ng mga ahente ang layunin at kakayahan ng bawat tool, binabawasan ang mga error at pinakamataas ang pagiging epektibo."
Ang Mahalagang Papel ng mga Tool sa Pagganap ng AI Agent
Sa mabilis na umuunlad na tanawin ng AI, ang bisa ng isang matalinong ahente ay lubos na nakasalalay sa kalidad at kapakinabangan ng mga tool na ginagamit nito. Habang nagiging mas may kakayahan ang mga modelo ng artificial intelligence, na nagbibigay-daan sa kanila na magsagawa ng kumplikado at maraming-hakbang na mga gawain, ang paraan ng pakikipag-ugnayan nila sa mga panlabas na sistema – sa pamamagitan ng "mga tool" – ay nagiging pinakamahalaga. Ibinahagi ng Anthropic, isang nangunguna sa pananaliksik at pagpapaunlad ng AI, ang mahahalagang pananaw kung paano bumuo, suriin, at kahit i-optimize ang mga tool na ito, na lubos na nagpapalakas ng pagganap ng ahente.
Sa puso ng diskarteng ito ay nakasalalay ang Model Context Protocol (MCP), isang sistema na idinisenyo upang bigyan ng kapangyarihan ang mga ahente ng large language model (LLM) na may access sa malawak na hanay ng mga functionality. Gayunpaman, ang simpleng pagbibigay lamang ng mga tool ay hindi sapat; dapat silang maging pinakamabisang posible. Ang artikulong ito ay sumusuri sa mga napatunayang pamamaraan ng Anthropic para sa pagpapabuti ng mga sistemang AI na agentic, na nagbibigay-diin kung paano maaaring magkasamang pinuhin ng mga modelo ng AI tulad ni Claude ang kanilang sariling mga toolset. Ang paglalakbay mula sa paunang konsepto hanggang sa na-optimize na tool ay nagsasangkot ng prototyping, mahigpit na ebalwasyon, at isang collaborative na feedback loop sa mismong ahente.
Pag-unawa sa mga Tool ng AI Agent: Isang Bagong Paradigma para sa Software
Tradisyonal, ang pagbuo ng software ay gumagana sa mga deterministic na prinsipyo: ibinigay ang parehong input, ang isang function ay palaging magbibigay ng parehong nahuhulaang output. Isaalang-alang ang isang simpleng tawag na getWeather("NYC"); ito ay palaging kumukuha ng panahon ng New York City sa magkaparehong paraan. Gayunpaman, ang mga ahente ng AI, tulad ng Claude ng Anthropic, ay gumagana bilang mga non-deterministic na sistema. Nangangahulugan ito na ang kanilang mga tugon ay maaaring mag-iba kahit na sa magkaparehong paunang kondisyon.
Ang pangunahing pagkakaibang ito ay nangangailangan ng isang pagbabago sa paradigma kapag nagdidisenyo ng software para sa mga ahente. Ang mga tool para sa mga ahente ng AI ay hindi lamang mga function o API para sa ibang mga developer; ang mga ito ay mga interface na idinisenyo para sa isang matalino, ngunit kung minsan ay hindi mahuhulaan, na entidad. Kapag tinanong ng isang user, "Dapat ba akong magdala ng payong ngayon?", maaaring tumawag ang isang ahente sa isang tool ng panahon, gumamit ng pangkalahatang kaalaman, o magtanong pa para sa paglilinaw sa lokasyon. Paminsan-minsan, maaaring magkaroon ng halusinasyon ang mga ahente o hindi maunawaan kung paano gamitin nang tama ang isang tool.
Samakatuwid, ang layunin ay dagdagan ang "surface area" kung saan maaaring maging epektibo ang mga ahente. Nangangahulugan ito ng paglikha ng mga tool na hindi lamang matibay kundi pati na rin "ergonomic" para magamit ng mga ahente. Kapansin-pansin, ipinapakita ng karanasan ng Anthropic na ang mga tool na idinisenyo nang isinasaalang-alang ang non-deterministic na kalikasan ng isang ahente ay madalas na nagiging nakakagulat na intuitive at madaling maunawaan para sa mga gumagamit ng tao. Ang perspektibong ito sa pagbuo ng tool ay susi sa pag-unlock ng buong potensyal ng mga sopistikadong modelo tulad ng Claude Opus o Claude Sonnet sa mga real-world na aplikasyon.
Pagbuo ng mga Epektibong Tool ng AI: Mula sa Prototype hanggang sa Optimization
Ang paglalakbay ng paglikha ng mga epektibong tool ng AI agent ay isang umuulit na proseso ng pagbuo, pagsubok, at pagpino. Binibigyang-diin ng Anthropic ang isang hands-on na diskarte, nagsisimula sa mabilis na prototyping at pagkatapos ay lumilipat sa komprehensibong ebalwasyon.
Pagbuo ng isang Mabilis na Prototype
Ang pag-asa kung paano makikipag-ugnayan ang mga ahente sa mga tool ay maaaring maging mahirap nang walang praktikal na karanasan. Ang unang hakbang ay nagsasangkot ng mabilis na pagtatayo ng isang prototype. Kung ginagamit ng mga developer ang isang ahente tulad ng Claude Code para sa paglikha ng tool, ang pagbibigay ng mahusay na nakabalangkas na dokumentasyon para sa anumang pinagbabatayan na software libraries, APIs, o SDKs (kabilang ang MCP SDK) ay mahalaga. Ang mga flat na 'llms.txt' file, na madalas makita sa mga opisyal na site ng dokumentasyon, ay partikular na LLM-friendly.
Ang mga prototype na ito ay maaaring balutin sa isang lokal na MCP server o isang Desktop Extension (DXT) upang mapadali ang lokal na pagsubok sa loob ng Claude Code o ng Claude Desktop app. Para sa programatikong pagsubok, ang mga tool ay maaari ring direktang ipasa sa mga Anthropic API call. Ang paunang yugto na ito ay naghihikayat sa mga developer na personal na subukan ang mga tool, mangalap ng feedback ng user, at bumuo ng intuwisyon sa paligid ng mga inaasahang kaso ng paggamit at mga prompt na nilalayon ng mga tool na hawakan.
Pagpapatakbo ng isang Komprehensibong Ebalwasyon
Kapag gumagana na ang isang prototype, ang susunod na kritikal na hakbang ay ang pagsukat kung gaano epektibo ang paggamit ng ahente sa mga tool na ito sa pamamagitan ng isang sistematikong ebalwasyon. Kabilang dito ang pagbuo ng maraming gawain sa ebalwasyon na nakabatay sa mga real-world na sitwasyon.
Pagbuo ng mga Gawain sa Ebalwasyon
Ang mga gawain sa ebalwasyon ay dapat inspirasyon ng aktwal na mga query ng user at gumamit ng makatotohanang mapagkukunan ng data. Mahalagang iwasan ang simplistikong mga kapaligiran ng "sandbox" na hindi sapat na sinusubukan ang kumplikado ng mga tool. Ang matitibay na gawain sa ebalwasyon ay madalas na nangangailangan ng mga ahente na gumawa ng maraming tool call upang makamit ang isang solusyon.
| Uri ng Gawain | Matibay na Halimbawa | Mahinang Halimbawa |
|---|---|---|
| Pag-iiskedyul ng Pulong | "Mag-iskedyul ng pulong kay Jane sa susunod na linggo upang talakayin ang aming pinakabagong proyekto ng Acme Corp. Ilakip ang mga tala mula sa aming huling pagpupulong sa pagpaplano ng proyekto at magreserba ng conference room." | "Mag-iskedyul ng pulong kay jane@acme.corp sa susunod na linggo." |
| Serbisyo sa Customer | "Iniulat ng Customer ID 9182 na sila ay siningil ng tatlong beses para sa isang pagtatangka ng pagbili. Hanapin ang lahat ng kaugnay na log entries at tukuyin kung may iba pang mga customer na naapektuhan ng parehong isyu." | "Maghanap sa mga log ng pagbabayad para sa 'purchase_complete' at 'customer_id=9182'." |
| Pagsusuri ng Pagpapanatili | "Si Customer Sarah Chen ay nagsumite lamang ng kahilingan sa pagkansela. Maghanda ng alok sa pagpapanatili. Tukuyin: (1) kung bakit sila umaalis, (2) kung anong alok sa pagpapanatili ang magiging pinakamakapangyarihan, at (3) anumang mga salik ng panganib na dapat nating malaman bago gumawa ng alok." | "Hanapin ang kahilingan sa pagkansela ng Customer ID 45892." |
Ang bawat prompt ay dapat ipares sa isang nabe-verify na tugon o kinalabasan. Ang mga verifier ay maaaring mula sa simpleng paghahambing ng string hanggang sa mas advanced na mga ebalwasyon na gumagamit ng isang ahente upang husgahan ang tugon. Mahalagang iwasan ang labis na mahigpit na mga verifier na maaaring tanggihan ang mga balidong tugon dahil sa maliliit na pagkakaiba sa pag-format. Bilang opsyon, maaaring tukuyin ng mga developer ang mga inaasahang tool call, bagaman ito ay dapat gawin nang maingat upang maiwasan ang labis na pagtukoy o overfitting sa mga partikular na diskarte, dahil ang mga ahente ay maaaring makahanap ng maraming balidong paraan sa isang solusyon.
Pagpapatakbo ng Ebalwasyon nang Programmatically
Inirerekomenda ng Anthropic ang pagpapatakbo ng mga ebalwasyon nang programmatically gamit ang direktang LLM API calls sa loob ng simpleng agentic loops (hal., while loops na nagpapalit-palit sa LLM API at tool calls). Ang bawat ahente ng ebalwasyon ay binibigyan ng isang gawain na prompt at ang mga tool. Sa mga system prompt para sa mga ahenteng ito, kapaki-pakinabang na utusan silang mag-output ng structured response blocks (para sa pag-verify), reasoning, at feedback blocks bago ang tool call at response blocks. Ito ay naghihikayat ng mga gawi ng chain-of-thought (CoT), na nagpapalakas ng epektibong katalinuhan ng LLM. Ang tampok na "interleaved thinking" ng Claude ay nag-aalok ng katulad na functionality out-of-the-box, na nagbibigay ng mga pananaw sa kung bakit gumagawa ang mga ahente ng mga partikular na pagpili ng tool.
Bukod sa top-level accuracy, ang pagkolekta ng mga sukatan tulad ng kabuuang runtime, bilang ng tool calls, token consumption, at tool errors ay mahalaga. Ang pagsubaybay sa mga tool call ay maaaring magbunyag ng mga karaniwang workflow ng ahente, na nagmumungkahi ng mga pagkakataon para sa pagsasama-sama o pagpino ng tool.
Pag-optimize ng mga Tool gamit ang AI: Collaborative na Diskarte ng Claude
Ang pagsusuri ng mga resulta ng ebalwasyon ay isang kritikal na yugto. Ang mga ahente mismo ay maaaring maging napakahalagang kasosyo sa prosesong ito, sa pagtukoy ng mga isyu at pagbibigay ng feedback. Gayunpaman, ang kanilang feedback ay hindi palaging tahasan; ang kanilang pagkukulang ay maaaring kasing-tanda ng kanilang pagsasama. Dapat suriin ng mga developer ang pangangatwiran ng ahente (CoT), suriin ang mga raw na transkripsyon (kabilang ang mga tool call at tugon), at suriin ang mga sukatan ng tool calling. Halimbawa, ang paulit-ulit na tool calls ay maaaring magpahiwatig ng pangangailangan para sa pagsasaayos ng pagination o mga limitasyon sa token, habang ang madalas na mga error dahil sa hindi balidong parameter ay maaaring magpahiwatig ng hindi malinaw na paglalarawan ng tool.
Ang isang kapansin-pansing halimbawa mula sa Anthropic ay kinasasangkutan ng web search tool ni Claude, kung saan ito ay hindi kinakailangan na idinagdag ang '2025' sa mga query, na nagbabias sa mga resulta. Ang pagpapabuti ng paglalarawan ng tool ang susi upang mailagay si Claude sa tamang direksyon.
Ang pinaka-makabagong aspeto ng metodolohiya ng Anthropic ay ang kakayahang hayaan ang mga ahente na suriin ang kanilang sariling mga resulta at pagbutihin ang kanilang mga tool. Sa pamamagitan ng pagsasama-sama ng mga transcript ng ebalwasyon at pagpapakain sa mga ito kay Claude Code, maaaring gamitin ng mga developer ang kadalubhasaan ni Claude sa pagsusuri ng kumplikadong mga interaksyon at pagbabago ng mga tool. Mahusay si Claude sa pagtiyak ng pagkakapare-pareho sa pagitan ng mga implementasyon at paglalarawan ng tool, kahit na sa maraming pagbabago. Ang malakas na feedback loop na ito ay nangangahulugang karamihan sa sariling payo ng Anthropic sa pagbuo ng tool ay nabuo at pinino sa pamamagitan ng prosesong ito ng agent-assisted optimization, na nagpapahiwatig ng lumalaking trend ng agentic workflows sa pagbuo ng software.
Mga Pangunahing Prinsipyo para sa De-kalidad na Pagbuo ng Tool ng Ahente
Sa pamamagitan ng malawakang eksperimentasyon at agent-driven optimization, natukoy ng Anthropic ang ilang pangunahing prinsipyo para sa paggawa ng mga de-kalidad na tool para sa mga ahente ng AI:
- Strategic na Pagpili ng Tool: Maingat na piliin kung aling mga tool ang ipapatupad, at kritikal, kung alin ang hindi. Ang pag-overload ng isang ahente sa mga hindi kinakailangang tool ay maaaring humantong sa pagkalito at ineficiency.
- Malinaw na Namespacing: Tukuyin ang malinaw na mga hangganan at functionality para sa bawat tool sa pamamagitan ng epektibong namespacing. Nakakatulong ito sa mga ahente na maunawaan ang tumpak na saklaw at layunin ng bawat kakayahan.
- Makabuluhang Pagbalik ng Konteksto: Ang mga tool ay dapat magbalik ng maigsi at nauugnay na konteksto sa ahente, na nagbibigay-daan sa may kaalamang paggawa ng desisyon nang walang maligoy o labis na impormasyon.
- Token Efficiency Optimization: I-optimize ang mga tugon ng tool upang maging token-efficient. Sa mga pakikipag-ugnayan ng LLM, bawat token ay mahalaga para sa parehong gastos at bilis ng pagproseso.
- Tumpak na Prompt Engineering: Maingat na i-prompt-engineer ang mga paglalarawan at detalye ng tool. Ang malinaw at hindi malabong mga tagubilin ay mahalaga para sa mga ahente upang tumpak na bigyang-kahulugan at magamit ang layunin at kakayahan ng bawat tool.
Sa pamamagitan ng pagsunod sa mga prinsipyong ito at pagtanggap ng isang iterative, agent-assisted development cycle, ang mga developer ay maaaring bumuo ng matatag, mahusay, at napaka-epektibong mga tool na lubos na nagpapahusay sa pagganap at kakayahan ng mga ahente ng AI, na nagtutulak sa mga hangganan ng kung ano ang maaaring makamit ng mga matalinong sistema na ito.
Orihinal na pinagmulan
https://www.anthropic.com/engineering/writing-tools-for-agentsMga Karaniwang Tanong
What is the Model Context Protocol (MCP) and how does it relate to AI agents?
Why is designing tools specifically for non-deterministic AI agents different from traditional software development?
What are the critical steps in evaluating the performance of AI agent tools?
How can AI agents like Claude optimize their own tools?
What are the key principles for writing high-quality tools for AI agents?
Manatiling Updated
Kunin ang pinakabagong AI news sa iyong inbox.
