{
"prompt": [
{"role": "system", "content": "Jūs esat noderīgs asistents. Izmantojot rīkus, atbildiet ar: [...]"},
{"role": "user", "content": "Saņemiet laikapstākļus"}
],
"reward_model": {
"ground_truth": "Lai sniegtu jums informāciju par laikapstākļiem, lūdzu, norādiet atrašanās vietu?"
}
}
Qwen 2.5 7B Instruct precizēšana ar SageMaker AI
Modeļa, piemēram, Qwen 2.5 7B Instruct, precizēšanas process Amazon SageMaker AI Studio ir racionalizēts un intuitīvs. Pēc tam, kad ir nodrošināti nepieciešamie priekšnosacījumi (AWS konts, IAM loma, SageMaker AI domēns, S3 segments), lietotāji var navigēt uz sadaļu Modeļi SageMaker AI Studio.
No turienes, izvēloties Qwen 2.5 7B Instruct un atlasot Pielāgot ar UI, tiek atvērta īpaša konfigurācijas lapa. Šī saskarne ļauj:
- Tehnikas izvēle: Skaidri izvēlēties
Pastiprināto mācīšanos ar pārbaudāmām atlīdzībām (RLVR)no nolaižamās izvēlnes. - Datu ievade: Norādīt uz sagatavotiem apmācības datiem, kas glabājas Amazon S3 segmentā.
- Atlīdzības funkcija: Konfigurēt daudzlīmeņu vērtēšanas mehānismu, kas nosaka, kā kandidātu atbildes tiek novērtētas pret
ground_truth. - Hiperparametru konfigurācija: Pielāgot parametrus, piemēram, partijas lielumu, lai gan SageMaker AI bieži automātiski apstrādā optimālos iestatījumus.
SageMaker AI atbalsta dažādas modeļu saimes, tostarp Amazon Nova, GPT-OSS, Llama, Qwen un DeepSeek, kā arī dažādas tehnikas, piemēram, Uzraudzīto precizēšanu (SFT), Tiešo preferenču optimizāciju (DPO), RLVR un Pastiprināto mācīšanos no AI atgriezeniskās saites (RLAIF). Integrētā MLflow izsekošana nodrošina pārskatāmību apmācības un validācijas metrikā, vienkāršojot veiktspējas uzraudzību un iterāciju. Šī lietošanas ērtība dramatiski paātrina izstrādes dzīves ciklu izstrādātājiem, kas veido sarežģītas github-agentic-workflows.
Novērtēšana un ieviešanas panākumi
Mūsu precizētā Qwen 2.5 7B Instruct modeļa efektivitāte tika stingri novērtēta, izmantojot neizmantotus datus, ieskaitot scenārijus ar pilnīgi neparedzētiem rīkiem — izšķirošs vispārināšanas tests. Rezultāti bija pārliecinoši: precizētais modelis sasniedza ievērojamu 57% uzlabojumu rīku izsaukšanas atlīdzībā salīdzinājumā ar pamata modeli. Šis ievērojamais veiktspējas lēciens scenārijos, ko tas nebija sastapis apmācības laikā, uzsver RLVR spēku mācot modeļiem stabilas lēmumu pieņemšanas spējas rīku mijiedarbībā.
Šī uzlabotā uzticamība tieši pārvēršas lielākā uzticībā un pārliecībā par AI aģentu ieviešanu ražošanas vidē. Samazinot rīku halucināciju gadījumus, nepareizus parametrus un neatbilstošas darbības, uzņēmumi var izmantot AI aģentus kritiskākiem un jutīgākiem uzdevumiem. Ar SageMaker AI, kas apstrādā modeļa ieviešanas un infrastruktūras pārvaldības sarežģītību, izstrādātāji var nemanāmi pāriet no precizēšanas uz ražošanu, realizējot savu aģentisko AI risinājumu pilnu potenciālu. Šī spēja saskan ar plašāku redzējumu par aģentiskās AI operacionalizēšanu reālās pasaules ietekmei.
Rezumējot, Amazon SageMaker AI bezservera modeļu pielāgošanas un RLVR stabilo mācīšanās iespēju kombinācija nodrošina jaudīgu ceļu uz ļoti uzticamu aģentisku rīku izsaukšanas sistēmu izveidi. Šī inovatīvā pieeja paātrina izstrādi, samazina operatīvo slogu un galu galā nodrošina AI aģentus, kas darbojas ar nepieredzētu precizitāti un uzticamību.
Sākotnējais avots
https://aws.amazon.com/blogs/machine-learning/accelerate-agentic-tool-calling-with-serverless-model-customization-in-amazon-sagemaker-ai/Bieži uzdotie jautājumi
What is agentic tool calling and why is it crucial for AI agents?
What are the common challenges AI agents face when performing tool calls?
How does Amazon SageMaker AI address the challenges of agentic tool calling?
What is Reinforcement Learning with Verifiable Rewards (RLVR) and how does it work?
Why is RLVR considered more effective than Supervised Fine-Tuning (SFT) for tool calling tasks?
How is training data prepared for RLVR in Amazon SageMaker AI for agentic tool calling?
What agent behaviors are critical for building robust and reliable tool-calling AI agents?
What prerequisites are needed to use serverless model customization in SageMaker AI?
Esiet informēti
Saņemiet jaunākās AI ziņas savā e-pastā.
