{
"prompt": [
{"role": "system", "content": "You are a helpful assistant. When using tools, respond with: [...]"},
{"role": "user", "content": "Get the weather"}
],
"reward_model": {
"ground_truth": "To provide you with the weather information, could you please specify the location?"
}
}
Qwen 2.5 7B Instruct modelio derinimas su SageMaker AI
Modelio, tokio kaip Qwen 2.5 7B Instruct, derinimas Amazon SageMaker AI Studio yra supaprastintas ir intuityvus. Įsitikinus, kad yra įvykdytos būtinos išankstinės sąlygos (AWS paskyra, IAM rolė, SageMaker AI domenas, S3 kibiras), vartotojai gali pereiti į Modelių skyrių SageMaker AI Studio.
Iš ten, pasirinkus Qwen 2.5 7B Instruct ir pasirinkus Tinkinti naudojant vartotojo sąsają, atidaromas specialus konfigūracijos puslapis. Ši sąsaja leidžia:
- Technikos pasirinkimas: Aiškiai pasirinkti
mokymąsi su patikrinamais atlygiais (RLVR)iš išskleidžiamojo meniu. - Duomenų įvestis: Nurodyti paruoštus mokymo duomenis, saugomus Amazon S3 kibire.
- Atlygio funkcija: Konfigūruoti pakopinę vertinimo sistemą, kuri apibrėžia, kaip kandidatų atsakymai vertinami pagal
ground_truth. - Hiperparametrų konfigūracija: Parametrų, tokių kaip paketinis dydis, koregavimas, nors SageMaker AI dažnai automatiškai tvarko optimalius nustatymus.
SageMaker AI palaiko platų modelių šeimų spektrą, įskaitant Amazon Nova, GPT-OSS, Llama, Qwen ir DeepSeek, kartu su įvairiomis technikomis, tokiomis kaip prižiūrimas derinimas (SFT), tiesioginis preferencijų optimizavimas (DPO), RLVR ir mokymasis su atlygiu iš AI grįžtamojo ryšio (RLAIF). Integruotas MLflow sekimas suteikia matomumą mokymo ir patvirtinimo metrikoms, supaprastindamas našumo stebėjimą ir iteraciją. Šis paprastas naudojimas žymiai pagreitina kūrimo ciklą kūrėjams, kuriantiems sudėtingus github-agentic-workflows.
Vertinimas ir diegimo sėkmė
Mūsų suderinto Qwen 2.5 7B Instruct modelio efektyvumas buvo kruopščiai įvertintas naudojant sulaikytus duomenis, įskaitant scenarijus su visiškai nematytais įrankiais – tai yra kritinis apibendrinimo testas. Rezultatai buvo įtikinami: suderintas modelis pasiekė nepaprastą 57 % pagerėjimą įrankių iškvietimo atlygio srityje, palyginti su baziniu modeliu. Šis reikšmingas našumo šuolis scenarijuose, su kuriais modelis nesusidūrė mokymosi metu, pabrėžia RLVR galią mokyti modelius patikimų sprendimų priėmimo gebėjimų įrankių sąveikai.
Šis padidintas patikimumas tiesiogiai reiškia didesnį pasitikėjimą ir pasitikėjimą diegiant AI agentus gamybos aplinkose. Sumažinant įrankių haliucinacijų, neteisingų parametrų ir netinkamų veiksmų atvejus, įmonės gali panaudoti AI agentus kritiškesnėms ir jautresnėms užduotims. Su SageMaker AI, tvarkančia modelio diegimo ir infrastruktūros valdymo sudėtingumus, kūrėjai gali sklandžiai pereiti nuo derinimų prie gamybos, išnaudodami visą savo agentinių AI sprendimų potencialą. Ši galimybė atitinka platesnę agentinio AI operacionalizavimo viziją, siekiant realaus poveikio.
Apibendrinant, Amazon SageMaker AI serverless modelio pritaikymo ir tvirtų RLVR mokymosi galimybių derinys suteikia galingą būdą kurti itin patikimas agentinio įrankių iškvietimo sistemas. Šis inovatyvus požiūris pagreitina kūrimą, sumažina operacinę naštą ir galiausiai pristato AI agentus, kurie veikia su precedento neturinčiu tikslumu ir patikimumu.
Originalus šaltinis
https://aws.amazon.com/blogs/machine-learning/accelerate-agentic-tool-calling-with-serverless-model-customization-in-amazon-sagemaker-ai/Dažniausiai užduodami klausimai
What is agentic tool calling and why is it crucial for AI agents?
What are the common challenges AI agents face when performing tool calls?
How does Amazon SageMaker AI address the challenges of agentic tool calling?
What is Reinforcement Learning with Verifiable Rewards (RLVR) and how does it work?
Why is RLVR considered more effective than Supervised Fine-Tuning (SFT) for tool calling tasks?
How is training data prepared for RLVR in Amazon SageMaker AI for agentic tool calling?
What agent behaviors are critical for building robust and reliable tool-calling AI agents?
What prerequisites are needed to use serverless model customization in SageMaker AI?
Būkite informuoti
Gaukite naujausias AI naujienas el. paštu.
