{
"prompt": [
{"role": "system", "content": "You are a helpful assistant. When using tools, respond with: [...]"},
{"role": "user", "content": "Get the weather"}
],
"reward_model": {
"ground_truth": "To provide you with the weather information, could you please specify the location?"
}
}
SageMaker AI ile Qwen 2.5 7B Instruct Modelinin İnce Ayarı
Amazon SageMaker AI Studio içinde Qwen 2.5 7B Instruct gibi bir modele ince ayar yapma süreci basitleştirilmiş ve sezgiseldir. Gerekli önkoşullar (AWS hesabı, IAM rolü, SageMaker AI alanı, S3 kovası) karşılandıktan sonra, kullanıcılar SageMaker AI Studio'daki Modeller bölümüne gidebilirler.
Buradan, Qwen 2.5 7B Instruct seçilerek ve UI ile Özelleştir seçeneği tıklanarak özel bir yapılandırma sayfası açılır. Bu arayüz şunlara olanak tanır:
- Teknik Seçimi: Açılır menüden
Doğrulanabilir Ödüllerle Pekiştirmeli Öğrenme (RLVR)'nin açıkça seçilmesi. - Veri Girişi: Amazon S3 kovasında depolanan hazırlanmış eğitim verilerini işaret etme.
- Ödül Fonksiyonu: Aday yanıtların
ground_truth'a göre nasıl değerlendirildiğini tanımlayan kademeli puanlama mekanizmasını yapılandırma. - Hiperparametre Yapılandırması: Parti boyutu gibi parametreleri ayarlama, ancak SageMaker AI genellikle optimal ayarları otomatik olarak halleder.
SageMaker AI, Amazon Nova, GPT-OSS, Llama, Qwen ve DeepSeek dahil olmak üzere çeşitli model ailelerini ve Denetimli İnce Ayar (SFT), Doğrudan Tercih Optimizasyonu (DPO), RLVR ve Yapay Zeka Geri Bildirimi ile Pekiştirmeli Öğrenme (RLAIF) gibi çeşitli teknikleri destekler. Entegre MLflow izleme, eğitim ve doğrulama metrikleri hakkında görünürlük sağlayarak performans izleme ve yinelemeyi basitleştirir. Bu kullanım kolaylığı, sofistike github-agentic-workflows oluşturan geliştiriciler için geliştirme yaşam döngüsünü önemli ölçüde hızlandırır.
Değerlendirme ve Dağıtım Başarısı
İnce ayar yapılmış Qwen 2.5 7B Instruct modelimizin etkinliği, tamamen daha önce görülmemiş araçlar içeren senaryolar da dahil olmak üzere, saklı veriler üzerinde titizlikle değerlendirildi - genelleştirme için kritik bir test. Sonuçlar etkileyiciydi: ince ayar yapılmış model, temel modele kıyasla araç çağırma ödülünde dikkate değer bir %57'lik iyileşme sağladı. Eğitim sırasında karşılaşmadığı senaryolardaki bu önemli performans artışı, RLVR'nin modellere araç etkileşimi için sağlam karar verme yetenekleri öğretmedeki gücünün altını çiziyor.
Bu artırılmış güvenilirlik, yapay zeka aracılarını üretim ortamlarına dağıtmada daha yüksek güven ve itimat anlamına gelir. Araç halüsinasyonları, yanlış parametreler ve uygunsuz eylem örneklerini en aza indirerek, işletmeler daha kritik ve hassas görevler için yapay zeka aracılarını kullanabilirler. SageMaker AI, model dağıtımı ve altyapı yönetimi karmaşıklıklarını ele alırken, geliştiriciler ince ayardan üretime sorunsuz bir şekilde geçebilir, aracılık yapay zeka çözümlerinin tam potansiyelini gerçekleştirebilirler. Bu yetenek, gerçek dünyadaki etki için aracılık yapay zekayı operasyonelleştirme genel vizyonuyla uyumludur.
Özetle, Amazon SageMaker AI'ın sunucusuz model özelleştirmesi ve RLVR'nin sağlam öğrenme yeteneklerinin birleşimi, son derece güvenilir aracılık aracı çağırma sistemleri oluşturmak için güçlü bir yol sağlar. Bu yenilikçi yaklaşım, geliştirmeyi hızlandırır, operasyonel yükü azaltır ve sonuçta benzeri görülmemiş doğruluk ve güvenilirlikle performans gösteren yapay zeka aracıları sunar.
Sık Sorulan Sorular
What is agentic tool calling and why is it crucial for AI agents?
What are the common challenges AI agents face when performing tool calls?
How does Amazon SageMaker AI address the challenges of agentic tool calling?
What is Reinforcement Learning with Verifiable Rewards (RLVR) and how does it work?
Why is RLVR considered more effective than Supervised Fine-Tuning (SFT) for tool calling tasks?
How is training data prepared for RLVR in Amazon SageMaker AI for agentic tool calling?
What agent behaviors are critical for building robust and reliable tool-calling AI agents?
What prerequisites are needed to use serverless model customization in SageMaker AI?
Güncel Kalın
En son yapay zeka haberlerini e-postanıza alın.
