What is the primary goal of the expanded strategic collaboration between AWS and NVIDIA?

The collaboration aims to accelerate the transition of AI solutions from experimental phases to full-scale production environments. This involves integrating new technologies and expanding existing capabilities across accelerated computing, interconnect technologies, model fine-tuning, and inference. The focus is on enabling customers to build and run AI solutions that are reliable, performant at scale, and compliant with enterprise security and regulatory requirements, ultimately driving meaningful business outcomes through production-ready AI systems.

What significant GPU infrastructure expansions are planned by AWS as part of this collaboration?

Starting in 2026, AWS plans to deploy over 1 million NVIDIA GPUs, including the next-generation Blackwell and Rubin architectures, across its global cloud regions. This massive expansion solidifies AWS's position as a leading provider of NVIDIA GPU-based instances, offering the broadest collection for diverse AI/ML workloads. This enhanced capacity is crucial for supporting the surging demand for AI compute, particularly for complex agentic AI systems that require extensive computational power.

How will the new Amazon EC2 instances with NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs benefit users?

AWS is the first major cloud provider to support the NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs on Amazon EC2 instances. These instances are highly versatile, suitable for a broad spectrum of workloads such as data analytics, conversational AI, content generation, recommender systems, video streaming, and advanced graphics rendering. Built on the AWS Nitro System, they offer enhanced resource efficiency, robust security, and stability, delivering superior performance for demanding AI and graphics applications.

How does the integration of NVIDIA NIXL with AWS EFA enhance Large Language Model (LLM) inference?

The integration of NVIDIA Inference Xfer Library (NIXL) with AWS Elastic Fabric Adapter (EFA) is designed to accelerate disaggregated LLM inference on Amazon EC2 across both NVIDIA GPUs and AWS Trainium instances. This is critical for managing the communication overhead in large models, enabling efficient overlap of communication and computation, minimizing latency, and maximizing GPU utilization. It facilitates high-throughput, low-latency KV-cache data movement and integrates natively with popular open-source frameworks like NVIDIA Dynamo, vLLM, and SGLang.

What improvements are being made to Apache Spark performance for data analytics?

AWS and NVIDIA's joint engineering efforts have resulted in a 3x faster performance for Apache Spark workloads. This is achieved by combining Amazon EMR on Amazon EKS with G7e instances, powered by NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs. This significant speedup allows data engineers and scientists to accelerate time-to-insight for critical tasks such as AI/ML feature engineering, complex ETL transformations, and real-time analytics, maintaining full compatibility with existing Spark applications.

What expanded NVIDIA Nemotron model support is coming to Amazon Bedrock?

Amazon Bedrock will soon support fine-tuning NVIDIA Nemotron models directly using Reinforcement Fine-Tuning (RFT). This capability allows developers to precisely align model behavior to specific domains like legal, healthcare, or finance without infrastructure overhead. Additionally, NVIDIA Nemotron 3 Super, a hybrid Mixture-of-Experts (MoE) model optimized for multi-agent workloads and extended reasoning, will also be available on Amazon Bedrock, providing fast, cost-efficient inference via a fully managed API for complex, multi-step AI tasks.

How does this collaboration address energy efficiency and sustainability in AI?

The collaboration acknowledges the growing importance of energy efficiency as AI workloads scale. Performance per watt is highlighted not just as a sustainability metric but as a competitive advantage. The article points to an NVIDIA GTC session where sustainability leaders, including Amazon CSO Kara Hurst, discuss how AI is transforming enterprise energy and infrastructure, emphasizing efforts towards more sustainable AI practices from data centers to broader enterprise AI applications.

AWS, NVIDIA ने उत्पादन में तेजी लाने के लिए AI सहयोग को गहरा किया

title: "AWS, NVIDIA ने उत्पादन में तेजी लाने के लिए AI सहयोग को गहरा किया" slug: "aws-and-nvidia-deepen-strategic-collaboration-to-accelerate-ai-from-pilot-to-production" date: "2026-03-18" lang: "hi" source: "https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-deepen-strategic-collaboration-to-accelerate-ai-from-pilot-to-production/" category: "एंटरप्राइज़ AI" keywords:

AWS
NVIDIA
AI त्वरण
GTC 2026
GPU
Amazon EC2
Amazon Bedrock
Nemotron
LLM अनुमान
EFA
Apache Spark
एंटरप्राइज़ AI
उत्पादन AI
मशीन लर्निंग meta_description: "GTC 2026 में AWS और NVIDIA ने अपने रणनीतिक सहयोग को गहरा किया, AI को प्रायोगिक चरण से उत्पादन तक पहुंचाने के लिए बड़े एकीकरणों की घोषणा की, जिसमें विस्तारित GPU परिनियोजन, नए EC2 इंस्टेंस, और Amazon Bedrock पर Nemotron मॉडल का समर्थन शामिल है।" image: "/images/articles/aws-and-nvidia-deepen-strategic-collaboration-to-accelerate-ai-from-pilot-to-production.png" image_alt: "AWS और NVIDIA के लोगो प्रमुखता से प्रदर्शित हैं, जो AI त्वरण और नवाचार के लिए उनके विस्तारित रणनीतिक सहयोग का प्रतीक है।" quality_score: 94 content_score: 93 seo_score: 95 companies:
AWS
NVIDIA schema_type: "NewsArticle" reading_time: 5 faq:
question: "AWS और NVIDIA के बीच विस्तारित रणनीतिक सहयोग का प्राथमिक लक्ष्य क्या है?" answer: "सहयोग का लक्ष्य AI समाधानों के प्रायोगिक चरणों से पूर्ण-स्तरीय उत्पादन परिवेश में संक्रमण को तेज करना है। इसमें त्वरित कंप्यूटिंग, इंटरकनेक्ट प्रौद्योगिकियों, मॉडल फाइन-ट्यूनिंग और अनुमान में नई तकनीकों को एकीकृत करना और मौजूदा क्षमताओं का विस्तार करना शामिल है। ध्यान ग्राहकों को ऐसे AI समाधान बनाने और चलाने में सक्षम बनाने पर है जो विश्वसनीय, बड़े पैमाने पर प्रदर्शनकारी, और एंटरप्राइज़ सुरक्षा और नियामक आवश्यकताओं के अनुरूप हों, अंततः उत्पादन-तैयार AI प्रणालियों के माध्यम से सार्थक व्यावसायिक परिणाम प्राप्त कर सकें।"
question: "इस सहयोग के तहत AWS द्वारा किन महत्वपूर्ण GPU अवसंरचना विस्तार की योजना बनाई गई है?" answer: "2026 से शुरू होकर, AWS ने अपने वैश्विक क्लाउड क्षेत्रों में 1 मिलियन से अधिक NVIDIA GPUs, जिसमें अगली पीढ़ी के Blackwell और Rubin आर्किटेक्चर शामिल हैं, को परिनियोजित करने की योजना बनाई है। यह विशाल विस्तार NVIDIA GPU-आधारित इंस्टेंस के एक प्रमुख प्रदाता के रूप में AWS की स्थिति को मजबूत करता है, जो विभिन्न AI/ML वर्कलोड के लिए सबसे व्यापक संग्रह प्रदान करता है। यह बढ़ी हुई क्षमता AI कंप्यूट की बढ़ती मांग का समर्थन करने के लिए महत्वपूर्ण है, विशेष रूप से जटिल एजेंटिक AI प्रणालियों के लिए जिन्हें व्यापक कम्प्यूटेशनल शक्ति की आवश्यकता होती है।"
question: "NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs वाले नए Amazon EC2 इंस्टेंस उपयोगकर्ताओं को कैसे लाभान्वित करेंगे?" answer: "AWS, Amazon EC2 इंस्टेंस पर NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs का समर्थन करने वाला पहला प्रमुख क्लाउड प्रदाता है। ये इंस्टेंस अत्यधिक बहुमुखी हैं, जो डेटा एनालिटिक्स, संवादात्मक AI, सामग्री निर्माण, अनुशंसा प्रणाली, वीडियो स्ट्रीमिंग और उन्नत ग्राफिक्स रेंडरिंग जैसे वर्कलोड के व्यापक स्पेक्ट्रम के लिए उपयुक्त हैं। AWS नाइट्रो सिस्टम पर निर्मित, वे बढ़ी हुई संसाधन दक्षता, मजबूत सुरक्षा और स्थिरता प्रदान करते हैं, जो मांग वाले AI और ग्राफिक्स अनुप्रयोगों के लिए बेहतर प्रदर्शन प्रदान करते हैं।"
question: "AWS EFA के साथ NVIDIA NIXL का एकीकरण लार्ज लैंग्वेज मॉडल (LLM) अनुमान को कैसे बढ़ाता है?" answer: "AWS इलास्टिक फैब्रिक एडाप्टर (EFA) के साथ NVIDIA इन्फरेंस एक्सफर लाइब्रेरी (NIXL) का एकीकरण NVIDIA GPUs और AWS Trainium इंस्टेंस दोनों पर Amazon EC2 पर डिसाग्रिगेटेड LLM अनुमान को तेज करने के लिए डिज़ाइन किया गया है। यह बड़े मॉडलों में संचार ओवरहेड को प्रबंधित करने, संचार और कंप्यूटेशन के कुशल ओवरलैप को सक्षम करने, विलंबता को कम करने और GPU उपयोग को अधिकतम करने के लिए महत्वपूर्ण है। यह उच्च-थ्रूपुट, कम-विलंबता KV-कैश डेटा मूवमेंट को सुविधाजनक बनाता है और NVIDIA Dynamo, vLLM, और SGLang जैसे लोकप्रिय ओपन-सोर्स फ्रेमवर्क के साथ मूल रूप से एकीकृत होता है।"
question: "डेटा एनालिटिक्स के लिए Apache Spark के प्रदर्शन में क्या सुधार किए जा रहे हैं?" answer: "AWS और NVIDIA के संयुक्त इंजीनियरिंग प्रयासों के परिणामस्वरूप Apache Spark वर्कलोड के लिए 3 गुना तेज प्रदर्शन हुआ है। यह Amazon EKS पर Amazon EMR को G7e इंस्टेंस के साथ जोड़कर हासिल किया गया है, जो NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs द्वारा संचालित हैं। यह महत्वपूर्ण गति वृद्धि डेटा इंजीनियरों और वैज्ञानिकों को AI/ML फीचर इंजीनियरिंग, जटिल ETL रूपांतरणों और वास्तविक समय एनालिटिक्स जैसे महत्वपूर्ण कार्यों के लिए समय-से-अंतर्दृष्टि (time-to-insight) में तेजी लाने की अनुमति देती है, जबकि मौजूदा Spark अनुप्रयोगों के साथ पूर्ण संगतता बनाए रखती है।"
question: "Amazon Bedrock पर किस विस्तारित NVIDIA Nemotron मॉडल समर्थन की सुविधा आ रही है?" answer: "Amazon Bedrock जल्द ही रीइन्फोर्समेंट फाइन-ट्यूनिंग (RFT) का उपयोग करके NVIDIA Nemotron मॉडल को सीधे फाइन-ट्यून करने का समर्थन करेगा। यह क्षमता डेवलपर्स को बिना किसी अवसंरचना ओवरहेड के मॉडल व्यवहार को कानूनी, स्वास्थ्य सेवा या वित्त जैसे विशिष्ट डोमेन के साथ सटीक रूप से संरेखित करने की अनुमति देती है। इसके अतिरिक्त, NVIDIA Nemotron 3 Super, एक हाइब्रिड मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) मॉडल जो मल्टी-एजेंट वर्कलोड और विस्तारित तर्क के लिए अनुकूलित है, भी Amazon Bedrock पर उपलब्ध होगा, जो जटिल, बहु-चरणीय AI कार्यों के लिए पूरी तरह से प्रबंधित API के माध्यम से तेज, लागत-कुशल अनुमान प्रदान करेगा।"
question: "यह सहयोग AI में ऊर्जा दक्षता और स्थिरता को कैसे संबोधित करता है?" answer: "यह सहयोग AI वर्कलोड के विस्तार के साथ ऊर्जा दक्षता के बढ़ते महत्व को स्वीकार करता है। प्रति वाट प्रदर्शन को केवल एक स्थिरता मीट्रिक के रूप में ही नहीं, बल्कि एक प्रतिस्पर्धी लाभ के रूप में भी उजागर किया गया है। यह लेख एक NVIDIA GTC सत्र की ओर इशारा करता है जहां Amazon CSO कारा हर्स्ट सहित स्थिरता नेताओं ने चर्चा की कि कैसे AI उद्यम ऊर्जा और बुनियादी ढांचे को बड़े पैमाने पर बदल रहा है, डेटा केंद्रों से लेकर व्यापक उद्यम AI अनुप्रयोगों तक अधिक टिकाऊ AI प्रथाओं की दिशा में प्रयासों पर जोर दिया गया।"


# AWS, NVIDIA ने प्रायोगिक चरण से उत्पादन तक AI में तेजी लाने के लिए सहयोग को गहरा किया

AI उद्योगों को अभूतपूर्व गति से बदल रहा है, लेकिन इसका वास्तविक मूल्य केवल प्रयोगों में नहीं, बल्कि उत्पादन परिवेश में AI समाधानों को सफलतापूर्वक तैनात करने और संचालित करने में निहित है। इसके लिए मजबूत, स्केलेबल, सुरक्षित और अनुपालन-योग्य प्रणालियों की आवश्यकता होती है जो ठोस व्यावसायिक परिणाम प्रदान करती हैं। इस महत्वपूर्ण आवश्यकता को संबोधित करते हुए, AWS और NVIDIA ने NVIDIA GTC 2026 में अपने रणनीतिक सहयोग के एक महत्वपूर्ण विस्तार की घोषणा की, जिसमें AI कंप्यूट की बढ़ती मांग को पूरा करने और AI समाधानों को वास्तविक दुनिया के उत्पादन में आगे बढ़ाने के लिए डिज़ाइन किए गए नए प्रौद्योगिकी एकीकरणों का अनावरण किया गया।

गहराई से की गई साझेदारी AI जीवनचक्र के हर पहलू को तेज करने पर केंद्रित है, जिसमें बुनियादी ढांचे से लेकर मॉडल परिनियोजन तक शामिल है। ये एकीकरण त्वरित कंप्यूटिंग, उन्नत इंटरकनेक्ट प्रौद्योगिकियों और सुव्यवस्थित मॉडल फाइन-ट्यूनिंग और अनुमान जैसे महत्वपूर्ण क्षेत्रों को कवर करते हैं। प्रमुख घोषणाओं में शामिल हैं:

*   2026 से शुरू होकर AWS क्षेत्रों में 1 मिलियन से अधिक NVIDIA GPUs का परिनियोजन।
*   NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs के लिए Amazon EC2 समर्थन, जिससे AWS यह सुविधा प्रदान करने वाला पहला प्रमुख क्लाउड प्रदाता बन गया है।
*   AWS इलास्टिक फैब्रिक एडाप्टर (EFA) पर NVIDIA NIXL का लाभ उठाते हुए डिसाग्रिगेटेड लार्ज लैंग्वेज मॉडल (LLM) अनुमान के लिए इंटरकनेक्ट त्वरण।
*   NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs द्वारा संचालित Amazon EC2 G7e इंस्टेंस के साथ Amazon इलास्टिक कुबेरनेट्स सर्विस (Amazon EKS) पर Amazon EMR का उपयोग करके Apache Spark वर्कलोड के लिए 3 गुना तेज प्रदर्शन।
*   Amazon Bedrock पर विस्तारित NVIDIA Nemotron मॉडल समर्थन, जिसमें रीइन्फोर्समेंट फाइन-ट्यूनिंग और Nemotron 3 Super मॉडल शामिल हैं।

## उन्नत NVIDIA GPU शक्ति के साथ AI बुनियादी ढांचे का विस्तार

आधुनिक AI का आधार शक्तिशाली कंप्यूट इंफ्रास्ट्रक्चर में निहित है। 2026 से शुरू होकर, AWS अपने वैश्विक क्लाउड क्षेत्रों में 1 मिलियन से अधिक NVIDIA GPUs जोड़कर AI उन्नति के लिए एक स्मारकीय प्रतिबद्धता बना रहा है। इसमें अगली पीढ़ी के Blackwell और Rubin GPU आर्किटेक्चर शामिल हैं, जिससे यह सुनिश्चित होता है कि ग्राहकों को उपलब्ध सबसे उन्नत हार्डवेयर तक पहुंच प्राप्त हो। AWS के पास पहले से ही NVIDIA GPU-आधारित इंस्टेंस का उद्योग का सबसे व्यापक संग्रह है, जो AI/ML वर्कलोड की विविध श्रृंखला को पूरा करता है, और यह विस्तार इसके नेतृत्व को और मजबूत करता है।

यह लंबे समय से चली आ रही साझेदारी, जो 15 वर्षों से अधिक समय से है, स्पेक्ट्रम नेटवर्किंग जैसे महत्वपूर्ण बुनियादी ढांचा क्षेत्रों तक भी फैली हुई है। इसका उद्देश्य उद्यमों, स्टार्टअप्स और शोधकर्ताओं को उन्नत [एजेंटिक AI प्रणालियों](/hi/operationalizing-agentic-ai-part-1-a-stakeholders-guide) के निर्माण और स्केलिंग के लिए आवश्यक मजबूत बुनियादी ढांचा प्रदान करना है - AI जो जटिल वर्कफ़्लो में स्वायत्त तर्क, योजना और कार्रवाई करने में सक्षम है।

## नए Amazon EC2 इंस्टेंस और इंटरकनेक्ट नवाचारों का परिचय

इस सहयोग का एक मुख्य आकर्षण NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs द्वारा त्वरित आगामी Amazon EC2 इंस्टेंस हैं। AWS इन शक्तिशाली GPUs के लिए समर्थन की घोषणा करने वाला पहला प्रमुख क्लाउड प्रदाता होने पर गर्व महसूस करता है, जिससे वे कई तरह के मांग वाले कार्यों के लिए सुलभ हो गए हैं। ये इंस्टेंस डेटा एनालिटिक्स, परिष्कृत संवादात्मक AI, गतिशील सामग्री निर्माण, उन्नत अनुशंसा प्रणाली, उच्च-गुणवत्ता वाले वीडियो स्ट्रीमिंग और जटिल ग्राफिक्स वर्कलोड के लिए आदर्श रूप से उपयुक्त हैं।

ये नए EC2 इंस्टेंस मजबूत [AWS नाइट्रो सिस्टम](https://aws.amazon.com/ec2/nitro/) पर निर्मित होंगे। नाइट्रो सिस्टम, अपने समर्पित हार्डवेयर और हल्के हाइपरवाइज़र के अनूखे संयोजन के साथ, होस्ट हार्डवेयर के लगभग सभी कंप्यूट और मेमोरी संसाधनों को सीधे इंस्टेंस तक पहुंचाता है। यह डिज़ाइन बेहतर संसाधन उपयोग और प्रदर्शन सुनिश्चित करता है। महत्वपूर्ण रूप से, नाइट्रो सिस्टम के विशेष हार्डवेयर, सॉफ्टवेयर और फर्मवेयर को कठोर प्रतिबंधों को लागू करने के लिए इंजीनियर किया गया है, जो संवेदनशील AI वर्कलोड और डेटा को अनधिकृत पहुंच से बचाता है, यहां तक कि AWS के भीतर से भी। परिचालन के दौरान फर्मवेयर अपडेट और अनुकूलन करने की इसकी क्षमता उत्पादन-ग्रेड AI, एनालिटिक्स और ग्राफिक्स वर्कलोड के लिए आवश्यक सुरक्षा और स्थिरता को और बढ़ाती है।

प्रदर्शन को और बढ़ाते हुए, विशेष रूप से विशाल AI मॉडलों के लिए, डिसाग्रिगेटेड LLM अनुमान के लिए इंटरकनेक्ट्स का त्वरण है। जैसे-जैसे मॉडल का आकार बढ़ता जा रहा है, GPUs या AWS Trainium इंस्टेंस के बीच संचार ओवरहेड एक महत्वपूर्ण बाधा बन सकता है। AWS ने NVIDIA इन्फरेंस एक्सफर लाइब्रेरी (NIXL) को AWS इलास्टिक फैब्रिक एडाप्टर (EFA) के साथ समर्थन की घोषणा की, जिसे NVIDIA GPUs और AWS Trainium दोनों पर Amazon EC2 पर डिसाग्रिगेटेड LLM अनुमान को तेज करने के लिए डिज़ाइन किया गया है। यह एकीकरण आधुनिक AI वर्कलोड को स्केल करने, संचार और कंप्यूटेशन के कुशल ओवरलैप को सक्षम करने, विलंबता को कम करने और [GPU उपयोग](/hi/gpus) को अधिकतम करने के लिए महत्वपूर्ण है। यह कंप्यूट नोड्स और वितरित मेमोरी संसाधनों के बीच उच्च-थ्रूपुट, कम-विलंबता KV-कैश डेटा मूवमेंट को सुविधाजनक बनाता है। EFA के साथ NIXL NVIDIA Dynamo, vLLM और SGLang जैसे लोकप्रिय ओपन-सोर्स फ्रेमवर्क के साथ मूल रूप से एकीकृत होता है, जो बेहतर इंटर-टोकन विलंबता और अधिक कुशल KV-कैश मेमोरी उपयोग प्रदान करता है।

## Amazon EMR और GPUs के साथ डेटा एनालिटिक्स को तेज करना

डेटा इंजीनियर और वैज्ञानिक अक्सर लंबी डेटा प्रोसेसिंग पाइपलाइनों से जूझते हैं जो AI/ML मॉडल पुनरावृति और व्यावसायिक बुद्धिमत्ता उत्पादन में काफी बाधा डाल सकती हैं। AWS और NVIDIA सहयोग एक अभूतपूर्व सुधार प्रदान करता है: Apache Spark वर्कलोड के लिए 3 गुना तेज प्रदर्शन। यह त्वरण Amazon EKS पर Amazon EMR का उपयोग करके G7e इंस्टेंस के साथ प्राप्त किया जाता है, जो NVIDIA के RTX PRO 6000 Blackwell Server Edition GPUs द्वारा संचालित हैं।

यह पर्याप्त प्रदर्शन लाभ GPU-त्वरित एनालिटिक्स को अनुकूलित करने पर केंद्रित संयुक्त इंजीनियरिंग प्रयासों का सीधा परिणाम है। Amazon EMR और G7e इंस्टेंस के साथ, संगठन AI/ML फीचर इंजीनियरिंग, जटिल ETL परिवर्तनों और बड़े पैमाने पर वास्तविक समय एनालिटिक्स के लिए आवश्यक समय को नाटकीय रूप से कम कर सकते हैं। बड़े पैमाने पर डेटा प्रोसेसिंग पाइपलाइन चलाने वाले ग्राहक अपने मौजूदा Spark अनुप्रयोगों के साथ पूर्ण संगतता बनाए रखते हुए समय-से-अंतर्दृष्टि (time-to-insight) को तेजी से प्राप्त कर सकते हैं।

## Amazon Bedrock पर NVIDIA Nemotron मॉडल समर्थन का विस्तार

AWS और NVIDIA मूलभूत मॉडलों पर अपने सहयोग का भी विस्तार कर रहे हैं, उन्नत NVIDIA Nemotron मॉडलों को Amazon Bedrock में ला रहे हैं।

डेवलपर्स के पास जल्द ही रीइन्फोर्समेंट फाइन-ट्यूनिंग (RFT) का उपयोग करके NVIDIA Nemotron मॉडल को सीधे Amazon Bedrock पर फाइन-ट्यून करने की क्षमता होगी। यह उन टीमों के लिए एक गेम-चेंजर है जिन्हें मॉडल व्यवहार को विशिष्ट डोमेन के अनुरूप बनाना होता है, चाहे वह कानूनी, स्वास्थ्य सेवा, वित्त या अन्य विशेष क्षेत्रों में हो। RFT उपयोगकर्ताओं को यह आकार देने का अधिकार देता है कि एक मॉडल कैसे तर्क करता है और प्रतिक्रिया देता है, केवल ज्ञान अधिग्रहण से आगे बढ़कर सूक्ष्म व्यवहार संरेखण तक पहुंचता है। महत्वपूर्ण रूप से, यह Amazon Bedrock पर मूल रूप से चलता है, जिससे बुनियादी ढांचे का ओवरहेड समाप्त हो जाता है – उपयोगकर्ता कार्य को परिभाषित करते हैं, प्रतिक्रिया प्रदान करते हैं, और Bedrock बाकी सब का प्रबंधन करता है।

इसके अलावा, NVIDIA Nemotron 3 Super, एक हाइब्रिड मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) मॉडल जो मल्टी-एजेंट वर्कलोड और विस्तारित तर्क के लिए बनाया गया है, भी जल्द ही Amazon Bedrock पर आ रहा है। जटिल, बहु-चरणीय वर्कफ़्लो में AI एजेंटों को सटीकता बनाए रखने में मदद करने के लिए इंजीनियर किया गया, Nemotron 3 Super वित्त, साइबर सुरक्षा, खुदरा और सॉफ्टवेयर विकास तक फैले विभिन्न उपयोग मामलों को शक्ति प्रदान करेगा। यह पूरी तरह से प्रबंधित API के माध्यम से तेज, लागत-कुशल अनुमान का वादा करता है, जिससे परिष्कृत AI एजेंटों की तैनाती सरल हो जाती है।

यहां प्रमुख घोषणाओं का सारांश दिया गया है:

| विशेषता/एकीकरण | विवरण | प्राथमिक लाभ | उपलब्धता |
| :---------------------------------- | :---------------------------------------------------------------------------------------------------------------------------------------------------- | :---------------------------------------------------------------------------------- | :-------------------- |
| **GPU परिनियोजन** | AWS क्षेत्रों में 1 मिलियन से अधिक NVIDIA GPUs (Blackwell, Rubin आर्किटेक्चर)। | सभी AI/ML वर्कलोड, एजेंटिक AI के लिए व्यापक कंप्यूट स्केल। | 2026 से शुरू |
| **Amazon EC2 इंस्टेंस** | EC2 पर NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs के लिए समर्थन। | बहुमुखी AI, ग्राफिक्स, एनालिटिक्स के लिए पहला प्रमुख क्लाउड प्रदाता समर्थन। | जल्द आ रहा है |
| **LLM अनुमान** | GPUs और Trainiums पर डिसाग्रिगेटेड LLM अनुमान को तेज करने के लिए AWS EFA पर NVIDIA NIXL। | LLM के लिए न्यूनतम संचार विलंबता, अधिकतम GPU उपयोग। | घोषित |
| **Apache Spark प्रदर्शन** | EKS पर Amazon EMR पर G7e इंस्टेंस (RTX PRO 6000) के साथ 3 गुना तेज Spark वर्कलोड। | डेटा एनालिटिक्स, फीचर इंजीनियरिंग के लिए त्वरित समय-से-अंतर्दृष्टि (time-to-insight)। | घोषित |
| **Nemotron फाइन-ट्यूनिंग** | Amazon Bedrock पर सीधे Nemotron मॉडलों के लिए रीइन्फोर्समेंट फाइन-ट्यूनिंग (RFT)। | बुनियादी ढांचे के ओवरहेड के बिना डोमेन-विशिष्ट मॉडल व्यवहार संरेखण। | जल्द आ रहा है |
| **Nemotron 3 सुपर** | मल्टी-एजेंट वर्कलोड और विस्तारित तर्क के लिए हाइब्रिड MoE मॉडल Amazon Bedrock पर। | जटिल, बहु-चरणीय AI कार्यों के लिए तेज, लागत-कुशल अनुमान। | जल्द आ रहा है |

## ऊर्जा दक्षता और टिकाऊ AI के प्रति प्रतिबद्धता

जैसे-जैसे AI वर्कलोड तेजी से बढ़ रहे हैं, अंतर्निहित बुनियादी ढांचे की दक्षता और स्थिरता सर्वोपरि हो जाती है। यह सहयोग ऊर्जा दक्षता में सुधार के लिए एक साझा प्रतिबद्धता को भी उजागर करता है। प्रति वाट प्रदर्शन अब केवल एक स्थिरता मीट्रिक नहीं है, बल्कि AI परिदृश्य में एक महत्वपूर्ण प्रतिस्पर्धी लाभ है।

NVIDIA GTC 2026 में, Amazon CSO कारा हर्स्ट अन्य स्थिरता नेताओं के साथ शामिल हुईं ताकि चर्चा की जा सके कि AI बड़े पैमाने पर उद्यम ऊर्जा और बुनियादी ढांचे को मौलिक रूप से कैसे बदल रहा है। यह चर्चा उन AI समाधानों को विकसित करने और तैनात करने पर ध्यान केंद्रित करती है जो न केवल शक्तिशाली हैं बल्कि पर्यावरणीय रूप से जिम्मेदार भी हैं, डेटा केंद्रों से लेकर व्यापक उद्यम AI अनुप्रयोगों तक जो सक्रिय ग्रिड प्रतिभागियों के रूप में अनुकूलित हैं। यह दूरंदेशी दृष्टिकोण सुनिश्चित करता है कि AI कंप्यूट में प्रगति वैश्विक स्थिरता लक्ष्यों के अनुरूप है।

AWS, NVIDIA ने उत्पादन में तेजी लाने के लिए AI सहयोग को गहरा किया

अक्सर पूछे जाने वाले प्रश्न

अपडेट रहें