What is the primary goal of the expanded strategic collaboration between AWS and NVIDIA?

The collaboration aims to accelerate the transition of AI solutions from experimental phases to full-scale production environments. This involves integrating new technologies and expanding existing capabilities across accelerated computing, interconnect technologies, model fine-tuning, and inference. The focus is on enabling customers to build and run AI solutions that are reliable, performant at scale, and compliant with enterprise security and regulatory requirements, ultimately driving meaningful business outcomes through production-ready AI systems.

What significant GPU infrastructure expansions are planned by AWS as part of this collaboration?

Starting in 2026, AWS plans to deploy over 1 million NVIDIA GPUs, including the next-generation Blackwell and Rubin architectures, across its global cloud regions. This massive expansion solidifies AWS's position as a leading provider of NVIDIA GPU-based instances, offering the broadest collection for diverse AI/ML workloads. This enhanced capacity is crucial for supporting the surging demand for AI compute, particularly for complex agentic AI systems that require extensive computational power.

How will the new Amazon EC2 instances with NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs benefit users?

AWS is the first major cloud provider to support the NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs on Amazon EC2 instances. These instances are highly versatile, suitable for a broad spectrum of workloads such as data analytics, conversational AI, content generation, recommender systems, video streaming, and advanced graphics rendering. Built on the AWS Nitro System, they offer enhanced resource efficiency, robust security, and stability, delivering superior performance for demanding AI and graphics applications.

How does the integration of NVIDIA NIXL with AWS EFA enhance Large Language Model (LLM) inference?

The integration of NVIDIA Inference Xfer Library (NIXL) with AWS Elastic Fabric Adapter (EFA) is designed to accelerate disaggregated LLM inference on Amazon EC2 across both NVIDIA GPUs and AWS Trainium instances. This is critical for managing the communication overhead in large models, enabling efficient overlap of communication and computation, minimizing latency, and maximizing GPU utilization. It facilitates high-throughput, low-latency KV-cache data movement and integrates natively with popular open-source frameworks like NVIDIA Dynamo, vLLM, and SGLang.

What improvements are being made to Apache Spark performance for data analytics?

AWS and NVIDIA's joint engineering efforts have resulted in a 3x faster performance for Apache Spark workloads. This is achieved by combining Amazon EMR on Amazon EKS with G7e instances, powered by NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs. This significant speedup allows data engineers and scientists to accelerate time-to-insight for critical tasks such as AI/ML feature engineering, complex ETL transformations, and real-time analytics, maintaining full compatibility with existing Spark applications.

What expanded NVIDIA Nemotron model support is coming to Amazon Bedrock?

Amazon Bedrock will soon support fine-tuning NVIDIA Nemotron models directly using Reinforcement Fine-Tuning (RFT). This capability allows developers to precisely align model behavior to specific domains like legal, healthcare, or finance without infrastructure overhead. Additionally, NVIDIA Nemotron 3 Super, a hybrid Mixture-of-Experts (MoE) model optimized for multi-agent workloads and extended reasoning, will also be available on Amazon Bedrock, providing fast, cost-efficient inference via a fully managed API for complex, multi-step AI tasks.

How does this collaboration address energy efficiency and sustainability in AI?

The collaboration acknowledges the growing importance of energy efficiency as AI workloads scale. Performance per watt is highlighted not just as a sustainability metric but as a competitive advantage. The article points to an NVIDIA GTC session where sustainability leaders, including Amazon CSO Kara Hurst, discuss how AI is transforming enterprise energy and infrastructure, emphasizing efforts towards more sustainable AI practices from data centers to broader enterprise AI applications.

title: "AWS y NVIDIA Profundizan su Colaboración en IA para Acelerar la Producción desde la Fase Piloto hasta la Producción" slug: "aws-and-nvidia-deepen-strategic-collaboration-to-accelerate-ai-from-pilot-to-production" date: "2026-03-18" lang: "es" source: "https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-deepen-strategic-collaboration-to-accelerate-ai-from-pilot-to-production/" category: "IA Empresarial" keywords:

AWS
NVIDIA
aceleración de IA
GTC 2026
GPU
Amazon EC2
Amazon Bedrock
Nemotron
inferencia de LLM
EFA
Apache Spark
IA Empresarial
IA en Producción
Aprendizaje Automático meta_description: "AWS y NVIDIA profundizan su colaboración estratégica en GTC 2026, anunciando importantes integraciones para acelerar la IA desde la fase piloto hasta la producción, incluyendo implementaciones expandidas de GPU, nuevas instancias EC2 y soporte para modelos Nemotron en Amazon Bedrock." image: "/images/articles/aws-and-nvidia-deepen-strategic-collaboration-to-accelerate-ai-from-pilot-to-production.png" image_alt: "Logotipos de AWS y NVIDIA prominentemente exhibidos, simbolizando su colaboración estratégica ampliada para la aceleración e innovación de la IA." quality_score: 94 content_score: 93 seo_score: 95 companies:
AWS
NVIDIA schema_type: "NewsArticle" reading_time: 5 faq:
question: "¿Cuál es el objetivo principal de la colaboración estratégica ampliada entre AWS y NVIDIA?" answer: "La colaboración tiene como objetivo acelerar la transición de soluciones de IA desde fases experimentales a entornos de producción a gran escala. Esto implica la integración de nuevas tecnologías y la expansión de capacidades existentes en computación acelerada, tecnologías de interconexión, ajuste fino de modelos e inferencia. El enfoque está en permitir a los clientes construir y ejecutar soluciones de IA que sean confiables, de alto rendimiento a escala y que cumplan con los requisitos de seguridad empresarial y regulatorios, impulsando en última instancia resultados comerciales significativos a través de sistemas de IA listos para la producción."
question: "¿Qué expansiones significativas de infraestructura de GPU tiene previstas AWS como parte de esta colaboración?" answer: "A partir de 2026, AWS planea desplegar más de 1 millón de GPU NVIDIA, incluyendo las arquitecturas de próxima generación Blackwell y Rubin, en sus regiones de nube globales. Esta expansión masiva consolida la posición de AWS como proveedor líder de instancias basadas en GPU NVIDIA, ofreciendo la colección más amplia para diversas cargas de trabajo de IA/ML. Esta capacidad mejorada es crucial para soportar la creciente demanda de computación de IA, particularmente para sistemas de IA agéntica complejos que requieren una potencia computacional extensiva."
question: "¿Cómo beneficiarán a los usuarios las nuevas instancias de Amazon EC2 con GPU NVIDIA RTX PRO 4500 Blackwell Server Edition?" answer: "AWS es el primer proveedor de nube importante en soportar las GPU NVIDIA RTX PRO 4500 Blackwell Server Edition en instancias de Amazon EC2. Estas instancias son altamente versátiles, adecuadas para un amplio espectro de cargas de trabajo como análisis de datos, IA conversacional, generación de contenido, sistemas de recomendación, transmisión de video y renderizado de gráficos avanzado. Construidas sobre el AWS Nitro System, ofrecen eficiencia de recursos mejorada, seguridad robusta y estabilidad, brindando un rendimiento superior para aplicaciones exigentes de IA y gráficos."
question: "¿Cómo mejora la inferencia de Modelos de Lenguaje Grande (LLM) la integración de NVIDIA NIXL con AWS EFA?" answer: "La integración de NVIDIA Inference Xfer Library (NIXL) con AWS Elastic Fabric Adapter (EFA) está diseñada para acelerar la inferencia disociada de LLM en Amazon EC2, tanto en GPU NVIDIA como en instancias AWS Trainium. Esto es crítico para gestionar la sobrecarga de comunicación en modelos grandes, permitiendo una superposición eficiente de comunicación y computación, minimizando la latencia y maximizando la utilización de la GPU. Facilita el movimiento de datos KV-cache de alto rendimiento y baja latencia y se integra de forma nativa con marcos de código abierto populares como NVIDIA Dynamo, vLLM y SGLang."
question: "¿Qué mejoras se están realizando en el rendimiento de Apache Spark para el análisis de datos?" answer: "Los esfuerzos de ingeniería conjunta de AWS y NVIDIA han resultado en un rendimiento 3 veces más rápido para las cargas de trabajo de Apache Spark. Esto se logra combinando Amazon EMR en Amazon EKS con instancias G7e, impulsadas por GPU NVIDIA RTX PRO 6000 Blackwell Server Edition. Este aumento significativo de velocidad permite a los ingenieros y científicos de datos acelerar el tiempo de obtención de información para tareas críticas como la ingeniería de características de IA/ML, transformaciones ETL complejas y análisis en tiempo real, manteniendo la compatibilidad total con las aplicaciones Spark existentes."
question: "¿Qué soporte ampliado para el modelo NVIDIA Nemotron llegará a Amazon Bedrock?" answer: "Amazon Bedrock pronto soportará el ajuste fino de modelos NVIDIA Nemotron directamente utilizando Reinforcement Fine-Tuning (RFT). Esta capacidad permite a los desarrolladores alinear con precisión el comportamiento del modelo con dominios específicos como el legal, la salud o las finanzas sin la sobrecarga de infraestructura. Además, NVIDIA Nemotron 3 Super, un modelo híbrido Mixture-of-Experts (MoE) optimizado para cargas de trabajo multiagente y razonamiento extendido, también estará disponible en Amazon Bedrock, proporcionando inferencia rápida y rentable a través de una API completamente gestionada para tareas de IA complejas y de varios pasos."
question: "¿Cómo aborda esta colaboración la eficiencia energética y la sostenibilidad en la IA?" answer: "La colaboración reconoce la creciente importancia de la eficiencia energética a medida que las cargas de trabajo de IA escalan. El rendimiento por vatio se destaca no solo como una métrica de sostenibilidad, sino como una ventaja competitiva. El artículo señala una sesión de NVIDIA GTC donde líderes en sostenibilidad, incluida la Directora de Sostenibilidad (CSO) de Amazon, Kara Hurst, discuten cómo la IA está transformando la energía y la infraestructura empresarial, enfatizando los esfuerzos hacia prácticas de IA más sostenibles desde los centros de datos hasta aplicaciones de IA empresariales más amplias."

AWS y NVIDIA Profundizan su Colaboración en IA para Acelerar la Producción desde la Fase Piloto hasta la Producción

La IA está transformando las industrias a un ritmo sin precedentes, pero el verdadero valor no reside solo en la experimentación, sino en el despliegue y la operación exitosos de soluciones de IA en entornos de producción. Esto exige sistemas robustos, escalables, seguros y conformes que ofrezcan resultados comerciales tangibles. Abordando esta necesidad crítica, AWS y NVIDIA anunciaron una expansión significativa de su colaboración estratégica en NVIDIA GTC 2026, revelando nuevas integraciones tecnológicas diseñadas para satisfacer la creciente demanda de computación de IA e impulsar las soluciones de IA a la producción en el mundo real.

La profundización de la asociación se centra en acelerar cada faceta del ciclo de vida de la IA, desde la infraestructura hasta el despliegue de modelos. Estas integraciones abarcan áreas cruciales como la computación acelerada, tecnologías de interconexión avanzadas y el ajuste fino e inferencia de modelos optimizados. Los anuncios clave incluyen:

El despliegue de más de 1 millón de GPU NVIDIA en las regiones de AWS a partir de 2026.
Soporte de Amazon EC2 para GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, convirtiendo a AWS en el primer proveedor de nube importante en ofrecer esto.
Aceleración de interconexión para inferencia de Modelos de Lenguaje Grande (LLM) disociados aprovechando NVIDIA NIXL en AWS Elastic Fabric Adapter (EFA).
Un rendimiento 3 veces más rápido para cargas de trabajo de Apache Spark utilizando Amazon EMR en Amazon Elastic Kubernetes Service (Amazon EKS) con instancias Amazon EC2 G7e, impulsadas por GPU NVIDIA RTX PRO 6000 Blackwell Server Edition.
Soporte ampliado del modelo NVIDIA Nemotron en Amazon Bedrock, incluyendo Reinforcement Fine-Tuning y el modelo Nemotron 3 Super.

Escalando la Infraestructura de IA con Mayor Potencia de GPU NVIDIA

La base de la IA moderna reside en una potente infraestructura de computación. A partir de 2026, AWS está asumiendo un compromiso monumental con el avance de la IA al añadir más de 1 millón de GPU NVIDIA a sus regiones de nube globales. Esto incluye arquitecturas de GPU Blackwell y Rubin de próxima generación, asegurando que los clientes tengan acceso al hardware más avanzado disponible. AWS ya cuenta con la colección más amplia de la industria de instancias basadas en GPU NVIDIA, atendiendo a una diversa gama de cargas de trabajo de IA/ML, y esta expansión solidifica aún más su liderazgo.

Esta asociación de larga duración, que abarca más de 15 años, también se extiende a áreas de infraestructura cruciales como la red Spectrum. El objetivo es proporcionar a empresas, startups e investigadores la infraestructura robusta necesaria para construir y escalar sistemas avanzados de IA Agéntica—IA capaz de razonamiento autónomo, planificación y acción en flujos de trabajo complejos.

Presentando Nuevas Instancias Amazon EC2 e Innovaciones en Interconexión

Un punto destacado de la colaboración son las próximas instancias Amazon EC2 aceleradas por GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. AWS se enorgullece de ser el primer proveedor de nube importante en anunciar soporte para estas potentes GPU, haciéndolas accesibles para una amplia gama de tareas exigentes. Estas instancias son idealmente adecuadas para análisis de datos, IA conversacional sofisticada, generación dinámica de contenido, sistemas de recomendación avanzados, transmisión de video de alta calidad y cargas de trabajo de gráficos complejas.

Estas nuevas instancias EC2 se construirán sobre el robusto AWS Nitro System. El Nitro System, con su combinación única de hardware dedicado y un hipervisor ligero, entrega casi todos los recursos de computación y memoria del hardware del host directamente a las instancias. Este diseño asegura una utilización y rendimiento superiores de los recursos. Fundamentalmente, el hardware, software y firmware especializados del Nitro System están diseñados para aplicar restricciones estrictas, salvaguardando las cargas de trabajo y datos sensibles de IA de accesos no autorizados, incluso desde dentro de AWS. Su capacidad para realizar actualizaciones y optimizaciones de firmware mientras está operativo mejora aún más la seguridad y estabilidad esenciales para cargas de trabajo de IA, análisis y gráficos de grado de producción.

Mejorando aún más el rendimiento, particularmente para modelos masivos de IA, se encuentra la aceleración de interconexiones para la inferencia de LLM disociados. A medida que los tamaños de los modelos continúan creciendo, la sobrecarga de comunicación entre las GPU o las instancias AWS Trainium puede convertirse en un cuello de botella significativo. AWS anunció soporte para NVIDIA Inference Xfer Library (NIXL) con AWS Elastic Fabric Adapter (EFA), diseñado para acelerar la inferencia disociada de LLM en Amazon EC2, abarcando tanto GPU NVIDIA como AWS Trainium. Esta integración es vital para escalar las cargas de trabajo modernas de IA, permitiendo una superposición eficiente de comunicación y computación, minimizando la latencia y maximizando la utilización de la GPU. Facilita el movimiento de datos KV-cache de alto rendimiento y baja latencia entre nodos de computación y recursos de memoria distribuidos. NIXL con EFA se integra de forma nativa con marcos de código abierto populares como NVIDIA Dynamo, vLLM y SGLang, ofreciendo una latencia inter-token mejorada y una utilización más eficiente de la memoria KV-cache.

Acelerando el Análisis de Datos con Amazon EMR y GPU

Los ingenieros y científicos de datos se enfrentan frecuentemente a largos pipelines de procesamiento de datos que pueden obstaculizar significativamente la iteración de modelos de IA/ML y la generación de inteligencia empresarial. La colaboración entre AWS y NVIDIA ofrece una mejora innovadora: un rendimiento 3 veces más rápido para las cargas de trabajo de Apache Spark. Esta aceleración se logra aprovechando Amazon EMR en Amazon EKS con instancias G7e, impulsadas por las GPU NVIDIA RTX PRO 6000 Blackwell Server Edition.

Esta sustancial ganancia de rendimiento es un resultado directo de los esfuerzos de ingeniería conjunta centrados en la optimización del análisis acelerado por GPU. Con Amazon EMR y las instancias G7e, las organizaciones pueden reducir drásticamente el tiempo necesario para la ingeniería de características de IA/ML, las transformaciones ETL complejas y el análisis en tiempo real a escala. Los clientes que ejecutan pipelines de procesamiento de datos a gran escala pueden lograr un tiempo de obtención de información más rápido manteniendo la compatibilidad total con sus aplicaciones Spark existentes.

Ampliando el Soporte del Modelo NVIDIA Nemotron en Amazon Bedrock

AWS y NVIDIA también están expandiendo su colaboración en modelos fundacionales, llevando modelos avanzados de NVIDIA Nemotron a Amazon Bedrock.

Los desarrolladores pronto tendrán la capacidad de ajustar finamente los modelos NVIDIA Nemotron directamente en Amazon Bedrock utilizando Reinforcement Fine-Tuning (RFT). Esto cambia las reglas del juego para los equipos que necesitan adaptar el comportamiento del modelo a dominios específicos, ya sea en el ámbito legal, la salud, las finanzas u otros campos especializados. RFT permite a los usuarios moldear cómo un modelo razona y responde, yendo más allá de la mera adquisición de conocimientos para lograr una alineación conductual matizada. Fundamentalmente, esto se ejecuta de forma nativa en Amazon Bedrock, eliminando la sobrecarga de infraestructura: los usuarios definen la tarea, proporcionan retroalimentación y Bedrock gestiona el resto.

Además, NVIDIA Nemotron 3 Super, un modelo híbrido Mixture-of-Experts (MoE) construido para cargas de trabajo multiagente y razonamiento extendido, también estará disponible pronto en Amazon Bedrock. Diseñado para ayudar a los agentes de IA a mantener la precisión en flujos de trabajo complejos y de varios pasos, Nemotron 3 Super impulsará diversos casos de uso que abarcan finanzas, ciberseguridad, comercio minorista y desarrollo de software. Promete una inferencia rápida y rentable a través de una API completamente gestionada, simplificando el despliegue de agentes de IA sofisticados.

Aquí hay un resumen de los anuncios clave:

Característica/Integración	Descripción	Beneficio Principal	Disponibilidad
Despliegue de GPU	Más de 1 millón de GPU NVIDIA (arquitecturas Blackwell, Rubin) en las regiones de AWS.	Escala de computación masiva para todas las cargas de trabajo de IA/ML, IA agéntica.	A partir de 2026
Instancias Amazon EC2	Soporte para GPU NVIDIA RTX PRO 4500 Blackwell Server Edition en EC2.	Primer soporte de un proveedor de nube importante para IA, gráficos y análisis versátiles.	Próximamente
Inferencia de LLM	NVIDIA NIXL en AWS EFA para inferencia acelerada de LLM disociados en GPU y Trainiums.	Latencia de comunicación minimizada, utilización maximizada de GPU para LLM.	Anunciado
Rendimiento de Apache Spark	Cargas de trabajo de Spark 3 veces más rápidas en Amazon EMR en EKS con instancias G7e (RTX PRO 6000).	Tiempo de obtención de información acelerado para análisis de datos, ingeniería de características.	Anunciado
Ajuste Fino de Nemotron	Reinforcement Fine-Tuning (RFT) para modelos Nemotron directamente en Amazon Bedrock.	Alineación del comportamiento del modelo específica del dominio sin sobrecarga de infraestructura.	Próximamente
Nemotron 3 Super	Modelo híbrido MoE para cargas de trabajo multiagente y razonamiento extendido en Amazon Bedrock.	Inferencia rápida y rentable para tareas de IA complejas y de varios pasos.	Próximamente

Compromiso con la Eficiencia Energética y la IA Sostenible

A medida que las cargas de trabajo de IA continúan creciendo exponencialmente, la eficiencia y sostenibilidad de la infraestructura subyacente se vuelven primordiales. La colaboración también destaca un compromiso compartido para mejorar la eficiencia energética. El rendimiento por vatio ya no es solo una métrica de sostenibilidad, sino una ventaja competitiva significativa en el panorama de la IA.

En NVIDIA GTC 2026, la Directora de Sostenibilidad (CSO) de Amazon, Kara Hurst, se unió a otros líderes en sostenibilidad para discutir cómo la IA está transformando fundamentalmente la energía y la infraestructura empresarial a escala. Esta discusión subraya el enfoque en desarrollar y desplegar soluciones de IA que no solo sean potentes, sino también responsables con el medio ambiente, desde centros de datos optimizados como participantes activos de la red hasta aplicaciones de IA empresariales más amplias. Este enfoque con visión de futuro asegura que los avances en la computación de IA estén alineados con los objetivos de sostenibilidad globales.

AWS y NVIDIA Profundizan su Colaboración en IA para Acelerar la Producción desde la Fase Piloto hasta la Producción

AWS y NVIDIA Profundizan su Colaboración en IA para Acelerar la Producción desde la Fase Piloto hasta la Producción

Escalando la Infraestructura de IA con Mayor Potencia de GPU NVIDIA

Presentando Nuevas Instancias Amazon EC2 e Innovaciones en Interconexión

Acelerando el Análisis de Datos con Amazon EMR y GPU

Ampliando el Soporte del Modelo NVIDIA Nemotron en Amazon Bedrock

Compromiso con la Eficiencia Energética y la IA Sostenible

Preguntas Frecuentes

Mantente Actualizado