AWS, NVIDIA poglabljata sodelovanje na področju umetne inteligence za pospešitev prehajanja iz pilotnih projektov v produkcijo
Umetna inteligenca (UI) preoblikuje industrije z izjemno hitrostjo, vendar resnična vrednost ni le v eksperimentiranju, temveč v uspešni uvedbi in delovanju rešitev UI v produkcijskih okoljih. To zahteva robustne, razširljive, varne in skladne sisteme, ki prinašajo oprijemljive poslovne rezultate. Za reševanje te kritične potrebe sta AWS in NVIDIA na NVIDIA GTC 2026 napovedala pomembno razširitev svojega strateškega sodelovanja, s čimer sta predstavila nove tehnološke integracije, zasnovane za zadovoljevanje naraščajočega povpraševanja po računalništvu UI in pospeševanje rešitev UI v resnično produkcijo.
Poglobljeno partnerstvo se osredotoča na pospeševanje vsakega vidika življenjskega cikla UI, od infrastrukture do uvedbe modelov. Te integracije zajemajo ključna področja, vključno s pospešenim računalništvom, naprednimi medsebojnimi povezovalnimi tehnologijami ter poenostavljenim natančnim uglaševanjem in sklepanjem modelov. Ključne napovedi vključujejo:
- Uvedba več kot 1 milijona GPU-jev NVIDIA v regijah AWS od leta 2026.
- Podpora za Amazon EC2 za GPU-je NVIDIA RTX PRO 4500 Blackwell Server Edition, zaradi česar je AWS prvi večji ponudnik oblaka, ki to ponuja.
- Pospešitev medsebojne povezave za razdruženo sklepanje velikih jezikovnih modelov (LLM) z uporabo NVIDIA NIXL na AWS Elastic Fabric Adapter (EFA).
- Dramatično 3-krat hitrejša zmogljivost za delovne obremenitve Apache Spark z uporabo Amazon EMR na Amazon Elastic Kubernetes Service (Amazon EKS) z instancami Amazon EC2 G7e, ki jih poganjajo GPU-ji NVIDIA RTX PRO 6000 Blackwell Server Edition.
- Razširjena podpora za model NVIDIA Nemotron na Amazon Bedrock, vključno z ojačitvenim natančnim uglaševanjem (Reinforcement Fine-Tuning) in modelom Nemotron 3 Super.
Razširitev infrastrukture UI z izboljšano močjo GPU-jev NVIDIA
Temelj sodobne UI leži v zmogljivi računalniški infrastrukturi. Z letom 2026 se AWS zavezuje monumentalni zavezi napredku UI z dodajanjem več kot 1 milijona GPU-jev NVIDIA v svoje globalne oblačne regije. To vključuje arhitekturi GPU-jev naslednje generacije Blackwell in Rubin, kar zagotavlja, da imajo stranke dostop do najnaprednejše strojne opreme. AWS se že ponaša z najširšo zbirko instanc, ki temeljijo na GPU-jih NVIDIA, in skrbi za raznolik spekter delovnih obremenitev AI/ML, ta razširitev pa dodatno utrjuje njegovo vodilno vlogo.
To dolgoletno partnerstvo, ki traja več kot 15 let, se razteza tudi na ključna področja infrastrukture, kot je Spectrum mreženje. Cilj je zagotoviti podjetjem, startupom in raziskovalcem robustno infrastrukturo, potrebno za izgradnjo in razširitev naprednih agentnih sistemov UI—UI, ki je sposobna avtonomnega sklepanja, načrtovanja in delovanja v kompleksnih delovnih procesih.
Predstavitev novih instanc Amazon EC2 in inovacij na področju medsebojnih povezav
Poudarek sodelovanja so prihajajoče instance Amazon EC2, pospešene z GPU-ji NVIDIA RTX PRO 4500 Blackwell Server Edition. AWS je ponosen, da je prvi večji ponudnik oblaka, ki je napovedal podporo za te zmogljive GPU-je, s čimer so postali dostopni za širok spekter zahtevnih nalog. Te instance so idealne za analizo podatkov, sofisticirano pogovorno UI, dinamično generiranje vsebine, napredne sisteme priporočil, visokokakovostno pretakanje videa in kompleksne grafične delovne obremenitve.
Te nove instance EC2 bodo zgrajene na robustnem sistemu AWS Nitro. Sistem Nitro s svojo edinstveno kombinacijo namenske strojne opreme in lahkega hipervizorja zagotavlja skoraj vse računske in pomnilniške vire gostiteljske strojne opreme neposredno instancam. Ta zasnova zagotavlja vrhunsko izkoriščenost virov in zmogljivost. Ključnega pomena je, da so specializirana strojna oprema, programska oprema in vdelana programska oprema sistema Nitro zasnovane tako, da uveljavljajo stroge omejitve, ki ščitijo občutljive delovne obremenitve in podatke UI pred nepooblaščenim dostopom, tudi znotraj AWS. Njegova sposobnost izvajanja posodobitev vdelane programske opreme in optimizacij med delovanjem dodatno izboljšuje varnost in stabilnost, ki sta bistveni za produkcijske delovne obremenitve UI, analitike in grafike.
Dodatno izboljšanje zmogljivosti, zlasti za ogromne modele UI, je pospeševanje medsebojnih povezav za razdruženo sklepanje LLM. Ker se velikosti modelov še naprej povečujejo, lahko komunikacijski stroški med GPU-ji ali instancami AWS Trainium postanejo pomembno ozko grlo. AWS je napovedal podporo za NVIDIA Inference Xfer Library (NIXL) z AWS Elastic Fabric Adapter (EFA), zasnovano za pospešitev razdruženega sklepanja LLM na Amazon EC2, ki zajema tako GPU-je NVIDIA kot AWS Trainium. Ta integracija je ključnega pomena za skaliranje sodobnih delovnih obremenitev UI, kar omogoča učinkovito prekrivanje komunikacije in računanja, zmanjšanje zakasnitev in maksimiranje izkoriščenosti GPU-ja. Olajšuje premikanje podatkov KV-predpomnilnika z visoko prepustnostjo in nizko zakasnitvijo med računskimi vozlišči in porazdeljenimi pomnilniškimi viri. NIXL z EFA se izvorno integrira s priljubljenimi odprtokodnimi okviri, kot so NVIDIA Dynamo, vLLM in SGLang, kar zagotavlja izboljšano zakasnitev med žetoni in učinkovitejšo izkoriščenost pomnilnika KV-predpomnilnika.
Pospeševanje analize podatkov z Amazon EMR in GPU-ji
Podatkovni inženirji in znanstveniki se pogosto spopadajo z dolgotrajnimi cevovodi za obdelavo podatkov, ki lahko pomembno ovirajo iteracijo modelov AI/ML in generiranje poslovne inteligence. Sodelovanje AWS in NVIDIA prinaša prelomno izboljšavo: 3-krat hitrejša zmogljivost za delovne obremenitve Apache Spark. To pospeševanje je doseženo z izkoriščanjem Amazon EMR na Amazon EKS z instancami G7e, ki jih poganjajo GPU-ji NVIDIA RTX PRO 6000 Blackwell Server Edition.
Ta znatna izboljšava zmogljivosti je neposreden rezultat skupnih inženirskih prizadevanj, osredotočenih na optimizacijo analitike, pospešene z GPU-ji. Z instancami Amazon EMR in G7e lahko organizacije drastično skrajšajo čas, potreben za inženiring funkcij AI/ML, kompleksne transformacije ETL in analitiko v realnem času v velikem obsegu. Stranke, ki izvajajo obsežne cevovode za obdelavo podatkov, lahko dosežejo hitrejši čas do vpogleda, hkrati pa ohranijo popolno združljivost z obstoječimi aplikacijami Spark.
Razširitev podpore za model NVIDIA Nemotron na Amazon Bedrock
AWS in NVIDIA razširjata tudi svoje sodelovanje na področju temeljnih modelov in prinašata napredne modele NVIDIA Nemotron na Amazon Bedrock.
Razvijalci bodo kmalu imeli možnost natančno uglaševati modele NVIDIA Nemotron neposredno na Amazon Bedrock z uporabo ojačitvenega natančnega uglaševanja (RFT). To je prelomno za ekipe, ki morajo prilagoditi vedenje modela specifičnim domenam, bodisi v pravu, zdravstvu, financah ali drugih specializiranih področjih. RFT uporabnikom omogoča, da oblikujejo način sklepanja in odzivanja modela, s čimer presegajo zgolj pridobivanje znanja in prehajajo na niansirano vedenjsko usklajenost. Ključnega pomena je, da to deluje izvorno na Amazon Bedrock, kar odpravlja infrastrukturne stroške – uporabniki določijo nalogo, zagotovijo povratne informacije, Bedrock pa upravlja ostalo.
Poleg tega bo kmalu na voljo tudi NVIDIA Nemotron 3 Super, hibridni model Mixture-of-Experts (MoE), zgrajen za delovne obremenitve z več agenti in razširjeno sklepanje, ki prihaja na Amazon Bedrock. Zasnovan je tako, da pomaga agentom UI ohranjati natančnost v kompleksnih, večstopenjskih delovnih procesih, Nemotron 3 Super pa bo poganjal raznolike primere uporabe, ki zajemajo finance, kibernetsko varnost, maloprodajo in razvoj programske opreme. Obljublja hitro in stroškovno učinkovito sklepanje prek popolnoma upravljanega API-ja, kar poenostavlja uvedbo sofisticiranih agentov UI.
Tukaj je povzetek ključnih napovedi:
| Funkcija/Integracija | Opis | Glavna korist | Razpoložljivost |
|---|---|---|---|
| Uvedba GPU-jev | Več kot 1 milijon GPU-jev NVIDIA (arhitekturi Blackwell, Rubin) v regijah AWS. | Ogromna računska razširljivost za vse delovne obremenitve AI/ML, agentno UI. | Od leta 2026 |
| Instance Amazon EC2 | Podpora za GPU-je NVIDIA RTX PRO 4500 Blackwell Server Edition na EC2. | Prva podpora večjega ponudnika oblaka za vsestransko UI, grafiko, analitiko. | Kmalu na voljo |
| Sklepanje LLM | NVIDIA NIXL na AWS EFA za pospešeno razdruženo sklepanje LLM prek GPU-jev in Trainiumov. | Zmanjšana komunikacijska zakasnitev, maksimirana izkoriščenost GPU-ja za LLM. | Napovedano |
| Zmogljivost Apache Spark | 3-krat hitrejše delovne obremenitve Spark na Amazon EMR na EKS z instancami G7e (RTX PRO 6000). | Pospešen čas do vpogleda za analizo podatkov, inženiring funkcij. | Napovedano |
| Natančno uglaševanje Nemotrona | Ojačitveno natančno uglaševanje (RFT) za modele Nemotron neposredno na Amazon Bedrock. | Usklajevanje vedenja modela s specifičnimi domenami brez infrastrukturnih stroškov. | Kmalu na voljo |
| Nemotron 3 Super | Hibridni model MoE za delovne obremenitve z več agenti in razširjeno sklepanje na Amazon Bedrock. | Hitro, stroškovno učinkovito sklepanje za kompleksne, večstopenjske naloge UI. | Kmalu na voljo |
Zaveza energetski učinkovitosti in trajnostni UI
Ker se delovne obremenitve UI še naprej eksponentno povečujejo, postajata učinkovitost in trajnost osnovne infrastrukture izjemnega pomena. Sodelovanje poudarja tudi skupno zavezo izboljšanju energetske učinkovitosti. Zmogljivost na vat ni več zgolj merilo trajnosti, temveč pomembna konkurenčna prednost v pokrajini UI.
Na NVIDIA GTC 2026 se je Amazonova CSO Kara Hurst pridružila drugim vodilnim strokovnjakom za trajnost, da bi razpravljali o tem, kako UI temeljito preoblikuje podjetniško energijo in infrastrukturo v velikem obsegu. Ta razprava poudarja osredotočenost na razvoj in uvajanje rešitev UI, ki niso le zmogljive, temveč tudi okoljsko odgovorne, od podatkovnih centrov, optimiziranih kot aktivni udeleženci omrežja, do širših podjetniških aplikacij UI. Ta napreden pristop zagotavlja, da so napredki v računalništvu UI usklajeni z globalnimi cilji trajnosti.
Pogosta vprašanja
What is the primary goal of the expanded strategic collaboration between AWS and NVIDIA?
What significant GPU infrastructure expansions are planned by AWS as part of this collaboration?
How will the new Amazon EC2 instances with NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs benefit users?
How does the integration of NVIDIA NIXL with AWS EFA enhance Large Language Model (LLM) inference?
What improvements are being made to Apache Spark performance for data analytics?
What expanded NVIDIA Nemotron model support is coming to Amazon Bedrock?
How does this collaboration address energy efficiency and sustainability in AI?
Bodite na tekočem
Prejemajte najnovejše AI novice po e-pošti.
