G7e இன்ஸ்டன்ஸ்கள்: SageMaker இல் AI இன்ஃபரன்ஸிற்கான ஒரு புதிய சகாப்தம்
உருவாக்கும் AI இன் களம் முன் எப்போதும் இல்லாத வேகத்தில் பரிணமித்து வருகிறது, மேலும் சக்திவாய்ந்த, நெகிழ்வான மற்றும் செலவு குறைந்த உள்கட்டமைப்பிற்கான தொடர்ச்சியான தேவையைத் தூண்டுகிறது. இன்று, AWS இலிருந்து ஒரு குறிப்பிடத்தக்க முன்னேற்றம் குறித்து Code Velocity அறிவிப்பதில் மகிழ்ச்சியடைகிறது: Amazon SageMaker AI இல் G7e இன்ஸ்டன்ஸ்களின் பொதுவான கிடைக்கும் தன்மை. NVIDIA RTX PRO 6000 Blackwell Server Edition GPU-களால் இயக்கப்படும் இந்த புதிய இன்ஸ்டன்ஸ்கள், உருவாக்கும் AI இன்ஃபரன்ஸிற்கான அளவுகோல்களை மறுவரையறை செய்ய அமைக்கப்பட்டுள்ளன, இது டெவலப்பர்கள் மற்றும் நிறுவனங்களுக்கு இணையற்ற செயல்திறன் மற்றும் நினைவகத் திறனை வழங்குகிறது.
Amazon SageMaker AI என்பது ஒரு முழுமையாக நிர்வகிக்கப்படும் சேவையாகும், இது டெவலப்பர்கள் மற்றும் தரவு விஞ்ஞானிகளுக்கு இயந்திர கற்றல் மாதிரிகளை பெரிய அளவில் உருவாக்க, பயிற்சி அளிக்க மற்றும் வரிசைப்படுத்த கருவிகளை வழங்குகிறது. G7e இன்ஸ்டன்ஸ்களின் அறிமுகம் இந்த தளத்தில் உருவாக்கும் AI பணிப்பாய்வுகளுக்கு ஒரு திருப்புமுனையாக அமைகிறது. இந்த இன்ஸ்டன்ஸ்கள் அதிநவீன NVIDIA RTX PRO 6000 Blackwell GPU-களைப் பயன்படுத்துகின்றன, ஒவ்வொன்றும் ஈர்க்கக்கூடிய 96 GB GDDR7 நினைவகத்தைக் கொண்டுள்ளன. இந்த கணிசமான நினைவக அதிகரிப்பு, கணிசமாக பெரிய அடிப்படை மாதிரிகளை (FMs) நேரடியாக SageMaker AI இல் வரிசைப்படுத்த அனுமதிக்கிறது, இது மேம்பட்ட AI பயன்பாடுகளுக்கான ஒரு முக்கியமான தேவையை நிவர்த்தி செய்கிறது.
நிறுவனங்கள் இப்போது GPT-OSS-120B, Nemotron-3-Super-120B-A12B (NVFP4 மாறுபாடு) மற்றும் Qwen3.5-35B-A3B போன்ற மாதிரிகளை குறிப்பிடத்தக்க திறனுடன் வரிசைப்படுத்த முடியும். ஒரு ஒற்றை GPU இடம்பெறும் G7e.2xlarge இன்ஸ்டன்ஸ், 35B அளவுரு மாதிரிகளை ஹோஸ்ட் செய்ய முடியும், அதே நேரத்தில் எட்டு GPU-களுடன் கூடிய G7e.48xlarge, 300B அளவுரு மாதிரிகள் வரை அளவிடப்படுகிறது. இந்த நெகிழ்வுத்தன்மை உறுதியான நன்மைகளைத் தருகிறது: குறைந்த செயல்பாட்டுச் சிக்கல்கள், குறைந்த தாமதம் மற்றும் இன்ஃபரன்ஸ் பணிப்பாய்வுகளுக்கு கணிசமான செலவு சேமிப்பு.
G7e இன் தலைமுறை செயல்திறன் பாய்ச்சலை அவிழ்த்து விடுதல்
G7e இன்ஸ்டன்ஸ்கள் அதன் முன்னோடிகளான G6e மற்றும் G5 ஐ விட ஒரு மகத்தான பாய்ச்சலைக் குறிக்கின்றன, G6e உடன் ஒப்பிடும்போது 2.3 மடங்கு வரை வேகமான இன்ஃபரன்ஸ் செயல்திறனை வழங்குகின்றன. தொழில்நுட்ப விவரக்குறிப்புகள் இந்த தலைமுறை முன்னேற்றத்தை அடிக்கோடிட்டுக் காட்டுகின்றன. ஒவ்வொரு G7e GPU-வும் ஒரு பிரமிக்க வைக்கும் 1,597 GB/s அலைவரிசையை வழங்குகிறது, இது G6e இன் ஒரு GPU நினைவகத்தை திறம்பட இருமடங்காகவும் G5 ஐ விட நான்கு மடங்காகவும் ஆக்குகிறது. மேலும், நெட்வொர்க்கிங் திறன்கள் வியத்தகு முறையில் மேம்படுத்தப்பட்டுள்ளன, இது மிகப்பெரிய G7e அளவில் EFA உடன் 1,600 Gbps வரை அளவிடப்படுகிறது. G6e ஐ விட இந்த 4 மடங்கு அதிகரிப்பு மற்றும் G5 ஐ விட 16 மடங்கு அதிகரிப்பு, முன்பு சாத்தியமற்றதாகக் கருதப்பட்ட குறைந்த தாமத பல-நோட் இன்ஃபரன்ஸ் மற்றும் ஃபைன்-ட்யூனிங் காட்சிகளுக்கான திறனைத் திறக்கிறது.
8-GPU அடுக்கில் தலைமுறைகள் முழுவதும் முன்னேற்றத்தை எடுத்துக்காட்டும் ஒரு ஒப்பீடு இங்கே:
| விவரக்குறிப்பு | G5 (g5.48xlarge) | G6e (g6e.48xlarge) | G7e (g7e.48xlarge) |
|---|---|---|---|
| GPU | 8x NVIDIA A10G | 8x NVIDIA L40S | 8x NVIDIA RTX PRO 6000 Blackwell |
| ஒரு GPU-விற்கு GPU நினைவகம் | 24 GB GDDR6 | 48 GB GDDR6 | 96 GB GDDR7 |
| மொத்த GPU நினைவகம் | 192 GB | 384 GB | 768 GB |
| GPU நினைவக அலைவரிசை | 600 GB/s per GPU | 864 GB/s per GPU | 1,597 GB/s per GPU |
| vCPU-கள் | 192 | 192 | 192 |
| சிஸ்டம் நினைவகம் | 768 GiB | 1,536 GiB | 2,048 GiB |
| நெட்வொர்க் அலைவரிசை | 100 Gbps | 400 Gbps | 1,600 Gbps (EFA) |
| உள்ளூர் NVMe சேமிப்பு | 7.6 TB | 7.6 TB | 15.2 TB |
| G6e உடன் ஒப்பிடும்போது இன்ஃபரன்ஸ் | Baseline | ~1x | Up to 2.3x |
ஒற்றை G7e இன்ஸ்டன்ஸில் 768 GB மொத்த GPU நினைவகத்துடன், முன்பு பழைய இன்ஸ்டன்ஸ்களில் சிக்கலான பல-நோட் உள்ளமைவுகள் தேவைப்பட்ட மாதிரிகள் இப்போது குறிப்பிடத்தக்க எளிமையுடன் வரிசைப்படுத்தப்படலாம். இது இன்டர்-நோட் தாமதம் மற்றும் செயல்பாட்டுச் சுமையைக் கணிசமாக குறைக்கிறது. ஐந்தாம் தலைமுறை டென்சர் கோர்கள் வழியாக FP4 துல்லியத்திற்கான ஆதரவு மற்றும் EFAv4 வழியாக NVIDIA GPUDirect RDMA ஆகியவற்றுடன் இணைந்து, G7e இன்ஸ்டன்ஸ்கள் AWS இல் கோரும் LLM, பன்மொழி AI மற்றும் அதிநவீன முகவர் இன்ஃபரன்ஸ் பணிப்பாய்வுகளுக்காக சந்தேகத்திற்கு இடமின்றி வடிவமைக்கப்பட்டுள்ளன.
G7e இல் பல்வேறு உருவாக்கும் AI பயன்பாட்டு நிகழ்வுகள் செழிக்கின்றன
நினைவக அடர்த்தி, அலைவரிசை மற்றும் மேம்பட்ட நெட்வொர்க்கிங் திறன்களின் வலுவான கலவையானது G7e இன்ஸ்டன்ஸ்களை சமகால உருவாக்கும் AI பணிப்பாய்வுகளின் பரந்த வரம்பிற்கு ஏற்றதாக ஆக்குகிறது. உரையாடல் AI ஐ மேம்படுத்துவதில் இருந்து சிக்கலான பௌதீக உருவகப்படுத்துதல்களுக்கு சக்தி அளிப்பது வரை, G7e உறுதியான நன்மைகளை வழங்குகிறது:
- சேட்போட்கள் மற்றும் உரையாடல் AI: G7e இன்ஸ்டன்ஸ்களின் குறைந்த முதல் டோக்கன் நேரம் (TTFT) மற்றும் அதிக செயல்திறன், அதிக ஒத்திசைவான பயனர் சுமைகளை எதிர்கொள்ளும் போதும், துரிதமான மற்றும் தடையற்ற ஊடாடும் அனுபவங்களை உறுதி செய்கின்றன. உண்மையான நேர AI தொடர்புகளில் பயனர் ஈடுபாடு மற்றும் திருப்தியைப் பராமரிப்பதற்கு இது மிகவும் முக்கியம்.
- முகவர் மற்றும் கருவி அழைப்பு பணிப்பாய்வுகள்: Retrieval Augmented Generation (RAG) குழாய்கள் மற்றும் முகவர் அமைப்புகளுக்கு, மீட்டெடுப்பு கடைகளில் இருந்து வேகமான சூழல் உள்ளீடு மிக முக்கியம். G7e இன்ஸ்டன்ஸ்களுக்குள் CPU-to-GPU அலைவரிசையில் 4 மடங்கு மேம்பாடு இந்த முக்கியமான செயல்பாடுகளுக்கு அவற்றை விதிவிலக்காக பயனுள்ளதாக்குகிறது, இது மிகவும் புத்திசாலித்தனமான மற்றும் மாறும் AI முகவர்களை செயல்படுத்துகிறது.
- உரை உருவாக்கம், சுருக்கம் மற்றும் நீண்ட சூழல் இன்ஃபரன்ஸ்: ஒரு GPU-விற்கு 96 GB நினைவகத்துடன், G7e இன்ஸ்டன்ஸ்கள் பெரிய Key-Value (KV) கேச்களை திறம்பட கையாளுகின்றன. இது நீட்டிக்கப்பட்ட ஆவண சூழல்களுக்கு அனுமதிக்கிறது, உரை துண்டிப்பிற்கான தேவையை கணிசமாக குறைக்கிறது மற்றும் பரந்த உள்ளீடுகளின் மீது செழுமையான, மிகவும் நுணுக்கமான பகுத்தறிவை எளிதாக்குகிறது.
- பட உருவாக்கம் மற்றும் விஷன் மாதிரிகள்: முந்தைய தலைமுறை இன்ஸ்டன்ஸ்கள் பெரிய பன்மொழி மாதிரிகளுடன் பெரும்பாலும் நினைவகப் பிழைகளை சந்தித்த இடங்களில், G7e இன் இரட்டிப்பான நினைவகத் திறன் இந்த வரம்புகளை நேர்த்தியாக தீர்க்கிறது, மேலும் அதிநவீன மற்றும் உயர் தெளிவுத்திறன் கொண்ட பட மற்றும் விஷன் AI பயன்பாடுகளுக்கு வழி வகுக்கிறது.
- பௌதீக AI மற்றும் அறிவியல் கணக்கீடு: பாரம்பரிய உருவாக்கும் AI ஐத் தாண்டி, G7e இன் Blackwell-தலைமுறை கணக்கீடு, FP4 ஆதரவு மற்றும் இடஞ்சார்ந்த கணக்கீட்டு திறன்கள் (DLSS 4.0 மற்றும் 4 ஆம் தலைமுறை RT கோர்கள் உட்பட) டிஜிட்டல் இரட்டையர்கள், 3D உருவகப்படுத்துதல் மற்றும் மேம்பட்ட பௌதீக AI மாதிரி இன்ஃபரன்ஸுக்கு அதன் பயன்பாட்டை நீட்டிக்கின்றன, அறிவியல் ஆராய்ச்சி மற்றும் தொழில்துறை பயன்பாடுகளில் புதிய எல்லைகளைத் திறக்கின்றன.
நெறிப்படுத்தப்பட்ட வரிசைப்படுத்தல் மற்றும் செயல்திறன் அளவீடு
Amazon SageMaker AI வழியாக G7e இன்ஸ்டன்ஸ்களில் உருவாக்கும் AI மாதிரிகளை வரிசைப்படுத்துவது எளிமையாக வடிவமைக்கப்பட்டுள்ளது. இந்த செயல்முறையை நெறிப்படுத்தும் ஒரு மாதிரி நோட்புக்கை பயனர்கள் இங்கே அணுகலாம். முன்நிபந்தனைகளில் பொதுவாக ஒரு AWS கணக்கு, SageMaker அணுகலுக்கான ஒரு IAM பங்கு மற்றும் மேம்பாட்டு சூழலுக்காக Amazon SageMaker Studio அல்லது ஒரு SageMaker நோட்புக் இன்ஸ்டன்ஸ் ஆகியவை அடங்கும். முக்கியமாக, பயனர்கள் Service Quotas கன்சோல் வழியாக SageMaker AI எண்ட்பாயிண்ட் பயன்பாட்டிற்காக ml.g7e.2xlarge அல்லது பெரிய இன்ஸ்டன்ஸ்களுக்கான பொருத்தமான ஒதுக்கீட்டைக் கோர வேண்டும்.
குறிப்பிடத்தக்க செயல்திறன் ஆதாயங்களை நிரூபிக்க, AWS ஆனது G6e மற்றும் G7e இன்ஸ்டன்ஸ்கள் இரண்டிலும் Qwen3-32B (BF16) ஐ அளவீடு செய்தது. பணிச்சுமைக்கு ஒவ்வொரு கோரிக்கைக்கும் தோராயமாக 1,000 உள்ளீட்டு டோக்கன்கள் மற்றும் 560 வெளியீட்டு டோக்கன்கள் தேவைப்பட்டன, இது பொதுவான ஆவண சுருக்கப் பணிகளைப் பிரதிபலிக்கிறது. இரண்டு உள்ளமைவுகளும் முன்னொட்டு கேச்சிங் செயல்படுத்தப்பட்ட பூர்வீக vLLM கொள்கலனைப் பயன்படுத்தின, இது ஒப்பிடுதலை உறுதி செய்தது.
முடிவுகள் கவர்ச்சிகரமானவை. G6e அடிப்படை (4x L40S GPU-களுடன் ml.g6e.12xlarge $13.12/hr இல்) ஒரு கோரிக்கைக்கு வலுவான செயல்திறனைக் காட்டியது, G7e (1x RTX PRO 6000 Blackwell உடன் ml.g7e.2xlarge $4.20/hr இல்) வியத்தகு முறையில் வேறுபட்ட செலவு கதையைச் சொல்கிறது. உற்பத்தி ஒத்திசைவில் (C=32), G7e ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $0.79 என்ற நம்பமுடியாத தொகையை எட்டியது. இது G6e இன் $2.06 உடன் ஒப்பிடும்போது 2.6 மடங்கு செலவுக் குறைப்பைக் குறிக்கிறது, இது G7e இன் குறைந்த மணிநேர கட்டணம் மற்றும் சுமையின் கீழ் நிலையான மற்றும் அதிக செயல்திறனைப் பராமரிக்கும் திறன் ஆகியவற்றால் இயக்கப்படுகிறது, இது உயர் செயல்திறன் பிரீமியம் செலவில் வர வேண்டியதில்லை என்பதை நிரூபிக்கிறது.
செலவு குறைந்த உருவாக்கும் AI இன்ஃபரன்ஸின் எதிர்காலம்
Amazon SageMaker AI இல் G7e இன்ஸ்டன்ஸ்களின் அறிமுகம் ஒரு படிப்படியான மேம்பாட்டை விட அதிகம்; இது உயர் செயல்திறன் கொண்ட உருவாக்கும் AI ஐ அணுகுவதை ஜனநாயகமயமாக்குவதற்கான AWS இன் ஒரு மூலோபாய நடவடிக்கை. NVIDIA RTX PRO 6000 Blackwell GPU-களின் மூல சக்தியை SageMaker இன் அளவிடுதல் மற்றும் மேலாண்மை திறன்களுடன் இணைப்பதன் மூலம், AWS அனைத்து அளவிலான நிறுவனங்களுக்கும் பெரிய, மிகவும் சிக்கலான AI மாதிரிகளை முன் எப்போதும் இல்லாத செயல்திறன் மற்றும் செலவுத் திறனுடன் வரிசைப்படுத்த அதிகாரம் அளிக்கிறது. இந்த மேம்பாடு, உருவாக்கும் AI இல் உள்ள முன்னேற்றங்களை பரந்த அளவிலான தொழில்களில் நடைமுறை, உற்பத்திக்கு தயாரான பயன்பாடுகளாக மாற்ற முடியும் என்பதை உறுதி செய்கிறது, AI புதுமைக்கான ஒரு முன்னணி தளமாக SageMaker AI இன் நிலையை உறுதிப்படுத்துகிறது.
அடிக்கடி கேட்கப்படும் கேள்விகள்
What are G7e instances and how do they benefit generative AI inference?
Which NVIDIA GPU powers the new G7e instances, and what are its key features?
How do G7e instances compare to previous generations (G6e, G5) in terms of performance and memory?
What types of generative AI workloads are best suited for deployment on G7e instances?
What is the cost efficiency of G7e instances compared to G6e for generative AI inference?
What are the memory capacities for deploying LLMs on single and multi-GPU G7e instances?
What are the prerequisites for deploying solutions using G7e instances on Amazon SageMaker AI?
புதுப்பிப்புகளைப் பெறுங்கள்
சமீபத்திய AI செய்திகளை மின்னஞ்சலில் பெறுங்கள்.
