Stækkun gervigreindarupplifunar með MTIA flísum Meta
Á hverjum degi hafa milljarðar manna á fjölbreyttum kerfum Meta samskipti við ótal gervigreindardrifnar aðgerðir, allt frá persónulegum efnisráðleggingum til háþróaðra gervigreindaraðstoðarmanna. Undirliggjandi áskorun fyrir Meta, og reyndar iðnaðinn, felst í því að dreifa og stöðugt bæta þessi háþróuðu gervigreindarlíkön á heimsvísu, allt á meðan haldið er uppi hámarks kostnaðarhagkvæmni. Þessu krefjandi innviðaverkefni er mætt með stefnumótandi fjárfestingu Meta í sveigjanlegum, stöðugt þróandi lausnum, þar sem miðlægar eru sérhannaðar gervigreindarflísar þeirra: Meta Training and Inference Accelerator (MTIA) fjölskyldan.
Þrátt fyrir skuldbindingu við fjölbreytt kísilvörusafn sem nýtir bæði innri og ytri lausnir, eru MTIA flísar, þróaðar í nánu samstarfi við Broadcom, ómissandi hluti af innviðastefnu Meta í gervigreind. Þessar innanhúss hröðunareiningar eru mikilvægar til að knýja á hagkvæman hátt gervigreindarupplifun sem nær til milljarða manna, og laga sig stöðugt að hröðum þróun gervigreindarlíkana.
Endurtekin þróun MTIA flísa Meta
Landslag gervigreindarlíkana er í stöðugri breytingu og þróast á hraða sem oft er meiri en hefðbundnir þróunarferlar flísa. Meta gerir sér grein fyrir því að flísahönnun byggð á áætluðum verkefnum getur orðið úrelt áður en vélbúnaður nær framleiðslu, og hefur tekið upp nýstárlega „hraðastefnu“ fyrir MTIA. Í stað langra, óáreiðanlegra þróunartímabila, tekur Meta upp endurtekna nálgun þar sem hver MTIA kynslóð byggir á þeirri síðustu. Þetta felur í sér notkun einingalegra flísa, innlimun nýjustu innsýn í gervigreindarverkefni og dreifingu nýrrar vélbúnaðartækni á verulega styttri tíma. Þessi þéttari endurgjöfarlota tryggir að sérsniðinn kísill Meta haldist í nánu samræmi við kraftmiklar kröfur gervigreindarlíkana, sem stuðlar að hraðari innleiðingu nýrra framfara.
Meta hefur þegar lýst fyrstu tveimur kynslóðunum, MTIA 100 og MTIA 200, í fræðiritum. Með því að byggja á þessum grunni hefur Meta flýtt þróuninni til að kynna fjórar nýjar samfelldar kynslóðir: MTIA 300, 400, 450 og 500. Þessar flísar eru annaðhvort þegar í framleiðslu eða áætlaðar til fjöldadreifingar árin 2026 og 2027. Þessi hraða eftirfylgni hefur gert Meta kleift að auka verkefnasvið MTIA verulega, frá upphaflegri flokkunar- og meðmæla (R&R) ályktun til R&R þjálfunar, almennra Generative AI (GenAI) verkefna og mjög fínstilltrar GenAI ályktunar.
MTIA 300: Að leggja grunninn að gervigreindarverkefnum
MTIA 300 markaði mikilvægt skref í ferðalagi Meta með sérsniðnum kísil. Upphaflega fínstillt fyrir R&R líkön, sem voru ráðandi verkefni Meta áður en GenAI tók við sér, lögðu byggingarblokkir þess traustan grunn fyrir síðari flísar. Helstu aðgreinandi eiginleikar MTIA 300 eru samþættar NIC flísar, sérstakar skilaboðavélar til að létta samskiptasamstæður og útreikningsgeta nálægt minni hönnuð fyrir lækkunarmiðuð samstæður. Þessir lágu biðtíma, háu bandbreiddar samskiptahlutir reyndust mikilvægir til að gera skilvirka GenAI ályktun og þjálfun kleift í næstu kynslóðum.
MTIA 300 samanstendur af einni útreikningsflís, tveimur netflísum og nokkrum High-Bandwidth Memory (HBM) stöflum. Hver útreikningsflís er með rist af vinnslueiningum (PEs), stefnumótandi hönnuð með óþarfa PEs til að auka ávöxtun. Hver PE er háþróuð eining sem inniheldur tvo RISC-V vigra kjarna, Dot Product Engine fyrir fylkisfræði, Special Function Unit fyrir virkjanir og einingalegar aðgerðir, Reduction Engine fyrir uppsöfnun og samskipti milli PEs, og DMA vél fyrir skilvirka gagnaflutning innan staðbundins skyndiminni. Þessi flókna hönnun undirstrikaði skuldbindingu Meta til að skapa mjög skilvirka og hagkvæma lausn fyrir kjarna gervigreindarverkefni sín.
MTIA 400: Að ná samkeppnishæfum GenAI afköstum
Með fordæmalausum vexti í Generative AI, þróaði Meta MTIA 300 hratt í MTIA 400 til að veita öflugan stuðning við GenAI verkefni samhliða núverandi R&R getu sinni. MTIA 400 táknar verulegt stökk, býður upp á 400% hærri FP8 FLOPS og 51% aukningu í HBM bandbreidd samanborið við forvera sinn. Þó að MTIA 300 hafi lagt áherslu á kostnaðarhagkvæmni, var MTIA 400 hönnuð til að skila hráum afköstum sem eru samkeppnishæf við leiðandi viðskiptalega gervigreindartíma.
Þetta næst með því að sameina tvær útreikningsflísar til að tvöfalda útreikningsþéttleika og með því að styðja auknar útgáfur af MX8 og MX4, sem eru mikilvæg lág-nákvæmni snið fyrir skilvirka GenAI ályktun. Eitt rekki búið 72 MTIA 400 tækjum, tengt saman með rofnum bakplötu, myndar öflugt uppskalað lén. Þessi kerfi eru studd af háþróuðum loftdrifnum vökvakælingar (AALC) rekkum, sem auðvelda hraðvirka dreifingu jafnvel í eldri gagnaverum, sem sýnir fram á hagnýta nálgun Meta við að skala gervigreindarinnviði sína á heimsvísu.
MTIA 450 og 500: Sérhæfð fyrir GenAI ályktun
Með hliðsjón af áframhaldandi veldisvexti í GenAI ályktunarkröfum, fínstillti Meta MTIA 400 enn frekar, sem leiddi til þróunar MTIA 450 og síðan MTIA 500. Þessar kynslóðir eru sérstaklega fínstilltar fyrir einstakar áskoranir GenAI ályktunar, með áherslu á mikilvægar framfarir í minni og útreikningum.
MTIA 450 náði verulegum árangri með því að:
- Tvöfalda HBM bandbreidd frá fyrri útgáfu, sem er mikilvægt til að hraða afkóðunarfasa í GenAI líkönum.
- Auka MX4 FLOPS um 75%, sem hraðar blöndu-sérfræðinga (MoE) framsendandi neti (FFN) útreikningum sem eru algengir í stórum tungumálalíkönum.
- Kynna vélbúnaðarhröðun til að gera athygli og FFN útreikninga skilvirkari, sem dregur úr flöskuhálsum sem tengjast Softmax og FlashAttention.
- Nýsköpun í lág-nákvæmnis gagnagerðum, sem fer út fyrir FP8/MX8 til að skila 6x MX4 FLOPS af FP16/BF16, með sérsniðnum gagnagerðar nýjungum sem varðveita gæði líkana og auka FLOPS með lágmarks áhrifum á flísarými.
MTIA 500, sem byggir á velgengni 450, jók enn frekar HBM bandbreidd um 50% til viðbótar og kynnti fleiri nýjungar í lág-nákvæmnis gagnagerðum, sem styrkir skuldbindingu Meta til að ýta mörkum GenAI ályktunarafkasta. Þessi stanslausa áframhaldandi framför tryggir að gervigreindarupplifun Meta haldist í fararbroddi.
Heildarframfarirnar yfir þessar kynslóðir eru sláandi. Frá MTIA 300 til MTIA 500 hefur HBM bandbreiddin aukist um glæsileg 4,5x, á meðan útreiknings FLOPS hafa séð stórkostlega 25x aukningu (frá MX8 MTIA 300 til MX4 MTIA 500). Þessi hraða aukning á innan við tveimur árum er til vitnis um hraðastefnu Meta og getu þess til að stöðugt bæta sérsniðna kísil sinn. Þessi þróun er miðlæg í að gera miðlaða gervigreind rekstrarhæfa og önnur flókin líkön í stórum stíl.
Hér er sundurliðun á helstu forskriftum MTIA fjölskyldunnar:
| Eiginleiki | MTIA 300 | MTIA 400 | MTIA 450 | MTIA 500 |
|---|---|---|---|---|
| Útreikningskjarni | 1 | 2 | 2 | 2 |
| HBM staflar | 4 | 4 | 8 | 8 |
| HBM bandbreidd (GB/s)* | 100 | 151 | 302 | 453 |
| MX8 FLOPS (TFLOPS) | 100 | 400 | 400 | 400 |
| MX4 FLOPS (TFLOPS) | N/A | 200 | 350 | 500 |
| Stærð uppskalaðs léns | 18 tæki** | 72 tæki | 72 tæki | 72 tæki |
| Helstu fínstillingar | R&R þjálfun, samskipti með lágum biðtíma | Almenn GenAI, samkeppnishæf hrá afköst. | GenAI ályktun, HBM, sérsniðin lág-nákvæmni. | GenAI ályktun, HBM, sérsniðin lág-nákvæmni. |
*Sumir söluaðilar gefa upp tvíátta bandbreidd. Margfaldaðu gildið í töflunni með tveimur til að fá samsvarandi tvíátta bandbreidd. **MTIA 300 er stillt með útskalað neti með meiri bandbreidd (200 GB/s) vegna tiltölulega lítillar stærðar uppskalaðs léns og markmiðs R&R verkefna.
Þessar forskriftir undirstrika stórfelldar framfarir í minnisbandbreidd og útreikningskrafti, sem sýnir hvernig hver MTIA kynslóð er nákvæmlega hönnuð til að mæta brýnustu kröfum núverandi og framtíðar gervigreindarforrita, sérstaklega auðlindafrekra GenAI líkana.
Óþrjótandi leit Meta að sérsniðnum kísillausnum í gegnum MTIA fjölskylduna undirstrikar skuldbindingu þess til að skila háþróaðri gervigreindarupplifun til milljarða notenda um allan heim. Með því að sameina innri nýsköpun og stefnumótandi samstarf heldur Meta áfram að endurskilgreina möguleika á skalanlegum og hagkvæmum innviðum gervigreindar.
Upprunaleg heimild
https://ai.meta.com/blog/meta-mtia-scale-ai-chips-for-billions/Algengar spurningar
What are Meta MTIA chips and what is their purpose?
How many generations of MTIA chips has Meta developed in recent years?
What is Meta's 'velocity strategy' for AI chip development?
How do the newer MTIA chips (400, 450, 500) support Generative AI workloads?
What are the key performance advancements from MTIA 300 to MTIA 500?
Why is High-Bandwidth Memory (HBM) important for GenAI inference performance?
Fylgstu með
Fáðu nýjustu gervigreindarfréttirnar í pósthólfið.
