Code Velocity
Gervigreind fyrir fyrirtæki

Meta MTIA flísar stækka gervigreind fyrir milljarða

·7 mín lestur·Meta·Upprunaleg heimild
Deila
Meta MTIA gervigreindarflísar á netþjónaborði í gagnamiðstöð

Stækkun gervigreindarupplifunar með MTIA flísum Meta

Á hverjum degi hafa milljarðar manna á fjölbreyttum kerfum Meta samskipti við ótal gervigreindardrifnar aðgerðir, allt frá persónulegum efnisráðleggingum til háþróaðra gervigreindaraðstoðarmanna. Undirliggjandi áskorun fyrir Meta, og reyndar iðnaðinn, felst í því að dreifa og stöðugt bæta þessi háþróuðu gervigreindarlíkön á heimsvísu, allt á meðan haldið er uppi hámarks kostnaðarhagkvæmni. Þessu krefjandi innviðaverkefni er mætt með stefnumótandi fjárfestingu Meta í sveigjanlegum, stöðugt þróandi lausnum, þar sem miðlægar eru sérhannaðar gervigreindarflísar þeirra: Meta Training and Inference Accelerator (MTIA) fjölskyldan.

Þrátt fyrir skuldbindingu við fjölbreytt kísilvörusafn sem nýtir bæði innri og ytri lausnir, eru MTIA flísar, þróaðar í nánu samstarfi við Broadcom, ómissandi hluti af innviðastefnu Meta í gervigreind. Þessar innanhúss hröðunareiningar eru mikilvægar til að knýja á hagkvæman hátt gervigreindarupplifun sem nær til milljarða manna, og laga sig stöðugt að hröðum þróun gervigreindarlíkana.

Endurtekin þróun MTIA flísa Meta

Landslag gervigreindarlíkana er í stöðugri breytingu og þróast á hraða sem oft er meiri en hefðbundnir þróunarferlar flísa. Meta gerir sér grein fyrir því að flísahönnun byggð á áætluðum verkefnum getur orðið úrelt áður en vélbúnaður nær framleiðslu, og hefur tekið upp nýstárlega „hraðastefnu“ fyrir MTIA. Í stað langra, óáreiðanlegra þróunartímabila, tekur Meta upp endurtekna nálgun þar sem hver MTIA kynslóð byggir á þeirri síðustu. Þetta felur í sér notkun einingalegra flísa, innlimun nýjustu innsýn í gervigreindarverkefni og dreifingu nýrrar vélbúnaðartækni á verulega styttri tíma. Þessi þéttari endurgjöfarlota tryggir að sérsniðinn kísill Meta haldist í nánu samræmi við kraftmiklar kröfur gervigreindarlíkana, sem stuðlar að hraðari innleiðingu nýrra framfara.

Meta hefur þegar lýst fyrstu tveimur kynslóðunum, MTIA 100 og MTIA 200, í fræðiritum. Með því að byggja á þessum grunni hefur Meta flýtt þróuninni til að kynna fjórar nýjar samfelldar kynslóðir: MTIA 300, 400, 450 og 500. Þessar flísar eru annaðhvort þegar í framleiðslu eða áætlaðar til fjöldadreifingar árin 2026 og 2027. Þessi hraða eftirfylgni hefur gert Meta kleift að auka verkefnasvið MTIA verulega, frá upphaflegri flokkunar- og meðmæla (R&R) ályktun til R&R þjálfunar, almennra Generative AI (GenAI) verkefna og mjög fínstilltrar GenAI ályktunar.

MTIA 300: Að leggja grunninn að gervigreindarverkefnum

MTIA 300 markaði mikilvægt skref í ferðalagi Meta með sérsniðnum kísil. Upphaflega fínstillt fyrir R&R líkön, sem voru ráðandi verkefni Meta áður en GenAI tók við sér, lögðu byggingarblokkir þess traustan grunn fyrir síðari flísar. Helstu aðgreinandi eiginleikar MTIA 300 eru samþættar NIC flísar, sérstakar skilaboðavélar til að létta samskiptasamstæður og útreikningsgeta nálægt minni hönnuð fyrir lækkunarmiðuð samstæður. Þessir lágu biðtíma, háu bandbreiddar samskiptahlutir reyndust mikilvægir til að gera skilvirka GenAI ályktun og þjálfun kleift í næstu kynslóðum.

MTIA 300 samanstendur af einni útreikningsflís, tveimur netflísum og nokkrum High-Bandwidth Memory (HBM) stöflum. Hver útreikningsflís er með rist af vinnslueiningum (PEs), stefnumótandi hönnuð með óþarfa PEs til að auka ávöxtun. Hver PE er háþróuð eining sem inniheldur tvo RISC-V vigra kjarna, Dot Product Engine fyrir fylkisfræði, Special Function Unit fyrir virkjanir og einingalegar aðgerðir, Reduction Engine fyrir uppsöfnun og samskipti milli PEs, og DMA vél fyrir skilvirka gagnaflutning innan staðbundins skyndiminni. Þessi flókna hönnun undirstrikaði skuldbindingu Meta til að skapa mjög skilvirka og hagkvæma lausn fyrir kjarna gervigreindarverkefni sín.

MTIA 400: Að ná samkeppnishæfum GenAI afköstum

Með fordæmalausum vexti í Generative AI, þróaði Meta MTIA 300 hratt í MTIA 400 til að veita öflugan stuðning við GenAI verkefni samhliða núverandi R&R getu sinni. MTIA 400 táknar verulegt stökk, býður upp á 400% hærri FP8 FLOPS og 51% aukningu í HBM bandbreidd samanborið við forvera sinn. Þó að MTIA 300 hafi lagt áherslu á kostnaðarhagkvæmni, var MTIA 400 hönnuð til að skila hráum afköstum sem eru samkeppnishæf við leiðandi viðskiptalega gervigreindartíma.

Þetta næst með því að sameina tvær útreikningsflísar til að tvöfalda útreikningsþéttleika og með því að styðja auknar útgáfur af MX8 og MX4, sem eru mikilvæg lág-nákvæmni snið fyrir skilvirka GenAI ályktun. Eitt rekki búið 72 MTIA 400 tækjum, tengt saman með rofnum bakplötu, myndar öflugt uppskalað lén. Þessi kerfi eru studd af háþróuðum loftdrifnum vökvakælingar (AALC) rekkum, sem auðvelda hraðvirka dreifingu jafnvel í eldri gagnaverum, sem sýnir fram á hagnýta nálgun Meta við að skala gervigreindarinnviði sína á heimsvísu.

MTIA 450 og 500: Sérhæfð fyrir GenAI ályktun

Með hliðsjón af áframhaldandi veldisvexti í GenAI ályktunarkröfum, fínstillti Meta MTIA 400 enn frekar, sem leiddi til þróunar MTIA 450 og síðan MTIA 500. Þessar kynslóðir eru sérstaklega fínstilltar fyrir einstakar áskoranir GenAI ályktunar, með áherslu á mikilvægar framfarir í minni og útreikningum.

MTIA 450 náði verulegum árangri með því að:

  1. Tvöfalda HBM bandbreidd frá fyrri útgáfu, sem er mikilvægt til að hraða afkóðunarfasa í GenAI líkönum.
  2. Auka MX4 FLOPS um 75%, sem hraðar blöndu-sérfræðinga (MoE) framsendandi neti (FFN) útreikningum sem eru algengir í stórum tungumálalíkönum.
  3. Kynna vélbúnaðarhröðun til að gera athygli og FFN útreikninga skilvirkari, sem dregur úr flöskuhálsum sem tengjast Softmax og FlashAttention.
  4. Nýsköpun í lág-nákvæmnis gagnagerðum, sem fer út fyrir FP8/MX8 til að skila 6x MX4 FLOPS af FP16/BF16, með sérsniðnum gagnagerðar nýjungum sem varðveita gæði líkana og auka FLOPS með lágmarks áhrifum á flísarými.

MTIA 500, sem byggir á velgengni 450, jók enn frekar HBM bandbreidd um 50% til viðbótar og kynnti fleiri nýjungar í lág-nákvæmnis gagnagerðum, sem styrkir skuldbindingu Meta til að ýta mörkum GenAI ályktunarafkasta. Þessi stanslausa áframhaldandi framför tryggir að gervigreindarupplifun Meta haldist í fararbroddi.

Heildarframfarirnar yfir þessar kynslóðir eru sláandi. Frá MTIA 300 til MTIA 500 hefur HBM bandbreiddin aukist um glæsileg 4,5x, á meðan útreiknings FLOPS hafa séð stórkostlega 25x aukningu (frá MX8 MTIA 300 til MX4 MTIA 500). Þessi hraða aukning á innan við tveimur árum er til vitnis um hraðastefnu Meta og getu þess til að stöðugt bæta sérsniðna kísil sinn. Þessi þróun er miðlæg í að gera miðlaða gervigreind rekstrarhæfa og önnur flókin líkön í stórum stíl.

Hér er sundurliðun á helstu forskriftum MTIA fjölskyldunnar:

EiginleikiMTIA 300MTIA 400MTIA 450MTIA 500
Útreikningskjarni1222
HBM staflar4488
HBM bandbreidd (GB/s)*100151302453
MX8 FLOPS (TFLOPS)100400400400
MX4 FLOPS (TFLOPS)N/A200350500
Stærð uppskalaðs léns18 tæki**72 tæki72 tæki72 tæki
Helstu fínstillingarR&R þjálfun, samskipti með lágum biðtímaAlmenn GenAI, samkeppnishæf hrá afköst.GenAI ályktun, HBM, sérsniðin lág-nákvæmni.GenAI ályktun, HBM, sérsniðin lág-nákvæmni.

*Sumir söluaðilar gefa upp tvíátta bandbreidd. Margfaldaðu gildið í töflunni með tveimur til að fá samsvarandi tvíátta bandbreidd. **MTIA 300 er stillt með útskalað neti með meiri bandbreidd (200 GB/s) vegna tiltölulega lítillar stærðar uppskalaðs léns og markmiðs R&R verkefna.

Þessar forskriftir undirstrika stórfelldar framfarir í minnisbandbreidd og útreikningskrafti, sem sýnir hvernig hver MTIA kynslóð er nákvæmlega hönnuð til að mæta brýnustu kröfum núverandi og framtíðar gervigreindarforrita, sérstaklega auðlindafrekra GenAI líkana.

Óþrjótandi leit Meta að sérsniðnum kísillausnum í gegnum MTIA fjölskylduna undirstrikar skuldbindingu þess til að skila háþróaðri gervigreindarupplifun til milljarða notenda um allan heim. Með því að sameina innri nýsköpun og stefnumótandi samstarf heldur Meta áfram að endurskilgreina möguleika á skalanlegum og hagkvæmum innviðum gervigreindar.

Algengar spurningar

What are Meta MTIA chips and what is their purpose?
Meta Training and Inference Accelerator (MTIA) chips are custom-designed AI accelerators developed by Meta in partnership with Broadcom. Their primary purpose is to power the vast array of AI-driven experiences across Meta's platforms for billions of users. This includes everything from personalized recommendations (R&R) to advanced Generative AI (GenAI) assistants. By developing its own silicon, Meta aims to cost-effectively scale AI workloads, maintain flexibility, and optimize performance for its specific infrastructure needs, ensuring continuous innovation in AI hardware development.
How many generations of MTIA chips has Meta developed in recent years?
Meta has rapidly accelerated MTIA development, introducing four successive generations in under two years: MTIA 300, MTIA 400, MTIA 450, and MTIA 500. These chips have either already been deployed or are scheduled for mass deployment in 2026 or 2027. This rapid iteration showcases Meta's 'velocity strategy,' designed to keep pace with the extraordinarily fast evolution of AI models and ensure their hardware remains aligned with current and future workload demands, expanding beyond initial R&R tasks to encompass general GenAI and specialized GenAI inference.
What is Meta's 'velocity strategy' for AI chip development?
Meta's 'velocity strategy' is an iterative approach to AI chip development that contrasts with traditional, longer chip design cycles. Recognizing that AI models evolve faster than typical hardware development, Meta designs each MTIA generation to build on the last using modular chiplets. This strategy incorporates the latest AI workload insights and hardware technologies, enabling deployment on a shorter cadence. This tighter feedback loop ensures Meta's custom hardware remains closely aligned with evolving AI models, facilitating faster adoption of new technologies and maintaining optimal performance and cost-efficiency.
How do the newer MTIA chips (400, 450, 500) support Generative AI workloads?
As GenAI surged, MTIA chips evolved significantly to support these demanding workloads. MTIA 400 enhanced support for GenAI with 400% higher FP8 FLOPS and increased HBM bandwidth. MTIA 450 specifically optimized for GenAI inference by doubling HBM bandwidth, increasing MX4 FLOPS by 75%, introducing hardware acceleration for attention and FFN computations, and innovating with custom low-precision data types. MTIA 500 further improved on this, increasing HBM bandwidth by an additional 50% and introducing more low-precision innovations, directly addressing the compute and memory demands of complex GenAI models.
What are the key performance advancements from MTIA 300 to MTIA 500?
The MTIA chip family has seen remarkable advancements from the 300 series to the 500 series in less than two years. The HBM bandwidth has increased by 4.5 times, significantly boosting memory access speed crucial for large AI models. The compute FLOPS (Floating Point Operations Per Second) have seen an astounding 25-fold increase, particularly from MTIA 300's MX8 to MTIA 500's MX4 formats. These dramatic improvements underscore Meta's ability to rapidly enhance its custom silicon's raw processing power and data handling capabilities to meet the escalating demands of advanced AI models.
Why is High-Bandwidth Memory (HBM) important for GenAI inference performance?
High-Bandwidth Memory (HBM) is critically important for Generative AI (GenAI) inference performance because GenAI models, especially large language models (LLMs), typically have massive parameter counts and require extensive memory bandwidth to efficiently retrieve and process these parameters during inference. The decoder step in GenAI inference, which generates tokens sequentially, is often bottlenecked by memory access rather than raw compute. Doubling or significantly increasing HBM bandwidth, as seen in MTIA 450 and 500, directly translates to faster token generation, lower latency, and higher throughput, making the AI experiences more responsive and efficient for users.

Fylgstu með

Fáðu nýjustu gervigreindarfréttirnar í pósthólfið.

Deila