What are Meta MTIA chips and what is their purpose?

Meta Training and Inference Accelerator (MTIA) chips are custom-designed AI accelerators developed by Meta in partnership with Broadcom. Their primary purpose is to power the vast array of AI-driven experiences across Meta's platforms for billions of users. This includes everything from personalized recommendations (R&R) to advanced Generative AI (GenAI) assistants. By developing its own silicon, Meta aims to cost-effectively scale AI workloads, maintain flexibility, and optimize performance for its specific infrastructure needs, ensuring continuous innovation in AI hardware development.

How many generations of MTIA chips has Meta developed in recent years?

Meta has rapidly accelerated MTIA development, introducing four successive generations in under two years: MTIA 300, MTIA 400, MTIA 450, and MTIA 500. These chips have either already been deployed or are scheduled for mass deployment in 2026 or 2027. This rapid iteration showcases Meta's 'velocity strategy,' designed to keep pace with the extraordinarily fast evolution of AI models and ensure their hardware remains aligned with current and future workload demands, expanding beyond initial R&R tasks to encompass general GenAI and specialized GenAI inference.

What is Meta's 'velocity strategy' for AI chip development?

Meta's 'velocity strategy' is an iterative approach to AI chip development that contrasts with traditional, longer chip design cycles. Recognizing that AI models evolve faster than typical hardware development, Meta designs each MTIA generation to build on the last using modular chiplets. This strategy incorporates the latest AI workload insights and hardware technologies, enabling deployment on a shorter cadence. This tighter feedback loop ensures Meta's custom hardware remains closely aligned with evolving AI models, facilitating faster adoption of new technologies and maintaining optimal performance and cost-efficiency.

How do the newer MTIA chips (400, 450, 500) support Generative AI workloads?

As GenAI surged, MTIA chips evolved significantly to support these demanding workloads. MTIA 400 enhanced support for GenAI with 400% higher FP8 FLOPS and increased HBM bandwidth. MTIA 450 specifically optimized for GenAI inference by doubling HBM bandwidth, increasing MX4 FLOPS by 75%, introducing hardware acceleration for attention and FFN computations, and innovating with custom low-precision data types. MTIA 500 further improved on this, increasing HBM bandwidth by an additional 50% and introducing more low-precision innovations, directly addressing the compute and memory demands of complex GenAI models.

What are the key performance advancements from MTIA 300 to MTIA 500?

The MTIA chip family has seen remarkable advancements from the 300 series to the 500 series in less than two years. The HBM bandwidth has increased by 4.5 times, significantly boosting memory access speed crucial for large AI models. The compute FLOPS (Floating Point Operations Per Second) have seen an astounding 25-fold increase, particularly from MTIA 300's MX8 to MTIA 500's MX4 formats. These dramatic improvements underscore Meta's ability to rapidly enhance its custom silicon's raw processing power and data handling capabilities to meet the escalating demands of advanced AI models.

Why is High-Bandwidth Memory (HBM) important for GenAI inference performance?

High-Bandwidth Memory (HBM) is critically important for Generative AI (GenAI) inference performance because GenAI models, especially large language models (LLMs), typically have massive parameter counts and require extensive memory bandwidth to efficiently retrieve and process these parameters during inference. The decoder step in GenAI inference, which generates tokens sequentially, is often bottlenecked by memory access rather than raw compute. Doubling or significantly increasing HBM bandwidth, as seen in MTIA 450 and 500, directly translates to faster token generation, lower latency, and higher throughput, making the AI experiences more responsive and efficient for users.

Meta MTIA Chips skalieren KI für Milliarden

title: "Meta MTIA Chips skalieren KI für Milliarden" slug: "meta-mtia-scale-ai-chips-for-billions" date: "2026-03-14" lang: "de" source: "https://ai.meta.com/blog/meta-mtia-scale-ai-chips-for-billions/" category: "KI für Unternehmen" keywords:

Meta
MTIA
KI-Chips
GenAI
Inferenz-Hardware
Kundenspezifisches Silizium
Rechenzentren
Llama
HBM-Bandbreite
Niedrigpräzisions-Datentypen
KI-Infrastruktur
R&R-Workloads meta_description: "Metas MTIA KI-Chips entwickeln sich rasant weiter, mit vier Generationen in zwei Jahren, um GenAI- und R&R-Erlebnisse für Milliarden von Nutzern effizient zu skalieren." image: "/images/articles/meta-mtia-scale-ai-chips-for-billions.png" image_alt: "Meta MTIA KI-Chips auf einer Serverplatine in einem Rechenzentrums-Rack" quality_score: 94 content_score: 93 seo_score: 95 companies:
Meta schema_type: "NewsArticle" reading_time: 7 faq:
question: "Was sind Meta MTIA Chips und welchem Zweck dienen sie?" answer: 'Meta Training and Inference Accelerator (MTIA)-Chips sind kundenspezifische KI-Beschleuniger, die von Meta in Partnerschaft mit Broadcom entwickelt wurden. Ihr Hauptzweck ist es, die Vielzahl von KI-gesteuerten Erlebnissen auf Metas Plattformen für Milliarden von Nutzern zu ermöglichen. Dies umfasst alles von personalisierten Empfehlungen (R&R) bis hin zu fortschrittlichen generativen KI (GenAI)-Assistenten. Durch die Entwicklung eines eigenen Siliziums möchte Meta KI-Workloads kostengünstig skalieren, Flexibilität bewahren und die Leistung für seine spezifischen Infrastrukturanforderungen optimieren, um eine kontinuierliche Innovation in der KI-Hardwareentwicklung sicherzustellen.'
question: "Wie viele Generationen von MTIA-Chips hat Meta in den letzten Jahren entwickelt?" answer: 'Meta hat die MTIA-Entwicklung rapide beschleunigt und in weniger als zwei Jahren vier aufeinanderfolgende Generationen eingeführt: MTIA 300, MTIA 400, MTIA 450 und MTIA 500. Diese Chips wurden entweder bereits eingesetzt oder sind für den Masseneinsatz in den Jahren 2026 oder 2027 geplant. Diese schnelle Iteration zeigt Metas "Geschwindigkeitsstrategie", die darauf ausgelegt ist, mit der außerordentlich schnellen Entwicklung von KI-Modellen Schritt zu halten und sicherzustellen, dass die Hardware den aktuellen und zukünftigen Workload-Anforderungen entspricht, wobei die Expansion über anfängliche R&R-Aufgaben hinausgeht, um allgemeine GenAI- und spezialisierte GenAI-Inferenz zu umfassen.'
question: "Was ist Metas 'Geschwindigkeitsstrategie' für die Entwicklung von KI-Chips?" answer: 'Metas "Geschwindigkeitsstrategie" ist ein iterativer Ansatz für die Entwicklung von KI-Chips, der sich von traditionellen, längeren Chip-Designzyklen unterscheidet. Da KI-Modelle sich schneller entwickeln als die typische Hardwareentwicklung, konzipiert Meta jede MTIA-Generation so, dass sie auf der vorherigen aufbaut, indem modulare Chiplets verwendet werden. Diese Strategie integriert die neuesten Erkenntnisse zu KI-Workloads und Hardware-Technologien, was eine Bereitstellung in kürzeren Zyklen ermöglicht. Dieser engere Feedback-Loop stellt sicher, dass Metas kundenspezifische Hardware eng mit den sich entwickelnden KI-Modellen abgestimmt bleibt, was die schnellere Einführung neuer Technologien erleichtert und eine optimale Leistung und Kosteneffizienz gewährleistet.'
question: "Wie unterstützen die neueren MTIA-Chips (400, 450, 500) generative KI-Workloads?" answer: 'Als GenAI aufkam, entwickelten sich MTIA-Chips erheblich weiter, um diese anspruchsvollen Workloads zu unterstützen. MTIA 400 verbesserte die Unterstützung für GenAI mit 400 % höheren FP8 FLOPS und erhöhter HBM-Bandbreite. MTIA 450 wurde speziell für die GenAI-Inferenz optimiert, indem die HBM-Bandbreite verdoppelt, die MX4 FLOPS um 75 % erhöht, Hardware-Beschleunigung für Aufmerksamkeits- und FFN-Berechnungen eingeführt und mit kundenspezifischen Niedrigpräzisions-Datentypen innoviert wurde. MTIA 500 verbesserte dies weiter, indem es die HBM-Bandbreite um zusätzliche 50 % erhöhte und weitere Niedrigpräzisions-Innovationen einführte, wodurch die Rechen- und Speicheranforderungen komplexer GenAI-Modelle direkt adressiert wurden.'
question: "Was sind die wichtigsten Leistungsverbesserungen von MTIA 300 bis MTIA 500?" answer: 'Die MTIA-Chipfamilie hat in weniger als zwei Jahren bemerkenswerte Fortschritte von der 300er-Serie zur 500er-Serie gemacht. Die HBM-Bandbreite hat sich um das 4,5-fache erhöht, was die Speicherzugriffsgeschwindigkeit, die für große KI-Modelle entscheidend ist, erheblich steigert. Die Rechen-FLOPS (Floating Point Operations Per Second) haben eine erstaunliche 25-fache Steigerung erfahren, insbesondere von MTIA 300s MX8- zu MTIA 500s MX4-Formaten. Diese dramatischen Verbesserungen unterstreichen Metas Fähigkeit, die rohe Rechenleistung und Datenverarbeitungsfähigkeiten seines kundenspezifischen Siliziums schnell zu verbessern, um den steigenden Anforderungen fortschrittlicher KI-Modelle gerecht zu werden.'
question: "Warum ist High-Bandwidth Memory (HBM) für die GenAI-Inferenzleistung wichtig?" answer: 'High-Bandwidth Memory (HBM) ist für die Leistung der generativen KI (GenAI)-Inferenz von entscheidender Bedeutung, da GenAI-Modelle, insbesondere große Sprachmodelle (LLMs), typischerweise massive Parameterzahlen aufweisen und eine umfangreiche Speicherbandbreite benötigen, um diese Parameter während der Inferenz effizient abzurufen und zu verarbeiten. Der Decoder-Schritt in der GenAI-Inferenz, der Tokens sequenziell generiert, wird oft durch den Speicherzugriff und nicht durch die reine Rechenleistung ausgebremst. Eine Verdopplung oder signifikante Erhöhung der HBM-Bandbreite, wie bei MTIA 450 und 500 zu sehen, führt direkt zu einer schnelleren Token-Generierung, geringerer Latenz und höherem Durchsatz, wodurch die KI-Erlebnisse für die Nutzer reaktionsschneller und effizienter werden.'


## KI-Erlebnisse mit Metas MTIA-Chips skalieren

Täglich interagieren Milliarden von Menschen auf Metas verschiedenen Plattformen mit einer Vielzahl von KI-gestützten Funktionen, von personalisierten Inhaltsempfehlungen bis hin zu fortschrittlichen KI-Assistenten. Die zugrunde liegende Herausforderung für Meta und die gesamte Branche besteht darin, diese komplexen KI-Modelle weltweit einzusetzen und kontinuierlich zu verbessern, und das bei optimaler Kosteneffizienz. Diese anspruchsvolle Infrastrukturaufgabe wird durch Metas strategische Investitionen in flexible, sich ständig weiterentwickelnde Lösungen gemeistert, deren Kern die kundenspezifisch entwickelten KI-Chips bilden: die Meta Training and Inference Accelerator (MTIA)-Familie.

Obwohl Meta ein vielfältiges Silizium-Portfolio verfolgt, das sowohl interne als auch externe Lösungen nutzt, sind MTIA-Chips, die in enger Partnerschaft mit Broadcom entwickelt wurden, ein unverzichtbarer Bestandteil von [Metas KI-Infrastrukturstrategie](/de/scaling-ai-for-everyone). Diese 'hausgemachten' Beschleuniger sind entscheidend, um die KI-Erlebnisse, die Milliarden erreichen, kostengünstig zu unterstützen und sich ständig an die sich schnell entwickelnde Landschaft der KI-Modelle anzupassen.

## Die iterative Entwicklung von Metas MTIA-Chips

Die Landschaft der KI-Modelle befindet sich in einem ständigen Wandel und entwickelt sich in einem Tempo, das traditionelle Chip-Entwicklungszyklen oft übertrifft. Meta hat erkannt, dass Chip-Designs, die auf prognostizierten Workloads basieren, veraltet sein können, sobald die Hardware die Produktion erreicht, und hat daher eine innovative "Geschwindigkeitsstrategie" für MTIA eingeführt. Anstelle langer, spekulativer Entwicklungsperioden verfolgt Meta einen iterativen Ansatz, bei dem jede MTIA-Generation auf der vorherigen aufbaut. Dies beinhaltet die Verwendung modularer Chiplets, die Integration neuester Erkenntnisse zu KI-Workloads und die Einführung neuer Hardware-Technologien in deutlich kürzeren Abständen. Dieser engere Feedback-Loop stellt sicher, dass Metas kundenspezifisches Silizium eng mit den dynamischen Anforderungen von KI-Modellen abgestimmt bleibt und eine schnellere Übernahme neuer Fortschritte fördert.

Meta hat die ersten beiden Generationen, MTIA 100 und MTIA 200, bereits in wissenschaftlichen Arbeiten detailliert beschrieben. Aufbauend auf diesem Fundament hat Meta die Entwicklung beschleunigt, um vier neue aufeinanderfolgende Generationen einzuführen: MTIA 300, 400, 450 und 500. Diese Chips befinden sich entweder bereits in Produktion oder sind für den Masseneinsatz in den Jahren 2026 und 2027 vorgesehen. Diese schnelle Abfolge hat es Meta ermöglicht, die Workload-Abdeckung von MTIA erheblich zu erweitern, von anfänglicher Ranking- und Empfehlungs (R&R)-Inferenz zu R&R-Training, allgemeinen generativen KI (GenAI)-Workloads und hochoptimierter GenAI-Inferenz.

## MTIA 300: Die Grundlage für KI-Workloads legen

Der MTIA 300 markierte einen entscheidenden Schritt in Metas Entwicklung von kundenspezifischem Silizium. Ursprünglich für R&R-Modelle optimiert, die vor dem GenAI-Boom Metas dominante Workloads waren, legten seine architektonischen Bausteine ein robustes Fundament für nachfolgende Chips. Zu den wichtigsten Unterscheidungsmerkmalen des MTIA 300 gehören integrierte NIC-Chiplets, dedizierte Nachrichten-Engines zur Auslagerung von Kommunikationskollektiven und Nahspeicher-Rechenfunktionen, die für reduktionsbasierte Kollektive entwickelt wurden. Diese Komponenten für latenzarme, hochbandbreitige Kommunikation erwiesen sich als entscheidend für die Ermöglichung effizienter GenAI-Inferenz und -Training in den folgenden Generationen.

Der MTIA 300 besteht aus einem Compute-Chiplet, zwei Netzwerk-Chiplets und mehreren High-Bandwidth Memory (HBM)-Stacks. Jedes Compute-Chiplet verfügt über ein Raster von Verarbeitungselementen (PEs), die strategisch mit redundanten PEs entworfen wurden, um die Ausbeute zu verbessern. Jedes PE ist eine hochentwickelte Einheit, die zwei RISC-V Vektorkerne, eine Dot Product Engine für Matrixmultiplikation, eine Special Function Unit für Aktivierungen und elementweise Operationen, eine Reduction Engine für Akkumulation und Inter-PE-Kommunikation sowie eine DMA-Engine für effiziente Datenbewegung innerhalb des lokalen Scratch-Speichers enthält. Dieses komplexe Design unterstrich Metas Engagement, eine hocheffiziente und kostengünstige Lösung für seine zentralen KI-Aufgaben zu schaffen.

## MTIA 400: Erzielung wettbewerbsfähiger GenAI-Leistung

Angesichts des beispiellosen Anstiegs der generativen KI entwickelte Meta den MTIA 300 schnell zum MTIA 400 weiter, um neben den bestehenden R&R-Funktionen eine robuste Unterstützung für GenAI-Workloads zu bieten. Der MTIA 400 stellt einen bedeutenden Sprung dar und bietet 400 % höhere FP8 FLOPS und eine 51 %ige Steigerung der HBM-Bandbreite im Vergleich zu seinem Vorgänger. Während sich der MTIA 300 auf Kosteneffizienz konzentrierte, wurde der MTIA 400 entwickelt, um eine Rohleistung zu liefern, die mit führenden kommerziellen KI-Beschleunigern konkurrenzfähig ist.

Dies wird erreicht, indem zwei Compute-Chiplets kombiniert werden, um die Rechenleistungsdichte effektiv zu verdoppeln, und indem verbesserte Versionen von MX8 und MX4 unterstützt werden, entscheidende Niedrigpräzisionsformate für eine effiziente GenAI-Inferenz. Ein einzelnes Rack, ausgestattet mit 72 MTIA 400 Geräten, die über eine Switched-Backplane verbunden sind, bildet eine leistungsstarke Scale-up-Domain. Diese Systeme werden durch fortschrittliche luftunterstützte Flüssigkeitskühlung (AALC) in Racks unterstützt, die eine schnelle Bereitstellung selbst in älteren Rechenzentren ermöglichen und Metas praktischen Ansatz zur globalen Skalierung seiner KI-Infrastruktur demonstrieren.

## MTIA 450 und 500: Spezialisiert für GenAI-Inferenz

Im Hinblick auf das weiterhin exponentielle Wachstum der GenAI-Inferenznachfrage verfeinerte Meta den MTIA 400 weiter, was zur Entwicklung des MTIA 450 und anschließend des MTIA 500 führte. Diese Generationen sind speziell für die einzigartigen Herausforderungen der GenAI-Inferenz optimiert und konzentrieren sich auf entscheidende Fortschritte bei Speicher und Rechenleistung.

**MTIA 450** machte bedeutende Fortschritte durch:
1.  Die **Verdoppelung der HBM-Bandbreite** gegenüber der Vorgängerversion, was entscheidend für die Beschleunigung der Dekodierungsphase in GenAI-Modellen ist.
2.  Die **Steigerung der MX4 FLOPS um 75%**, was Berechnungen von Mixture-of-Experts (MoE) Feed-Forward-Netzwerken (FFN), die in großen Sprachmodellen üblich sind, beschleunigt.
3.  Die **Einführung von Hardware-Beschleunigung**, um Aufmerksamkeits- und FFN-Berechnungen effizienter zu gestalten und Engpässe im Zusammenhang mit Softmax und FlashAttention zu mindern.
4.  Die **Innovation bei Niedrigpräzisions-Datentypen**, die über FP8/MX8 hinausgeht, um das 6-fache der MX4 FLOPS von FP16/BF16 zu liefern, mit kundenspezifischen Datentyp-Innovationen, die die Modellqualität erhalten und die FLOPS bei minimalem Chipflächenverbrauch steigern.

**MTIA 500** baute auf dem Erfolg des 450 auf, erhöhte die HBM-Bandbreite um weitere 50 % und führte weitere Innovationen bei Niedrigpräzisions-Datentypen ein, was Metas Engagement unterstreicht, die Grenzen der GenAI-Inferenzleistung zu erweitern. Dieser unermüdliche Drang nach Verbesserung stellt sicher, dass Metas KI-Erlebnisse stets an der Spitze bleiben.

Die kumulativen Fortschritte über diese Generationen hinweg sind frappierend. Von MTIA 300 bis MTIA 500 hat sich die HBM-Bandbreite um beeindruckende 4,5x erhöht, während die Compute-FLOPS eine erstaunliche 25-fache Steigerung erfahren haben (von MTIA 300s MX8 zu MTIA 500s MX4). Diese schnelle Beschleunigung innerhalb von zwei Jahren ist ein Beweis für Metas Geschwindigkeitsstrategie und seine Fähigkeit, sein kundenspezifisches Silizium kontinuierlich zu verbessern. Diese Entwicklung ist zentral für die [Operationalisierung von agentischer KI](/de/operationalizing-agentic-ai-part-1-a-stakeholders-guide) und anderen komplexen Modellen im großen Maßstab.

Hier ist eine Übersicht der wichtigsten Spezifikationen der MTIA-Familie:

| Merkmal                   | MTIA 300                                | MTIA 400                                | MTIA 450                                | MTIA 500                                |
| :------------------------ | :-------------------------------------- | :-------------------------------------- | :-------------------------------------- | :-------------------------------------- |
| **Rechenchip**            | 1                                       | 2                                       | 2                                       | 2                                       |
| **HBM-Stacks**            | 4                                       | 4                                       | 8                                       | 8                                       |
| **HBM-Bandbreite (GB/s)\*** | 100                                     | 151                                     | 302                                     | 453                                     |
| **MX8 FLOPS (TFLOPS)**    | 100                                     | 400                                     | 400                                     | 400                                     |
| **MX4 FLOPS (TFLOPS)**    | N/A                                     | 200                                     | 350                                     | 500                                     |
| **Scale-up-Domain-Größe** | 18 Geräte**                             | 72 Geräte                               | 72 Geräte                               | 72 Geräte                               |
| **Schlüsseloptimierung**  | R&R-Training, latenzarme Kommunikation  | Allgemeine GenAI, wettbewerbsfähige Rohleistung | GenAI-Inferenz, HBM, kundenspezifische Niedrigpräzision | GenAI-Inferenz, HBM, kundenspezifische Niedrigpräzision |

\*Einige Anbieter berichten über bidirektionale Bandbreite. Multiplizieren Sie den Wert in der Tabelle mit zwei, um die entsprechende bidirektionale Bandbreite zu erhalten.
\*\*Der MTIA 300 ist mit einem Scale-out-Netzwerk mit höherer Bandbreite (200 GB/s) konfiguriert, aufgrund seiner relativ kleinen Scale-up-Domain-Größe und der Ziel-R&R-Workloads.

Diese Spezifikationen verdeutlichen die dramatischen Verbesserungen bei der Speicherbandbreite und Rechenleistung und zeigen, wie jede MTIA-Generation sorgfältig entwickelt wurde, um die drängendsten Anforderungen aktueller und zukünftiger KI-Anwendungen, insbesondere der ressourcenintensiven GenAI-Modelle, zu erfüllen.

Metas unermüdliches Streben nach kundenspezifischen Siliziumlösungen über die MTIA-Familie unterstreicht sein Engagement, Milliarden von Nutzern weltweit hochmoderne KI-Erlebnisse zu bieten. Durch die Kombination von interner Innovation und strategischen Partnerschaften definiert Meta die Möglichkeiten einer skalierbaren und kostengünstigen KI-Infrastruktur kontinuierlich neu.

Meta MTIA Chips skalieren KI für Milliarden

Häufig gestellte Fragen

Bleiben Sie informiert