Meta-এর MTIA চিপস দিয়ে এআই অভিজ্ঞতা স্কেল করা
প্রতিদিন, Meta-এর বিভিন্ন প্ল্যাটফর্ম জুড়ে বিলিয়ন মানুষ ব্যক্তিগতকৃত বিষয়বস্তু সুপারিশ থেকে শুরু করে উন্নত এআই অ্যাসিস্ট্যান্ট পর্যন্ত অসংখ্য এআই-চালিত ফিচারের সাথে ইন্টারঅ্যাক্ট করে। Meta-এর জন্য, এবং প্রকৃতপক্ষে শিল্পের জন্য, অন্তর্নিহিত চ্যালেঞ্জ হলো এই অত্যাধুনিক এআই মডেলগুলিকে বৈশ্বিক স্তরে স্থাপন এবং অবিচ্ছিন্নভাবে উন্নত করা, এই সব করতে গিয়ে সর্বোত্তম খরচ-দক্ষতা বজায় রাখা। এই চাহিদাপূর্ণ অবকাঠামো কাজটি Meta-এর নমনীয়, অবিচ্ছিন্নভাবে বিকশিত সমাধানগুলিতে কৌশলগত বিনিয়োগের মাধ্যমে পূরণ হয়, যার কেন্দ্রে রয়েছে তাদের কাস্টম-ডিজাইন করা এআই চিপস: Meta Training and Inference Accelerator (MTIA) পরিবার।
অভ্যন্তরীণ এবং বাহ্যিক উভয় সমাধানকে কাজে লাগিয়ে একটি বৈচিত্র্যময় সিলিকন পোর্টফোলিওতে প্রতিশ্রুতিবদ্ধ থাকা সত্ত্বেও, Broadcom-এর সাথে নিবিড় অংশীদারিত্বে তৈরি MTIA চিপস Meta-এর এআই অবকাঠামো কৌশলের একটি অপরিহার্য উপাদান। এই স্ব-উত্পাদিত অ্যাক্সেলারেটরগুলি বিলিয়ন মানুষের কাছে পৌঁছানো এআই অভিজ্ঞতাগুলিকে সাশ্রয়ী উপায়ে চালিত করার জন্য অত্যন্ত গুরুত্বপূর্ণ, যা এআই মডেলগুলির দ্রুত বিকশিত ল্যান্ডস্কেপের সাথে ক্রমাগত খাপ খায়।
Meta-এর MTIA চিপসের পুনরাবৃত্তিমূলক বিবর্তন
এআই মডেলের ল্যান্ডস্কেপ নিরন্তর পরিবর্তনশীল অবস্থায় রয়েছে, এমন গতিতে বিকশিত হচ্ছে যা প্রায়শই ঐতিহ্যবাহী চিপ ডেভেলপমেন্ট চক্রকে ছাড়িয়ে যায়। Meta স্বীকার করে যে অনুমান করা ওয়ার্কলোডের উপর ভিত্তি করে চিপ ডিজাইনগুলি হার্ডওয়্যার উৎপাদন পর্যায়ে পৌঁছানোর আগেই সেকেলে হয়ে যেতে পারে, তাই Meta MTIA-এর জন্য একটি উদ্ভাবনী 'ভেলোসিটি স্ট্র্যাটেজি' গ্রহণ করেছে। দীর্ঘ, অনুমানমূলক উন্নয়ন সময়ের পরিবর্তে, Meta একটি পুনরাবৃত্তিমূলক পদ্ধতি গ্রহণ করে যেখানে প্রতিটি MTIA প্রজন্ম পূর্ববর্তী প্রজন্মের উপর ভিত্তি করে তৈরি হয়। এতে মডুলার চিপলেট ব্যবহার করা, সর্বশেষ এআই ওয়ার্কলোড অন্তর্দৃষ্টি অন্তর্ভুক্ত করা এবং উল্লেখযোগ্যভাবে স্বল্প সময়ের মধ্যে নতুন হার্ডওয়্যার প্রযুক্তি স্থাপন করা জড়িত। এই নিবিড় প্রতিক্রিয়া লুপ নিশ্চিত করে যে Meta-এর কাস্টম সিলিকন এআই মডেলগুলির গতিশীল চাহিদার সাথে ঘনিষ্ঠভাবে সামঞ্জস্যপূর্ণ থাকে, যা নতুন অগ্রগতির দ্রুত গ্রহণকে উৎসাহিত করে।
Meta ইতিমধ্যেই MTIA 100 এবং MTIA 200 নামক প্রথম দুটি প্রজন্মের বিস্তারিত বিবরণ একাডেমিক গবেষণাপত্রে প্রকাশ করেছে। এই ভিত্তির উপর নির্ভর করে, Meta চারটি নতুন ধারাবাহিক প্রজন্ম প্রবর্তনের জন্য উন্নয়নকে ত্বরান্বিত করেছে: MTIA 300, 400, 450, এবং 500। এই চিপগুলি হয় ইতিমধ্যেই উৎপাদনে আছে অথবা 2026 এবং 2027 সালে ব্যাপক স্থাপনার জন্য নির্ধারিত। এই দ্রুত ধারাবাহিকতা Meta-কে MTIA-এর ওয়ার্কলোড কভারেজ উল্লেখযোগ্যভাবে প্রসারিত করতে সাহায্য করেছে, যা প্রাথমিক র্যাঙ্কিং এবং সুপারিশ (R&R) ইনফারেন্স থেকে R&R ট্রেনিং, সাধারণ জেনারেটিভ এআই (GenAI) ওয়ার্কলোড এবং উচ্চ অপ্টিমাইজড জেনারেটিভ এআই ইনফারেন্সে সরে এসেছে।
MTIA 300: এআই ওয়ার্কলোডের ভিত্তি স্থাপন
MTIA 300 Meta-এর কাস্টম সিলিকন যাত্রায় একটি গুরুত্বপূর্ণ পদক্ষেপ চিহ্নিত করেছে। প্রাথমিকভাবে R&R মডেলগুলির জন্য অপ্টিমাইজ করা হয়েছিল, যা জেনারেটিভ এআই উত্থানের আগে Meta-এর প্রভাবশালী ওয়ার্কলোড ছিল, এর স্থাপত্যগত বিল্ডিং ব্লকগুলি পরবর্তী চিপগুলির জন্য একটি মজবুত ভিত্তি স্থাপন করেছিল। MTIA 300-এর প্রধান স্বতন্ত্র বৈশিষ্ট্যগুলির মধ্যে রয়েছে ইন্টিগ্রেটেড এনআইসি চিপলেট, যোগাযোগ সমষ্টি অফলোড করার জন্য ডেডিকেটেড মেসেজ ইঞ্জিন এবং রিডাকশন-ভিত্তিক সমষ্টিগুলির জন্য ডিজাইন করা নিয়ার-মেমরি কম্পিউট ক্ষমতা। এই কম-লেটেন্সি, উচ্চ-ব্যান্ডউইথ যোগাযোগ উপাদানগুলি পরবর্তী প্রজন্মগুলিতে কার্যকর জেনারেটিভ এআই ইনফারেন্স এবং ট্রেনিং সক্ষম করতে গুরুত্বপূর্ণ প্রমাণিত হয়েছিল।
MTIA 300 একটি কম্পিউট চিপলেট, দুটি নেটওয়ার্ক চিপলেট এবং বেশ কয়েকটি হাই-ব্যান্ডউইথ মেমরি (HBM) স্ট্যাক নিয়ে গঠিত। প্রতিটি কম্পিউট চিপলেট প্রক্রিয়াকরণ উপাদান (PEs) এর একটি গ্রিড বৈশিষ্ট্যযুক্ত, যা ফলন বাড়ানোর জন্য অতিরিক্ত PEs সহ কৌশলগতভাবে ডিজাইন করা হয়েছে। প্রতিটি PE হলো একটি অত্যাধুনিক ইউনিট যেখানে দুটি RISC-V ভেক্টর কোর, ম্যাট্রিক্স গুণনের জন্য একটি ডট প্রোডাক্ট ইঞ্জিন, অ্যাক্টিভেশন এবং এলিমেন্টওয়াইজ অপারেশনের জন্য একটি স্পেশাল ফাংশন ইউনিট, সঞ্চয় এবং ইন্টার-PE যোগাযোগের জন্য একটি রিডাকশন ইঞ্জিন, এবং স্থানীয় স্ক্র্যাচ মেমরির মধ্যে ডেটার কার্যকর চলাচলের জন্য একটি DMA ইঞ্জিন রয়েছে। এই জটিল ডিজাইন Meta-এর মূল এআই কাজগুলির জন্য একটি অত্যন্ত কার্যকর এবং সাশ্রয়ী সমাধান তৈরি করার প্রতিশ্রুতি তুলে ধরে।
MTIA 400: প্রতিযোগিতামূলক জেনারেটিভ এআই কর্মক্ষমতা অর্জন
জেনারেটিভ এআই-এর অভূতপূর্ব উত্থানের সাথে, Meta দ্রুত MTIA 300 কে MTIA 400 এ বিকশিত করেছে যাতে এর বিদ্যমান R&R ক্ষমতাগুলির পাশাপাশি জেনারেটিভ এআই ওয়ার্কলোডগুলির জন্য শক্তিশালী সমর্থন প্রদান করা যায়। MTIA 400 একটি উল্লেখযোগ্য অগ্রগতি প্রতিনিধিত্ব করে, এর পূর্বসূরীর তুলনায় 400% উচ্চতর FP8 FLOPS এবং HBM ব্যান্ডউইথে 51% বৃদ্ধি প্রদান করে। যেখানে MTIA 300 খরচ-দক্ষতার উপর দৃষ্টি নিবদ্ধ করেছিল, সেখানে MTIA 400 শীর্ষস্থানীয় বাণিজ্যিক এআই অ্যাক্সেলারেটরগুলির সাথে প্রতিযোগিতামূলক কাঁচা কর্মক্ষমতা প্রদানের জন্য ডিজাইন করা হয়েছিল।
এটি দুটি কম্পিউট চিপলেটকে একত্রিত করে কম্পিউট ডেনসিটি কার্যকরভাবে দ্বিগুণ করে এবং MX8 এবং MX4 এর উন্নত সংস্করণগুলিকে সমর্থন করে এই অর্জন করে, যা কার্যকর জেনারেটিভ এআই ইনফারেন্সের জন্য গুরুত্বপূর্ণ লো-প্রিসিশন ফর্ম্যাট। 72টি MTIA 400 ডিভাইস সহ একটি একক র্যাক, একটি সুইচড ব্যাকপ্লেনের মাধ্যমে সংযুক্ত, একটি শক্তিশালী স্কেল-আপ ডোমেইন তৈরি করে। এই সিস্টেমগুলি উন্নত এয়ার-অ্যাসিস্টেড লিকুইড কুলিং (AALC) র্যাক দ্বারা সমর্থিত, যা এমনকি পুরনো ডেটা সেন্টারগুলিতেও দ্রুত স্থাপনা সহজ করে, যা Meta-এর বৈশ্বিকভাবে তার এআই অবকাঠামো স্কেল করার ব্যবহারিক পদ্ধতি প্রদর্শন করে।
MTIA 450 এবং 500: জেনারেটিভ এআই ইনফারেন্সের জন্য বিশেষায়িত
জেনারেটিভ এআই ইনফারেন্স চাহিদার অব্যাহত সূচকীয় বৃদ্ধি অনুমান করে, Meta MTIA 400 কে আরও পরিমার্জন করেছে, যার ফলে MTIA 450 এবং পরবর্তীতে MTIA 500 তৈরি হয়েছে। এই প্রজন্মগুলি বিশেষভাবে জেনারেটিভ এআই ইনফারেন্সের অনন্য চ্যালেঞ্জগুলির জন্য অপ্টিমাইজ করা হয়েছে, মেমরি এবং গণনার গুরুত্বপূর্ণ অগ্রগতির উপর মনোযোগ দিয়ে।
MTIA 450 উল্লেখযোগ্য অগ্রগতি সাধন করেছে:
- আগের সংস্করণ থেকে HBM ব্যান্ডউইথ দ্বিগুণ করা, যা জেনারেটিভ এআই মডেলগুলিতে ডিকোড পর্যায়কে ত্বরান্বিত করার জন্য অত্যন্ত গুরুত্বপূর্ণ।
- MX4 FLOPS 75% বৃদ্ধি করা, যা বৃহৎ ভাষার মডেলগুলিতে সাধারণ মিশ্র-বিশেষজ্ঞ (MoE) ফিড-ফরোয়ার্ড নেটওয়ার্ক (FFN) গণনাকে দ্রুত করে।
- অ্যাটেনশন এবং FFN গণনাকে আরও কার্যকর করতে হার্ডওয়্যার অ্যাক্সেলারেশন প্রবর্তন করা, Softmax এবং FlashAttention-এর সাথে যুক্ত বাধাগুলি দূর করা।
- লো-প্রিসিশন ডেটা টাইপগুলিতে উদ্ভাবন করা, FP8/MX8 এর বাইরে গিয়ে FP16/BF16-এর MX4 FLOPS-এর 6 গুণ সরবরাহ করা, কাস্টম ডেটা-টাইপ উদ্ভাবনের মাধ্যমে যা মডেলের গুণমান বজায় রাখে এবং ন্যূনতম চিপ এলাকা প্রভাব সহ FLOPS বৃদ্ধি করে।
MTIA 500, 450-এর সাফল্যের উপর ভিত্তি করে, HBM ব্যান্ডউইথ আরও 50% বাড়িয়েছে এবং লো-প্রিসিশন ডেটা টাইপগুলিতে আরও উদ্ভাবন প্রবর্তন করেছে, যা জেনারেটিভ এআই ইনফারেন্স কর্মক্ষমতার সীমা ঠেলে দেওয়ার জন্য Meta-এর প্রতিশ্রুতিকে শক্তিশালী করে। উন্নতির জন্য এই অবিরাম প্রচেষ্টা নিশ্চিত করে যে Meta-এর এআই অভিজ্ঞতাগুলি অগ্রণী স্থানে থাকবে।
এই প্রজন্মগুলির মধ্যে ক্রমসঞ্চিত অগ্রগতিগুলি সুস্পষ্ট। MTIA 300 থেকে MTIA 500 পর্যন্ত, HBM ব্যান্ডউইথ চিত্তাকর্ষক 4.5 গুণ বৃদ্ধি পেয়েছে, যখন কম্পিউট FLOPS একটি অত্যাশ্চর্য 25 গুণ বৃদ্ধি পেয়েছে (MTIA 300 এর MX8 থেকে MTIA 500 এর MX4 পর্যন্ত)। দুই বছরের মধ্যে এই দ্রুত ত্বরান্বিতকরণ Meta-এর ভেলোসিটি স্ট্র্যাটেজি এবং এর কাস্টম সিলিকনকে ক্রমাগত উন্নত করার ক্ষমতার একটি প্রমাণ। এই বিবর্তন এজেন্টিক এআই অপারেশনাল করা এবং অন্যান্য জটিল মডেলগুলিকে বৃহৎ স্কেলে বাস্তবায়নের কেন্দ্রবিন্দুতে রয়েছে।
এখানে MTIA পরিবারের প্রধান বৈশিষ্ট্যগুলির একটি বিবরণ দেওয়া হলো:
| বৈশিষ্ট্য | MTIA 300 | MTIA 400 | MTIA 450 | MTIA 500 |
|---|---|---|---|---|
| কম্পিউট ডাই | 1 | 2 | 2 | 2 |
| HBM স্ট্যাকস | 4 | 4 | 8 | 8 |
| HBM ব্যান্ডউইথ (GB/s)* | 100 | 151 | 302 | 453 |
| MX8 FLOPS (TFLOPS) | 100 | 400 | 400 | 400 |
| MX4 FLOPS (TFLOPS) | N/A | 200 | 350 | 500 |
| স্কেল-আপ ডোমেইন আকার | 18 ডিভাইস** | 72 ডিভাইস | 72 ডিভাইস | 72 ডিভাইস |
| মূল অপ্টিমাইজেশন | R&R ট্রেনিং, লো-লেটেন্সি যোগাযোগ | সাধারণ জেনারেটিভ এআই, প্রতিযোগিতামূলক কাঁচা কর্মক্ষমতা | জেনারেটিভ এআই ইনফারেন্স, HBM, কাস্টম লো-প্রিসিশন | জেনারেটিভ এআই ইনফারেন্স, HBM, কাস্টম লো-প্রিসিশন |
*কিছু বিক্রেতা দ্বি-নির্দেশমূলক ব্যান্ডউইথ রিপোর্ট করে। সংশ্লিষ্ট দ্বি-নির্দেশমূলক ব্যান্ডউইথ পেতে সারণির মানকে দুই দ্বারা গুণ করুন। **MTIA 300 তুলনামূলকভাবে ছোট স্কেল-আপ ডোমেন আকার এবং লক্ষ্য R&R ওয়ার্কলোডের কারণে উচ্চ ব্যান্ডউইথ (200 GB/s) সহ একটি স্কেল-আউট নেটওয়ার্ক দিয়ে কনফিগার করা হয়েছে।
এই বৈশিষ্ট্যগুলি মেমরি ব্যান্ডউইথ এবং কম্পিউট শক্তিতে নাটকীয় উন্নতি তুলে ধরে, যা প্রদর্শন করে যে কীভাবে প্রতিটি MTIA প্রজন্ম বর্তমান এবং ভবিষ্যতের এআই অ্যাপ্লিকেশনগুলির সবচেয়ে জরুরি চাহিদা, বিশেষ করে সম্পদ-নিবিড় জেনারেটিভ এআই মডেলগুলির চাহিদা পূরণের জন্য সতর্কতার সাথে প্রকৌশল করা হয়েছে।
MTIA পরিবারের মাধ্যমে কাস্টম সিলিকন সমাধানের জন্য Meta-এর অবিরাম প্রচেষ্টা বিশ্বজুড়ে বিলিয়ন ব্যবহারকারীর কাছে অত্যাধুনিক এআই অভিজ্ঞতা প্রদানের প্রতিশ্রুতি তুলে ধরে। অভ্যন্তরীণ উদ্ভাবনকে কৌশলগত অংশীদারিত্বের সাথে একত্রিত করে, Meta পরিমাপযোগ্য এবং সাশ্রয়ী এআই অবকাঠামোর সম্ভাবনাগুলিকে পুনরায় সংজ্ঞায়িত করে চলেছে।
সচরাচর জিজ্ঞাসিত প্রশ্ন
What are Meta MTIA chips and what is their purpose?
How many generations of MTIA chips has Meta developed in recent years?
What is Meta's 'velocity strategy' for AI chip development?
How do the newer MTIA chips (400, 450, 500) support Generative AI workloads?
What are the key performance advancements from MTIA 300 to MTIA 500?
Why is High-Bandwidth Memory (HBM) important for GenAI inference performance?
আপডেট থাকুন
সর্বশেষ AI খবর ইনবক্সে পান।
