Mistral Small 4: Menyatukan Kemampuan AI untuk Developer

Mistral AI telah meluncurkan Mistral Small 4, sebuah model inovatif yang siap mendefinisikan ulang keserbagunaan dan efisiensi dalam lanskap AI. Rilis terbaru ini menandai langkah signifikan dalam menyatukan kemampuan AI yang berbeda—penalaran, multimodality, dan mengikuti instruksi—ke dalam satu model yang adaptif. Bagi developer, peneliti, dan perusahaan, Mistral Small 4 menjanjikan pendekatan yang ramping untuk membangun aplikasi AI canggih tanpa perlu mengelola berbagai model khusus.

Secara historis, model AI sering unggul dalam domain tertentu: beberapa cepat dalam menjalankan instruksi, yang lain menunjukkan penalaran yang kuat, dan beberapa pilihan menawarkan pemahaman multimodal. Mistral Small 4 mendobrak paradigma ini dengan mengintegrasikan kekuatan model unggulan Mistral AI sebelumnya—Magistral untuk penalaran, Pixtral untuk input multimodal, dan Devstral untuk pengkodean agentik—menjadi satu unit yang kohesif. Penyatuan ini bukan hanya kenyamanan; ini adalah langkah strategis menuju AI yang lebih efisien, terukur, dan ramah developer.

Dirilis di bawah lisensi Apache 2.0 yang permisif, Mistral Small 4 menggarisbawahi dedikasi Mistral AI terhadap prinsip sumber terbuka, mendorong ekosistem kolaboratif di mana inovasi dapat berkembang. Komitmen terhadap aksesibilitas ini memastikan bahwa teknologi AI canggih tidak hanya untuk segelintir orang, tetapi tersedia untuk komunitas global yang ingin mendorong batas-batas kemungkinan.

Inovasi Arsitektur yang Mendorong Kinerja Mistral Small 4

Mistral Small 4 direkayasa dengan arsitektur canggih yang dirancang untuk kinerja yang kuat dan efisiensi yang luar biasa. Sebagai model hibrida, ia dioptimalkan secara cermat untuk beragam tugas, termasuk obrolan umum, pengkodean kompleks, alur kerja agentik yang rumit, dan penalaran yang canggih. Kemampuannya untuk memproses input teks dan gambar secara natif memposisikannya sebagai solusi yang benar-benar serbaguna untuk aplikasi AI modern.

Inti dari desainnya adalah arsitektur Mixture of Experts (MoE), menampilkan 128 pakar dengan 4 aktif per token. Ini memungkinkan penskalaan dan spesialisasi yang efisien, memungkinkan model untuk secara dinamis melibatkan bagian paling relevan dari jaringannya untuk setiap tugas yang diberikan. Dengan total 119 miliar parameter dan 6 miliar parameter aktif per token (8 miliar termasuk lapisan embedding dan output), Mistral Small 4 memiliki kekuatan komputasi yang besar sambil mempertahankan jejak yang efisien.

Fitur penting adalah jendela konteks 256k yang luas, mendukung interaksi bentuk panjang yang luar biasa dan analisis dokumen yang mendalam. Konteks yang diperluas ini sangat penting untuk tugas-tugas yang memerlukan pemahaman komprehensif atas sejumlah besar teks, seperti tinjauan hukum, penelitian ilmiah, atau analisis kode ekstensif. Selanjutnya, model ini memperkenalkan upaya penalaran yang dapat dikonfigurasi (configurable reasoning effort), memungkinkan pengguna untuk beralih antara respons cepat, latensi rendah dan output yang intensif penalaran mendalam, memberikan kontrol yang belum pernah ada sebelumnya atas kinerja dan gaya output.

Multimodality natif Mistral Small 4 adalah pengubah permainan, menerima input teks dan gambar. Ini membuka beragam kasus penggunaan, mulai dari penguraian dokumen cerdas dan pencarian visual hingga generasi dan analisis teks-gambar yang canggih, menjadikannya alat yang sangat diperlukan untuk generasi baru aplikasi bertenaga AI.

Efisiensi dan Kemampuan Terpadu untuk AI Perusahaan

Desain Mistral Small 4 secara langsung menghasilkan manfaat kinerja yang nyata, menetapkan standar baru untuk efisiensi dalam model bahasa besar. Dibandingkan dengan pendahulunya, Mistral Small 3, model baru ini memberikan pengurangan 40% dalam waktu penyelesaian end-to-end dalam pengaturan yang dioptimalkan untuk latensi. Untuk aplikasi yang membutuhkan throughput tinggi, ia membanggakan peningkatan permintaan per detik yang luar biasa sebesar 3x.

Lompatan efisiensi ini sangat penting untuk penerapan perusahaan, di mana biaya dan kecepatan adalah yang terpenting. Desain cerdas Mistral Small 4 memastikan bahwa organisasi dapat mencapai lebih banyak dengan sumber daya yang lebih sedikit, yang berarti biaya operasional yang lebih rendah dan pengalaman pengguna yang lebih baik. Kemampuan model untuk menghasilkan skor kompetitif pada tolok ukur seperti LCR, LiveCodeBench, dan AIME 2025—menyamai atau melampaui model yang lebih besar seperti GPT-OSS 120B—sambil menghasilkan output yang jauh lebih pendek merupakan bukti efisiensi 'kinerja per token'nya. Ini berarti respons yang lebih cepat, biaya inferensi yang berkurang, dan skalabilitas yang ditingkatkan untuk tugas-tugas kompleks dan berisiko tinggi.

Sorotan Kinerja: Mistral Small 4 vs. Model Sebelumnya

Metrik	Mistral Small 4 (Dioptimalkan Latensi)	Mistral Small 4 (Dioptimalkan Throughput)	Mistral Small 3	GPT-OSS 120B (Referensi)
Waktu Penyelesaian End-to-End	Pengurangan 40%	—	Garis Dasar	—
Permintaan per Detik (RPS)	—	Peningkatan 3x	Garis Dasar	—
Skor Tolok Ukur LCR	0.72	0.72	—	Disamai/Dilampaui
Panjang Output LCR	1.6K karakter	1.6K karakter	—	3.5-4x lebih panjang
Skor LiveCodeBench	Mengungguli	Mengungguli	—	Mengungguli
Panjang Output LiveCodeBench	20% Lebih Sedikit	20% Lebih Sedikit	—	Garis Dasar

Parameter 'reasoning_effort' lebih lanjut meningkatkan efisiensi ini, memungkinkan developer untuk menyempurnakan perilaku model berdasarkan persyaratan tugas. Untuk obrolan sehari-hari dan respons cepat, reasoning_effort="none" memberikan output yang cepat dan ringan. Untuk pemecahan masalah yang kompleks, pengaturan reasoning_effort="high" melibatkan penalaran mendalam, langkah demi langkah, mirip dengan detail verbose model Magistral sebelumnya. Konfigurabilitas dinamis ini memastikan pemanfaatan sumber daya yang optimal, menjadikan Mistral Small 4 pusat kekuatan adaptif untuk berbagai aplikasi.

Memperluas Cakrawala: Kasus Penggunaan dan Aksesibilitas

Mistral Small 4 siap memberdayakan berbagai pengguna dan industri. Bagi developer, ini adalah alat yang sangat berharga untuk otomatisasi pengkodean, eksplorasi basis kode, dan pembuatan alur kerja agentik canggih. Kemampuannya untuk memahami dan menghasilkan kode secara efisien akan mempercepat siklus pengembangan dan mendorong inovasi.

Perusahaan akan menemukan Mistral Small 4 sangat diperlukan untuk asisten obrolan umum, pemahaman dokumen yang canggih, dan analisis multimodal yang komprehensif. Mulai dari meningkatkan dukungan pelanggan dengan chatbot cerdas hingga mengotomatisasi ekstraksi data dari dokumen kompleks, kemampuan terpadunya menyederhanakan operasi dan membuka wawasan baru.

Peneliti, terutama di bidang yang menuntut analisis ketat, akan mendapat manfaat dari kecakapannya dalam matematika, penelitian, dan tugas penalaran kompleks. Kemampuan untuk memproses sejumlah besar informasi dan melakukan penalaran mendalam menjadikannya asisten yang kuat untuk penemuan ilmiah dan penyelidikan akademis.

Komitmen Mistral AI terhadap sumber terbuka, yang ditunjukkan melalui lisensi Apache 2.0, semakin memperkuat dampaknya. Ini memungkinkan fleksibilitas yang tak tertandingi dalam penyetelan halus dan spesialisasi, memungkinkan organisasi untuk menyesuaikan model dengan kebutuhan spesifik domain mereka yang unik. Semangat kolaboratif ini selaras dengan gerakan yang lebih luas untuk membuat AI canggih dapat diakses, mewujudkan visi menskalakan AI untuk semua orang.

Ketersediaan dan Integrasi Ekosistem

Mengakses Mistral Small 4 mudah. Developer dapat mengintegrasikannya melalui Mistral API dan AI Studio. Ini juga tersedia di Repositori Hugging Face, menyediakan platform yang familiar bagi komunitas sumber terbuka.

Bagi mereka yang beroperasi dalam ekosistem NVIDIA, prototipe Mistral Small 4 tersedia secara gratis di build.nvidia.com. Untuk penyebaran tingkat produksi, model ini ditawarkan sejak hari pertama sebagai NVIDIA NIM (NVIDIA Inference Microservice), memastikan inferensi yang dioptimalkan dan dikontainerisasi secara langsung. Kustomisasi untuk penyetelan halus spesifik domain juga didukung melalui NVIDIA NeMo. Jaringan dukungan yang luas ini menyoroti kemitraan strategis antara Mistral AI dan NVIDIA, memperkuat tujuan bersama mereka untuk memajukan inovasi AI.

Dokumentasi teknis komprehensif dapat diakses di AI Governance Hub Mistral AI, menyediakan sumber daya penting bagi developer dan integrator. Untuk penyebaran perusahaan yang lebih besar, penyetelan halus kustom, atau solusi on-premises, Mistral AI mendorong keterlibatan langsung dengan tim ahli mereka.

Masa Depan AI Adalah Terbuka dan Terpadu

Mistral Small 4 merepresentasikan lompatan signifikan dalam evolusi model AI. Dengan berhasil menyatukan kemampuan instruksi, penalaran, dan multimodal ke dalam satu paket yang sangat efisien dan dapat diakses secara terbuka, Mistral AI telah menyederhanakan integrasi AI dan memberdayakan pengguna di semua sektor. Adaptabilitas ini berarti developer dan organisasi dapat menangani berbagai tugas yang jauh lebih luas dengan satu alat yang kuat, secara efektif membawa manfaat transformatif AI sumber terbuka ke aplikasi dunia nyata.

Rilis ini tidak hanya merampingkan proses pengembangan tetapi juga mendemokratisasikan akses ke kemampuan AI canggih, mendorong komunitas AI global yang lebih inovatif dan kolaboratif. Masa depan AI, sebagaimana diimpikan oleh Mistral AI, adalah masa depan di mana alat yang kuat dan serbaguna tersedia secara luas, memungkinkan setiap orang untuk berkontribusi pada babak selanjutnya kemajuan teknologi.

Sumber asli

https://mistral.ai/news/mistral-small-4

Pertanyaan yang Sering Diajukan

What is Mistral Small 4 and what makes it unique?

Mistral Small 4 is the latest major release in Mistral AI's 'Small' model family, uniquely unifying the capabilities of their previous flagship models: Magistral for complex reasoning, Pixtral for multimodal understanding, and Devstral for agentic coding. This means developers no longer need to choose between specialized models for different tasks; Mistral Small 4 offers a single, versatile solution capable of fast instruction, powerful reasoning, and multimodal assistance, all with configurable reasoning effort and best-in-class efficiency. It's released under an Apache 2.0 license, emphasizing its commitment to open, accessible, and customizable AI, making it a significant advancement for developers and enterprises seeking integrated AI solutions.

What are the key architectural innovations in Mistral Small 4?

Mistral Small 4 leverages a sophisticated Mixture of Experts (MoE) architecture, featuring 128 experts with 4 active per token, allowing for efficient scaling and specialization. It boasts a total of 119 billion parameters, with 6 billion active parameters per token (8 billion including embedding and output layers), providing substantial processing power. A 256k context window supports extensive long-form interactions and detailed document analysis. Furthermore, its native multimodality accepts both text and image inputs, unlocking a vast array of use cases from document parsing to visual analysis. The model also includes a configurable 'reasoning_effort' parameter, allowing dynamic adjustment between low-latency and deep reasoning outputs.

How does Mistral Small 4 enhance performance compared to previous models?

Mistral Small 4 demonstrates significant performance enhancements, achieving a 40% reduction in end-to-end completion time in latency-optimized setups. For throughput-optimized deployments, it delivers 3x more requests per second compared to its predecessor, Mistral Small 3. This efficiency is critical for enterprise applications, as it directly impacts operational costs and scalability. Benchmarks like LCR, LiveCodeBench, and AIME 2025 show Mistral Small 4, particularly with its reasoning enabled, matching or surpassing the performance of larger models like GPT-OSS 120B, while generating significantly shorter, and thus more efficient, outputs. This 'performance per token' efficiency translates to lower inference costs and improved user experience.

What is the 'reasoning_effort' parameter and how does it benefit users?

The 'reasoning_effort' parameter in Mistral Small 4 allows users to dynamically adjust the model's computational intensity and output style to match the specific demands of their task. Setting 'reasoning_effort='none'' provides fast, lightweight responses suitable for everyday tasks, akin to the chat style of Mistral Small 3.2. Conversely, 'reasoning_effort='high'' prompts the model to engage in deep, step-by-step reasoning, producing more verbose and thoroughly considered outputs equivalent to previous Magistral models. This configurability provides unprecedented flexibility, enabling developers to optimize for either speed or depth, depending on the complexity and criticality of the problem at hand, thereby enhancing both efficiency and accuracy.

What are the primary intended use cases for Mistral Small 4?

Mistral Small 4 is designed to cater to a broad spectrum of users and applications due to its versatile, unified capabilities. For developers, it's ideal for coding automation, codebase exploration, and implementing sophisticated code agentic workflows. Enterprises can leverage it for general chat assistants, comprehensive document understanding, and advanced multimodal analysis. Researchers will find it invaluable for complex math problems, in-depth research tasks, and intricate reasoning challenges. Its open-source license further encourages fine-tuning and specialization, making it adaptable for almost any domain-specific requirement, ensuring it can power a new generation of AI-driven tools and services.

How can developers and enterprises access Mistral Small 4?

Mistral Small 4 is made broadly accessible through multiple channels. Developers can access it via the Mistral API and AI Studio for direct integration into their applications. It's also available on the Hugging Face Repository, making it easy for the open-source community to engage with and build upon. For those leveraging NVIDIA's ecosystem, prototyping is free on build.nvidia.com, and for production, it's available as an NVIDIA NIM (NVIDIA Inference Microservice), offering optimized, containerized inference. Additionally, it can be customized with NVIDIA NeMo for domain-specific fine-tuning. For enterprise-grade deployments, custom fine-tuning, or on-premises solutions, Mistral AI encourages direct contact with their team to facilitate tailored integration.

What does Mistral Small 4's release signify for open-source AI?

The release of Mistral Small 4 under the Apache 2.0 license strongly reaffirms Mistral AI's deep commitment to the open-source community and accessible AI. By unifying advanced instruct, reasoning, and multimodal capabilities into a single, efficient, and openly available model, Mistral Small 4 lowers barriers to entry for developers and organizations. It simplifies AI integration, allowing for a wider range of tasks to be tackled with a single adaptable tool, directly translating the benefits of open-source AI into real-world applications. This move not only fosters collaboration and innovation but also provides a powerful, versatile foundation upon which the global AI community can build the next generation of intelligent systems, aligning with initiatives like the NVIDIA Nemotron Coalition.

Tetap Update

Dapatkan berita AI terbaru di inbox Anda.