Mistral Small 4: AI galimybių suvienijimas kūrėjams

Mistral AI pristatė Mistral Small 4 – novatorišką modelį, skirtą iš naujo apibrėžti universalumą ir efektyvumą dirbtinio intelekto (DI) srityje. Šis naujausias leidimas žymi reikšmingą pažangą sujungiant atskiras DI galimybes – samprotavimą, multimodalumą ir instrukcijų vykdymą – į vieną, pritaikomą modelį. Kūrėjams, tyrėjams ir įmonėms Mistral Small 4 žada supaprastintą požiūrį į pažangių DI programų kūrimą, nebereikia derinti specializuotų modelių.

Istoriškai DI modeliai dažnai pasižymėdavo specifinėse srityse: kai kurie greitai vykdydavo instrukcijas, kiti demonstravo galingą samprotavimą, o nedaugelis siūlė multimodalią supratimą. Mistral Small 4 laužo šią paradigmą, integruodamas Mistral AI ankstesnių pavyzdinių modelių stiprybes – Magistral samprotavimui, Pixtral multimodalioms įvestims ir Devstral agentiniam kodavimui – į vieną vientisą vienetą. Šis suvienijimas yra ne tik patogumas; tai strateginis žingsnis efektyvesnio, masteliojamo ir kūrėjams patogesnio DI link.

Išleistas pagal lanksčią Apache 2.0 licenciją, Mistral Small 4 pabrėžia Mistral AI atsidavimą atvirojo kodo principams, skatinant bendradarbiavimo ekosistemą, kurioje gali klestėti inovacijos. Šis įsipareigojimas prieinamumui užtikrina, kad pažangiausios DI technologijos būtų ne tik keliems, bet prieinamos pasaulinei bendruomenei, trokštančiai peržengti galimybių ribas.

Architektūrinės inovacijos, lemiančios Mistral Small 4 našumą

Mistral Small 4 sukurtas naudojant pažangiausią architektūrą, skirtą tiek tvirtam našumui, tiek nepaprastam efektyvumui. Kaip hibridinis modelis, jis kruopščiai optimizuotas įvairioms užduotims, įskaitant bendrą pokalbį, sudėtingą kodavimą, sudėtingas agentines darbo eigas ir sudėtingą samprotavimą. Jo gebėjimas apdoroti tiek teksto, tiek vaizdo įvestis natūraliai pozicionuoja jį kaip išties universalų sprendimą šiuolaikinėms DI programoms.

Pagrindinė jo dizaino dalis yra ekspertų mišinio (MoE) architektūra, turinti 128 ekspertus, kurių 4 aktyvūs kiekvienam tokenui. Tai leidžia efektyviai masteliuoti ir specializuotis, įgalinant modelį dinamiškai įtraukti svarbiausias savo tinklo dalis bet kuriai užduočiai. Su 119 milijardų bendrų parametrų ir 6 milijardais aktyvių parametrų kiekvienam tokenui (8 milijardai, įskaitant įdėjimo ir išvesties sluoksnius), Mistral Small 4 turi didžiulę skaičiavimo galią, išlaikydamas efektyvų pėdsaką.

Reikšminga savybė yra jo platus 256k konteksto langas, palaikantis išskirtinai ilgos formos sąveikas ir išsamią dokumentų analizę. Šis išplėstinis kontekstas yra labai svarbus užduotims, reikalaujančioms visapusiško supratimo apie didelius tekstų kiekius, tokius kaip teisinis peržiūrėjimas, moksliniai tyrimai ar išsami kodo analizė. Be to, modelis pristato konfigūruojamą samprotavimo pastangų lygį, leidžiantį vartotojams perjungti tarp greitų, mažos delsos atsakymų ir gilių, samprotavimu pagrįstų išvesčių, suteikiant precedento neturinčią kontrolę dėl našumo ir išvesties stiliaus.

Mistral Small 4 gimtoji multimodališkumas keičia žaidimą, priimdamas tiek teksto, tiek vaizdo įvestis. Tai atveria daugybę naudojimo atvejų, nuo išmaniojo dokumentų apdorojimo ir vizualinės paieškos iki sudėtingos vaizdų-teksto generavimo ir analizės, todėl tai yra nepakeičiamas įrankis naujai AI varomų programų kartai.

Efektyvumas ir suvienytos galimybės įmonių DI

Mistral Small 4 dizainas tiesiogiai virsta apčiuopiama našumo nauda, nustatydamas naują efektyvumo standartą dideliems kalbos modeliams. Palyginti su savo pirmtaku, Mistral Small 3, naujasis modelis užtikrina 40% viso užbaigimo laiko sumažinimą delsos optimizuotose konfigūracijose. Programoms, reikalaujančioms didelio pralaidumo, jis pasižymi nepaprastu 3 kartų užklausų per sekundę padidėjimu.

Šis efektyvumo šuolis yra kritiškai svarbus įmonių diegimams, kur išlaidos ir greitis yra svarbiausi. Mistral Small 4 išmanus dizainas užtikrina, kad organizacijos gali pasiekti daugiau su mažiau išteklių, o tai reiškia mažesnes veiklos sąnaudas ir aukštesnę vartotojo patirtį. Modelio gebėjimas generuoti konkurencingus rezultatus etalonuose, tokiuose kaip LCR, LiveCodeBench ir AIME 2025 – atitinkant arba viršijant didesnius modelius, tokius kaip GPT-OSS 120B – gaminant žymiai trumpesnes išvestis, yra jo 'našumo vienam tokenui' efektyvumo įrodymas. Tai reiškia greitesnius atsakymus, sumažintas išvesties sąnaudas ir pagerintą masteliškumą sudėtingoms, didelės rizikos užduotims.

Našumo akcentai: Mistral Small 4 vs. ankstesni modeliai

Rodiklis	Mistral Small 4 (optimizuotas vėlavimui)	Mistral Small 4 (optimizuotas pralaidumui)	Mistral Small 3	GPT-OSS 120B (nuoroda)
Viso užbaigimo laikas	40% sumažinimas	—	Bazinis	—
Užklausų per sekundę (RPS)	—	3x padidėjimas	Bazinis	—
LCR etaloninis rezultatas	0.72	0.72	—	Atitiko/viršijo
LCR išvesties ilgis	1.6K simbolių	1.6K simbolių	—	3.5-4x ilgesnis
LiveCodeBench rezultatas	Viršija	Viršija	—	Viršija
LiveCodeBench išvesties ilgis	20% mažiau	20% mažiau	—	Bazinis

'reasoning_effort' parametras dar labiau padidina šį efektyvumą, leisdamas kūrėjams tikslinti modelio elgseną pagal užduoties reikalavimus. Kasdieniam pokalbiui ir greitiems atsakymams, reasoning_effort="none" pateikia greitas, lengvas išvestis. Sudėtingam problemų sprendimui, nustačius reasoning_effort="high", įsitraukiama į gilų, žingsnis po žingsnio samprotavimą, panašų į išsamų ankstesnių Magistral modelių išsamumą. Šis dinaminis konfigūravimas užtikrina optimalų išteklių panaudojimą, todėl Mistral Small 4 yra prisitaikanti jėgainė įvairioms programoms.

Horizontų plėtimas: naudojimo atvejai ir prieinamumas

Mistral Small 4 yra pasirengęs suteikti galios plačiam vartotojų ir pramonės šakų ratui. Kūrėjams tai yra neįkainojamas įrankis kodavimo automatizavimui, kodo bazės tyrinėjimui ir pažangių agentinių darbo eigų kūrimui. Jo gebėjimas efektyviai suprasti ir generuoti kodą paspartins kūrimo ciklus ir skatins inovacijas.

Įmonėms Mistral Small 4 bus nepakeičiamas bendriesiems pokalbių asistentams, sudėtingam dokumentų supratimui ir visapusiškai multimodaliai analizei. Nuo klientų aptarnavimo gerinimo su išmaniaisiais pokalbių robotais iki duomenų išgavimo automatizavimo iš sudėtingų dokumentų, jo suvienytos galimybės supaprastina operacijas ir atskleidžia naujas įžvalgas.

Tyrėjai, ypač srityse, reikalaujančiose griežtos analizės, gaus naudos iš jo meistriškumo matematikoje, tyrimuose ir sudėtingose samprotavimo užduotyse. Gebėjimas apdoroti didelius informacijos kiekius ir atlikti gilų samprotavimą daro jį galingu asistentu moksliniams atradimams ir akademiniams tyrimams.

Mistral AI įsipareigojimas atvirajam kodui, demonstruojamas per Apache 2.0 licenciją, dar labiau sustiprina jo poveikį. Tai leidžia neprilygstamą lankstumą tikslinant ir specializuojantis, įgalinant organizacijas pritaikyti modelį prie jų unikalių konkrečios srities poreikių. Ši bendradarbiavimo dvasia dera su platesniu judėjimu, skirtu padaryti pažangų AI prieinamą, įkūnijant AI mastelio didinimo visiems viziją.

Prieinamumas ir ekosistemos integravimas

Pasiekti Mistral Small 4 yra paprasta. Kūrėjai gali jį integruoti per Mistral API ir AI Studio. Jis taip pat lengvai pasiekiamas Hugging Face saugykloje, suteikiant pažįstamą platformą atvirojo kodo bendruomenei.

Tiems, kurie veikia NVIDIA ekosistemoje, Mistral Small 4 prototipų kūrimas yra nemokamas build.nvidia.com. Gamybai skirtiems diegimams, modelis nuo pat pirmos dienos siūlomas kaip NVIDIA NIM (NVIDIA Inference Microservice), užtikrinantis optimizuotą, konteinerizuotą išvadą. Konkrečios srities tikslinimui taip pat palaikoma tinkinimas per NVIDIA NeMo. Šis platus palaikymo tinklas pabrėžia strateginę partnerystę tarp Mistral AI ir NVIDIA, stiprinant jų bendrą tikslą skatinti DI inovacijas.

Išsami techninė dokumentacija pasiekiama Mistral AI AI valdymo centre, teikiant esminius išteklius kūrėjams ir integratoriams. Didesniems įmonių diegimams, individualiam tikslinimui arba vietiniams sprendimams, Mistral AI skatina tiesioginį bendradarbiavimą su jų ekspertų komanda.

DI ateitis yra atvira ir suvienyta

Mistral Small 4 žymi reikšmingą šuolį DI modelių evoliucijoje. Sėkmingai sujungdama instrukcijų vykdymo, samprotavimo ir multimodalias galimybes į vieną, labai efektyvų ir atvirai prieinamą paketą, Mistral AI supaprastino DI integravimą ir suteikė galios vartotojams visuose sektoriuose. Šis prisitaikomumas reiškia, kad kūrėjai ir organizacijos gali spręsti daug platesnį užduočių spektrą su vienu, tvirtu įrankiu, veiksmingai atnešdami atvirojo kodo DI transformacines naudas į realaus pasaulio programas.

Šis leidimas ne tik supaprastina kūrimo procesą, bet ir demokratizuoja prieigą prie pažangių DI galimybių, skatindamas inovatyvesnę ir bendradarbiaujančią pasaulinę DI bendruomenę. DI ateitis, kaip ją įsivaizduoja Mistral AI, yra tokia, kurioje galingi, universalūs įrankiai yra lengvai prieinami, leidžiantys kiekvienam prisidėti prie kito technologinės pažangos skyriaus.

Originalus šaltinis

https://mistral.ai/news/mistral-small-4

Dažniausiai užduodami klausimai

What is Mistral Small 4 and what makes it unique?

Mistral Small 4 is the latest major release in Mistral AI's 'Small' model family, uniquely unifying the capabilities of their previous flagship models: Magistral for complex reasoning, Pixtral for multimodal understanding, and Devstral for agentic coding. This means developers no longer need to choose between specialized models for different tasks; Mistral Small 4 offers a single, versatile solution capable of fast instruction, powerful reasoning, and multimodal assistance, all with configurable reasoning effort and best-in-class efficiency. It's released under an Apache 2.0 license, emphasizing its commitment to open, accessible, and customizable AI, making it a significant advancement for developers and enterprises seeking integrated AI solutions.

What are the key architectural innovations in Mistral Small 4?

Mistral Small 4 leverages a sophisticated Mixture of Experts (MoE) architecture, featuring 128 experts with 4 active per token, allowing for efficient scaling and specialization. It boasts a total of 119 billion parameters, with 6 billion active parameters per token (8 billion including embedding and output layers), providing substantial processing power. A 256k context window supports extensive long-form interactions and detailed document analysis. Furthermore, its native multimodality accepts both text and image inputs, unlocking a vast array of use cases from document parsing to visual analysis. The model also includes a configurable 'reasoning_effort' parameter, allowing dynamic adjustment between low-latency and deep reasoning outputs.

How does Mistral Small 4 enhance performance compared to previous models?

Mistral Small 4 demonstrates significant performance enhancements, achieving a 40% reduction in end-to-end completion time in latency-optimized setups. For throughput-optimized deployments, it delivers 3x more requests per second compared to its predecessor, Mistral Small 3. This efficiency is critical for enterprise applications, as it directly impacts operational costs and scalability. Benchmarks like LCR, LiveCodeBench, and AIME 2025 show Mistral Small 4, particularly with its reasoning enabled, matching or surpassing the performance of larger models like GPT-OSS 120B, while generating significantly shorter, and thus more efficient, outputs. This 'performance per token' efficiency translates to lower inference costs and improved user experience.

What is the 'reasoning_effort' parameter and how does it benefit users?

The 'reasoning_effort' parameter in Mistral Small 4 allows users to dynamically adjust the model's computational intensity and output style to match the specific demands of their task. Setting 'reasoning_effort='none'' provides fast, lightweight responses suitable for everyday tasks, akin to the chat style of Mistral Small 3.2. Conversely, 'reasoning_effort='high'' prompts the model to engage in deep, step-by-step reasoning, producing more verbose and thoroughly considered outputs equivalent to previous Magistral models. This configurability provides unprecedented flexibility, enabling developers to optimize for either speed or depth, depending on the complexity and criticality of the problem at hand, thereby enhancing both efficiency and accuracy.

What are the primary intended use cases for Mistral Small 4?

Mistral Small 4 is designed to cater to a broad spectrum of users and applications due to its versatile, unified capabilities. For developers, it's ideal for coding automation, codebase exploration, and implementing sophisticated code agentic workflows. Enterprises can leverage it for general chat assistants, comprehensive document understanding, and advanced multimodal analysis. Researchers will find it invaluable for complex math problems, in-depth research tasks, and intricate reasoning challenges. Its open-source license further encourages fine-tuning and specialization, making it adaptable for almost any domain-specific requirement, ensuring it can power a new generation of AI-driven tools and services.

How can developers and enterprises access Mistral Small 4?

Mistral Small 4 is made broadly accessible through multiple channels. Developers can access it via the Mistral API and AI Studio for direct integration into their applications. It's also available on the Hugging Face Repository, making it easy for the open-source community to engage with and build upon. For those leveraging NVIDIA's ecosystem, prototyping is free on build.nvidia.com, and for production, it's available as an NVIDIA NIM (NVIDIA Inference Microservice), offering optimized, containerized inference. Additionally, it can be customized with NVIDIA NeMo for domain-specific fine-tuning. For enterprise-grade deployments, custom fine-tuning, or on-premises solutions, Mistral AI encourages direct contact with their team to facilitate tailored integration.

What does Mistral Small 4's release signify for open-source AI?

The release of Mistral Small 4 under the Apache 2.0 license strongly reaffirms Mistral AI's deep commitment to the open-source community and accessible AI. By unifying advanced instruct, reasoning, and multimodal capabilities into a single, efficient, and openly available model, Mistral Small 4 lowers barriers to entry for developers and organizations. It simplifies AI integration, allowing for a wider range of tasks to be tackled with a single adaptable tool, directly translating the benefits of open-source AI into real-world applications. This move not only fosters collaboration and innovation but also provides a powerful, versatile foundation upon which the global AI community can build the next generation of intelligent systems, aligning with initiatives like the NVIDIA Nemotron Coalition.

Būkite informuoti

Gaukite naujausias AI naujienas el. paštu.

Dalintis