Code Velocity
Gervigreindarlíkön

Gemma 4: Að stækka gervigreind frá gagnaveri til útjaðar með NVIDIA

·5 mín lestur·NVIDIA·Upprunaleg heimild
Deila
NVIDIA Gemma 4 líkön sem virkja gervigreind á jaðartækjum og í gagnaverum

Landslag gervigreindar er í örri þróun, með vaxandi eftirspurn eftir því að innleiða háþróuð gervigreindarlíkön ekki aðeins í skýjagagnaverum, heldur einnig á jaðri netkerfa og beint á tækjum notenda. Þessi breyting knýr fram þörf fyrir minni leynd, aukna persónuvernd, minni rekstrarkostnað og getu til að starfa í umhverfi með takmarkaða tengingu. Til að mæta þessum mikilvægu kröfum hafa NVIDIA og Google unnið saman að því að kynna nýjustu Gemma 4 fjölstilltu og fjöltyngdu líkönin, hönnuð til að skalast hnökralaust frá öflugustu NVIDIA Blackwell gagnaverunum niður í smá Jetson jaðartæki.

Þessi líkön tákna verulegt stökk í skilvirkni og nákvæmni, sem gerir þau að fjölhæfum verkfærum fyrir fjölbreytt úrval algengra gervigreindarverkefna. Gemma 4 fjölskyldan er í stakk búin til að endurskilgreina hvernig gervigreind er samþætt í dagleg forrit, og býður upp á eiginleika sem ýta undir mörk þess sem mögulegt er í staðbundinni innleiðingu gervigreindar.

Gemma 4: Að efla fjölstillta og fjöltyngda gervigreind

Gemmaverse hefur stækkað með kynningu á fjórum nýjum Gemma 4 líkönum, hvert um sig hannað með ákveðnar innleiðingaraðstæður í huga, en býður upp á öflugt sett af eiginleikum. Þessi líkön snúast ekki bara um stærð; þau snúast um snjalla hönnun sem skilar sterkum árangri í fjölbreyttum gervigreindaráskorunum.

Helstu eiginleikar Gemma 4 líkananna eru:

  • Röksemdafærsla: Framúrskarandi árangur í flóknum vandamálalausnarverkefnum, sem gerir kleift að taka flóknari ákvarðanir.
  • Kóðun: Háþróuð kóðagerð og villuleitarvirkni, sem einfaldar verkflæði forritara.
  • Umboðsmenn: Innfæddur stuðningur við skipulagða verkfærnotkun, sem auðveldar gerð öflugra umboðsmannastýrðra gervigreindarkerfa.
  • Sjón, hljóð og myndbandsgeta: Rík fjölstillt samskipti fyrir notkunartilvik eins og hlutgreiningu, sjálfvirka talgreiningu (ASR), skjala- og myndbandsgreind.
  • Samtvinnuð fjölstillt innskot: Geta til að blanda frjálslega texta og myndum innan einnar fyrirspurnar, sem býður upp á náttúrulegri og ítarlegri samskipti.
  • Fjöltyngdur stuðningur: Innfæddur stuðningur við yfir 35 tungumál, með forþjálfun á yfir 140 tungumálum, sem eykur aðgengi á heimsvísu.

Gemma 4 fjölskyldan inniheldur fyrsta Mixture-of-Experts (MoE) líkanið í Gemma seríunni, fínstillt fyrir skilvirkni. Athyglisvert er að öll fjögur líkönin geta passað á eitt NVIDIA H100 GPU-kort, sem sýnir fínstillta hönnun þeirra. 31B og 26B A4B afbrigðin eru afkastamikil röksemdarlíkön sem henta bæði fyrir staðbundin og gagnaverumhverfi, á meðan E4B og E2B líkönin eru sérsniðin fyrir forrit á tækjum og farsímum, byggð á arfleifð Gemma 3n.

LíkananafnGerð arkitektúrsHeildarfæribreyturVirkir eða raunvirkar færibreyturLengd inntaks samhengis (tákn)Renndur gluggi (tákn)Stillingar
Gemma-4-31BÞéttur spennir31B256K1024Texti
Gemma-4-26B-A4BMoE – 128 Sérfræðingar26B3.8B256KTexti
Gemma-4-E4BÞéttur spennir7.9B með innfellingum4.5B virkar128K512Texti, hljóð, sjón, myndband
Gemma-4-E2BÞéttur spennir5.1B með innfellingum2.3B virkar128K512Texti, hljóð, sjón, myndband

Tafla 1. Yfirlit yfir Gemma 4 líkanafjölskylduna, sem dregur saman arkitektúrgerðir, stærð færibreyta, virkar færibreytur, studdar samhengislengdir og tiltækar stillingar til að hjálpa forriturum að velja rétta líkanið fyrir gagnaver, jaðar og innleiðingu á tækjum.

Þessi líkön eru fáanleg á Hugging Face með BF16 skilapunktum. Fyrir forritara sem nýta sér NVIDIA Blackwell GPU-kort er NVFP4 magnbundinn skilapunktur fyrir Gemma-4-31B fáanlegur í gegnum NVIDIA Model Optimizer til notkunar með vLLM. NVFP4 nákvæmni heldur nánast sömu nákvæmni og 8-bita nákvæmni en bætir verulega afköst á hvert watt og lækkar kostnað á tákn, sem er mikilvægt fyrir innleiðingu á stórum skala.

Að færa gervigreind til jaðarins: Innleiðing á tækjum með NVIDIA vélbúnaði

Eftir því sem gervigreindarverkflæði og umboðsmenn verða sífellt mikilvægari í daglegum rekstri er getan til að keyra þessi líkön utan hefðbundinna gagnaverumhverfa afar mikilvæg. NVIDIA býður upp á alhliða vistkerfi biðlara- og jaðarkerfa, frá öflugum GPU-kortum eins og RTX GPU-kortum til sérhæfðra Jetson tækja og DGX Spark, sem veitir forriturum þann sveigjanleika sem þarf til að fínstilla kostnað, leynd og öryggi.

NVIDIA hefur unnið með leiðandi ályktunarrammaverkum eins og vLLM, Ollama og llama.cpp til að tryggja bestu staðbundnu innleiðingarreynsluna fyrir Gemma 4 líkön. Að auki veitir Unsloth strax stuðning með fínstilltum og magnbundnum líkönum, sem gerir skilvirka staðbundna innleiðingu kleift í gegnum Unsloth Studio. Þetta öfluga stuðningskerfi gerir forriturum kleift að innleiða háþróaða gervigreind beint þar sem hennar er mest þörf.

DGX SparkJetsonRTX / RTX PRO
NotkunartilvikGervigreindarannsóknir og frumgerðagerðÚtjaðar-gervigreind og vélfærafræðiSkjáborðsforrit og Windows þróun
Helstu hápunktarForuppsettur NVIDIA gervigreindarhugbúnaðarstafla og 128 GB af sameinuðu minni knýja staðbundna frumgerðagerð, fínstillingu og fullkomlega staðbundin OpenClaw verkflæðiNálægt núll leynd vegna arkitektúreiginleika eins og skilyrtra færibreytuhleðslu og innfellinga á hverju lagi sem hægt er að geyma í skyndiminni fyrir hraðari og minni minnisnotkun ( frekari upplýsingar)Fínstillt afköst fyrir staðbundna ályktun fyrir áhugamenn, skapara og fagmenn
Leiðbeiningar fyrir byrjendurDGX Spark handbækur fyrir vLLM, Ollama, Unsloth og llama.cpp innleiðingarleiðbeiningar
NeMo Automodel fyrir fínstillingu á Spark leiðbeiningar
Jetson AI Lab fyrir kennsluefni og sérsniðna Gemma gámaRTX AI Garage fyrir Ollama og llama.cpp leiðbeiningar. RTX Pro eigendur geta einnig notað vLLM.

Tafla 2. Samanburður á staðbundnum innleiðingarvalkostum á NVIDIA pöllum, sem leggur áherslu á helstu notkunartilvik, eiginleika og ráðlagðar upphafsauðlindir fyrir DGX Spark, Jetson og RTX / RTX PRO kerfi sem keyra Gemma 4 líkön.

Að byggja örugg umboðsmannastýrð verkflæði og innleiðingar tilbúnar fyrir fyrirtæki

Fyrir gervigreindarforritara og áhugamenn býður NVIDIA DGX Spark, með GB10 Grace Blackwell Superchip og 128 GB af sameinuðu minni, upp á óviðjafnanlegar auðlindir. Þessi öflugi vettvangur er tilvalinn til að keyra Gemma 4 31B líkanið með BF16 vigtum, sem gerir skilvirka frumgerðagerð og byggingu flókinna umboðsmannastýrðra gervigreindarverkflæða kleift, á sama tíma og einka- og örugg framkvæmd á tækinu er tryggð. DGX Linux stýrikerfið og fullur NVIDIA hugbúnaðarstaflinn veita hnökralaust þróunarumhverfi.

vLLM ályktunarvélin, hönnuð fyrir mikla afköst LLM þjónustu, hámarkar skilvirkni og lágmarkar minnisnotkun á DGX Spark. Þessi samsetning veitir afkastamikinn vettvang til að innleiða stærstu Gemma 4 líkönin. Forritarar geta nýtt sér vLLM fyrir ályktunar DGX Spark handbókina eða byrjað með Ollama eða llama.cpp. Ennfremur gerir NeMo Automodel kleift að fínstilla þessi líkön beint á DGX Spark.

Fyrir fyrirtækjanotendur býður NVIDIA NIM upp á leið til framleiðslutilbúinnar innleiðingar. Forritarar geta frumgera Gemma 4 31B með því að nota NVIDIA-hýst NIM API úr NVIDIA API vörulistanum. Fyrir fulla framleiðslu eru forpakkaðar og fínstilltar NIM örþjónustur fáanlegar fyrir örugga, sjálfshýsta innleiðingu, studd af NVIDIA fyrirtækisleyfi. Þetta tryggir að fyrirtæki geti innleitt öflugar gervigreindarlausnir með sjálfstrausti, og uppfyllt strangar öryggis- og rekstrarkröfur.

Að styrkja líkamlega gervigreindarumboðsmenn með NVIDIA Jetson

Getu nútíma líkamlegra gervigreindarumboðsmanna er í örri þróun, að mestu leyti vegna Gemma 4 líkana sem samþætta háþróaða hljóð-, fjölstillta skynjun og djúpa röksemdafærslu. Þessi háþróuðu líkön gera vélfærakerfum kleift að fara út fyrir einfalda framkvæmd verkefna, veita þeim getu til að skilja tal, túlka sjónrænt samhengi og röksemdafæra á snjallan hátt áður en þau bregðast við.

Á NVIDIA Jetson pöllum geta forritarar framkvæmt Gemma 4 ályktun á jaðrinum með því að nota llama.cpp og vLLM. Jetson Orin Nano, til dæmis, styður Gemma 4 E2B og E4B afbrigði, sem auðveldar fjölstillta ályktun á litlum, innbyggðum og orkutakmörkuðum kerfum. Þessi stigunargeta nær yfir allan Jetson pallinn, upp að hinum öfluga Jetson Thor, sem gerir kleift að innleiða líkön á stöðugan hátt óháð vélbúnaðarfótspori. Þetta er mikilvægt fyrir forrit í vélfærafræði, snjallvélum og iðnaðarsjálfvirkni þar sem lágleyndar afköst og greind á tækinu eru afar mikilvæg. Forritarar sem hafa áhuga á að kanna þessa eiginleika geta fundið kennsluefni og sérsniðna Gemma gáma á Jetson AI Lab.

Sérstilling og viðskiptaaðgengi með NVIDIA NeMo

Til að tryggja að Gemma 4 líkön séu sérsniðin að tilteknum forritum og sértækum gagnasöfnum, býður NVIDIA upp á öfluga fínstillingargetu í gegnum NVIDIA NeMo rammaverkið. NeMo Automodel safnið, sérstaklega, sameinar notendavænni innfæddrar PyTorch við fínstilltan afköst, sem gerir sérstillingarferlið aðgengilegt og skilvirkt.

Forritarar geta nýtt sér tækni eins og leiðbeinandi fínstillingu (SFT) og minnisvæna LoRA (Low-Rank Adaptation) til að framkvæma strax fínstillingu. Þetta ferli byrjar beint frá Gemma 4 líkanaskilapunktunum sem eru fáanlegir á Hugging Face, sem útilokar þörfina fyrir fyrirferðarmiklar umbreytingar. Þessi sveigjanleiki gerir fyrirtækjum og rannsakendum kleift að gefa Gemma 4 líkönum sérhæfða þekkingu á sviði, sem tryggir mikla nákvæmni og mikilvægi fyrir sérhæfð verkefni.

Gemma 4 líkön eru auðveldlega fáanleg á öllum NVIDIA gervigreindarpallinum og eru boðin undir Apache 2.0 leyfinu sem er viðskiptavænt. Þetta opna hugbúnaðarleyfi auðveldar víðtæka notkun og samþættingu í viðskiptavörur og þjónustu, sem gerir forriturum um allan heim kleift að nýsköpa með nýjustu gervigreindinni. Frá afköstum Blackwell til útbreiðslu Jetson palla, er Gemma 4 í stakk búin til að færa háþróaða gervigreind nær hverjum forritara og hverju tæki.

Algengar spurningar

What is Gemma 4 and what are its key advancements for AI deployment?
Gemma 4 represents the latest generation of multimodal and multilingual AI models from Google, designed for broad deployment across the entire NVIDIA hardware spectrum, from powerful Blackwell data centers to compact Jetson edge devices. Its key advancements include significantly improved efficiency and accuracy, making it suitable for diverse tasks like complex problem-solving, code generation, and agent tool use. These models boast rich multimodal capabilities, supporting interleaved text and images, and are pre-trained on over 140 languages. This versatility and scalability address the growing demand for local, secure, cost-efficient, and low-latency AI applications, pushing intelligence closer to the source of data and action.
How does Gemma 4 facilitate on-device and edge AI deployments, and which NVIDIA platforms support it?
Gemma 4 is specifically optimized to enable robust on-device and edge AI deployments, crucial for applications requiring low latency, enhanced privacy, and reduced operational costs. NVIDIA's comprehensive suite of client and edge systems—including RTX GPUs, DGX Spark, and Jetson devices—provides the necessary flexibility and performance. For instance, Jetson platforms support Gemma 4 E2B and E4B variants for multimodal inference on power-constrained embedded systems, while RTX GPUs offer optimized performance for local inference on desktops. Collaborations with vLLM, Ollama, llama.cpp, and Unsloth ensure efficient local deployment experiences across these diverse platforms, empowering developers to integrate advanced AI directly into their applications and devices.
What role do NVIDIA DGX Spark and NIM play in developing and deploying Gemma 4 models for enterprises?
NVIDIA DGX Spark provides a powerful platform for AI developers and enthusiasts to prototype and build secure, agentic AI workflows with Gemma 4. Featuring GB10 Grace Blackwell Superchips and 128 GB of unified memory, DGX Spark enables efficient running of even the largest Gemma 4 models with BF16 weights, maintaining private and secure on-device execution. The vLLM inference engine on DGX Spark further optimizes LLM serving for high throughput. For production deployment, NVIDIA NIM offers prepackaged and optimized microservices, providing a secure, self-hosted solution for enterprises with an NVIDIA Enterprise License. A hosted NIM API is also available in the NVIDIA API catalog for initial prototyping.
How can developers fine-tune Gemma 4 models for specific domain data, and what tools are available?
Developers can customize Gemma 4 models with their unique domain data using the NVIDIA NeMo framework, particularly the NeMo Automodel library. This powerful tool combines the ease of use of native PyTorch with optimized performance, allowing for efficient fine-tuning. Techniques such as supervised fine-tuning (SFT) and memory-efficient LoRA (Low-Rank Adaptation) can be applied directly to Gemma 4 model checkpoints available on Hugging Face, eliminating the need for cumbersome conversions. This enables day-zero fine-tuning, ensuring models are highly relevant and accurate for specialized applications and datasets, enhancing their utility across various industry verticals.
What are the commercial licensing terms for Gemma 4 models, and how accessible are they to developers?
Gemma 4 models are made highly accessible to developers and enterprises through the commercial-friendly Apache 2.0 license. This open-source license allows for broad use, modification, and distribution of the models, facilitating their integration into various commercial products and services without restrictive licensing fees. Furthermore, NVIDIA ensures wide availability across its entire AI platform, from Blackwell data centers to Jetson edge devices. Developers can get started immediately by accessing model checkpoints on Hugging Face, utilizing NVIDIA's extensive documentation and tutorials, and leveraging tools like vLLM, Ollama, and NeMo for deployment and customization, making advanced AI readily available for innovation.

Fylgstu með

Fáðu nýjustu gervigreindarfréttirnar í pósthólfið.

Deila