Landslag gervigreindar er í örri þróun, með vaxandi eftirspurn eftir því að innleiða háþróuð gervigreindarlíkön ekki aðeins í skýjagagnaverum, heldur einnig á jaðri netkerfa og beint á tækjum notenda. Þessi breyting knýr fram þörf fyrir minni leynd, aukna persónuvernd, minni rekstrarkostnað og getu til að starfa í umhverfi með takmarkaða tengingu. Til að mæta þessum mikilvægu kröfum hafa NVIDIA og Google unnið saman að því að kynna nýjustu Gemma 4 fjölstilltu og fjöltyngdu líkönin, hönnuð til að skalast hnökralaust frá öflugustu NVIDIA Blackwell gagnaverunum niður í smá Jetson jaðartæki.
Þessi líkön tákna verulegt stökk í skilvirkni og nákvæmni, sem gerir þau að fjölhæfum verkfærum fyrir fjölbreytt úrval algengra gervigreindarverkefna. Gemma 4 fjölskyldan er í stakk búin til að endurskilgreina hvernig gervigreind er samþætt í dagleg forrit, og býður upp á eiginleika sem ýta undir mörk þess sem mögulegt er í staðbundinni innleiðingu gervigreindar.
Gemma 4: Að efla fjölstillta og fjöltyngda gervigreind
Gemmaverse hefur stækkað með kynningu á fjórum nýjum Gemma 4 líkönum, hvert um sig hannað með ákveðnar innleiðingaraðstæður í huga, en býður upp á öflugt sett af eiginleikum. Þessi líkön snúast ekki bara um stærð; þau snúast um snjalla hönnun sem skilar sterkum árangri í fjölbreyttum gervigreindaráskorunum.
Helstu eiginleikar Gemma 4 líkananna eru:
- Röksemdafærsla: Framúrskarandi árangur í flóknum vandamálalausnarverkefnum, sem gerir kleift að taka flóknari ákvarðanir.
- Kóðun: Háþróuð kóðagerð og villuleitarvirkni, sem einfaldar verkflæði forritara.
- Umboðsmenn: Innfæddur stuðningur við skipulagða verkfærnotkun, sem auðveldar gerð öflugra umboðsmannastýrðra gervigreindarkerfa.
- Sjón, hljóð og myndbandsgeta: Rík fjölstillt samskipti fyrir notkunartilvik eins og hlutgreiningu, sjálfvirka talgreiningu (ASR), skjala- og myndbandsgreind.
- Samtvinnuð fjölstillt innskot: Geta til að blanda frjálslega texta og myndum innan einnar fyrirspurnar, sem býður upp á náttúrulegri og ítarlegri samskipti.
- Fjöltyngdur stuðningur: Innfæddur stuðningur við yfir 35 tungumál, með forþjálfun á yfir 140 tungumálum, sem eykur aðgengi á heimsvísu.
Gemma 4 fjölskyldan inniheldur fyrsta Mixture-of-Experts (MoE) líkanið í Gemma seríunni, fínstillt fyrir skilvirkni. Athyglisvert er að öll fjögur líkönin geta passað á eitt NVIDIA H100 GPU-kort, sem sýnir fínstillta hönnun þeirra. 31B og 26B A4B afbrigðin eru afkastamikil röksemdarlíkön sem henta bæði fyrir staðbundin og gagnaverumhverfi, á meðan E4B og E2B líkönin eru sérsniðin fyrir forrit á tækjum og farsímum, byggð á arfleifð Gemma 3n.
| Líkananafn | Gerð arkitektúrs | Heildarfæribreytur | Virkir eða raunvirkar færibreytur | Lengd inntaks samhengis (tákn) | Renndur gluggi (tákn) | Stillingar |
|---|---|---|---|---|---|---|
| Gemma-4-31B | Þéttur spennir | 31B | — | 256K | 1024 | Texti |
| Gemma-4-26B-A4B | MoE – 128 Sérfræðingar | 26B | 3.8B | 256K | — | Texti |
| Gemma-4-E4B | Þéttur spennir | 7.9B með innfellingum | 4.5B virkar | 128K | 512 | Texti, hljóð, sjón, myndband |
| Gemma-4-E2B | Þéttur spennir | 5.1B með innfellingum | 2.3B virkar | 128K | 512 | Texti, hljóð, sjón, myndband |
Tafla 1. Yfirlit yfir Gemma 4 líkanafjölskylduna, sem dregur saman arkitektúrgerðir, stærð færibreyta, virkar færibreytur, studdar samhengislengdir og tiltækar stillingar til að hjálpa forriturum að velja rétta líkanið fyrir gagnaver, jaðar og innleiðingu á tækjum.
Þessi líkön eru fáanleg á Hugging Face með BF16 skilapunktum. Fyrir forritara sem nýta sér NVIDIA Blackwell GPU-kort er NVFP4 magnbundinn skilapunktur fyrir Gemma-4-31B fáanlegur í gegnum NVIDIA Model Optimizer til notkunar með vLLM. NVFP4 nákvæmni heldur nánast sömu nákvæmni og 8-bita nákvæmni en bætir verulega afköst á hvert watt og lækkar kostnað á tákn, sem er mikilvægt fyrir innleiðingu á stórum skala.
Að færa gervigreind til jaðarins: Innleiðing á tækjum með NVIDIA vélbúnaði
Eftir því sem gervigreindarverkflæði og umboðsmenn verða sífellt mikilvægari í daglegum rekstri er getan til að keyra þessi líkön utan hefðbundinna gagnaverumhverfa afar mikilvæg. NVIDIA býður upp á alhliða vistkerfi biðlara- og jaðarkerfa, frá öflugum GPU-kortum eins og RTX GPU-kortum til sérhæfðra Jetson tækja og DGX Spark, sem veitir forriturum þann sveigjanleika sem þarf til að fínstilla kostnað, leynd og öryggi.
NVIDIA hefur unnið með leiðandi ályktunarrammaverkum eins og vLLM, Ollama og llama.cpp til að tryggja bestu staðbundnu innleiðingarreynsluna fyrir Gemma 4 líkön. Að auki veitir Unsloth strax stuðning með fínstilltum og magnbundnum líkönum, sem gerir skilvirka staðbundna innleiðingu kleift í gegnum Unsloth Studio. Þetta öfluga stuðningskerfi gerir forriturum kleift að innleiða háþróaða gervigreind beint þar sem hennar er mest þörf.
| DGX Spark | Jetson | RTX / RTX PRO | |
|---|---|---|---|
| Notkunartilvik | Gervigreindarannsóknir og frumgerðagerð | Útjaðar-gervigreind og vélfærafræði | Skjáborðsforrit og Windows þróun |
| Helstu hápunktar | Foruppsettur NVIDIA gervigreindarhugbúnaðarstafla og 128 GB af sameinuðu minni knýja staðbundna frumgerðagerð, fínstillingu og fullkomlega staðbundin OpenClaw verkflæði | Nálægt núll leynd vegna arkitektúreiginleika eins og skilyrtra færibreytuhleðslu og innfellinga á hverju lagi sem hægt er að geyma í skyndiminni fyrir hraðari og minni minnisnotkun ( frekari upplýsingar) | Fínstillt afköst fyrir staðbundna ályktun fyrir áhugamenn, skapara og fagmenn |
| Leiðbeiningar fyrir byrjendur | DGX Spark handbækur fyrir vLLM, Ollama, Unsloth og llama.cpp innleiðingarleiðbeiningar NeMo Automodel fyrir fínstillingu á Spark leiðbeiningar | Jetson AI Lab fyrir kennsluefni og sérsniðna Gemma gáma | RTX AI Garage fyrir Ollama og llama.cpp leiðbeiningar. RTX Pro eigendur geta einnig notað vLLM. |
Tafla 2. Samanburður á staðbundnum innleiðingarvalkostum á NVIDIA pöllum, sem leggur áherslu á helstu notkunartilvik, eiginleika og ráðlagðar upphafsauðlindir fyrir DGX Spark, Jetson og RTX / RTX PRO kerfi sem keyra Gemma 4 líkön.
Að byggja örugg umboðsmannastýrð verkflæði og innleiðingar tilbúnar fyrir fyrirtæki
Fyrir gervigreindarforritara og áhugamenn býður NVIDIA DGX Spark, með GB10 Grace Blackwell Superchip og 128 GB af sameinuðu minni, upp á óviðjafnanlegar auðlindir. Þessi öflugi vettvangur er tilvalinn til að keyra Gemma 4 31B líkanið með BF16 vigtum, sem gerir skilvirka frumgerðagerð og byggingu flókinna umboðsmannastýrðra gervigreindarverkflæða kleift, á sama tíma og einka- og örugg framkvæmd á tækinu er tryggð. DGX Linux stýrikerfið og fullur NVIDIA hugbúnaðarstaflinn veita hnökralaust þróunarumhverfi.
vLLM ályktunarvélin, hönnuð fyrir mikla afköst LLM þjónustu, hámarkar skilvirkni og lágmarkar minnisnotkun á DGX Spark. Þessi samsetning veitir afkastamikinn vettvang til að innleiða stærstu Gemma 4 líkönin. Forritarar geta nýtt sér vLLM fyrir ályktunar DGX Spark handbókina eða byrjað með Ollama eða llama.cpp. Ennfremur gerir NeMo Automodel kleift að fínstilla þessi líkön beint á DGX Spark.
Fyrir fyrirtækjanotendur býður NVIDIA NIM upp á leið til framleiðslutilbúinnar innleiðingar. Forritarar geta frumgera Gemma 4 31B með því að nota NVIDIA-hýst NIM API úr NVIDIA API vörulistanum. Fyrir fulla framleiðslu eru forpakkaðar og fínstilltar NIM örþjónustur fáanlegar fyrir örugga, sjálfshýsta innleiðingu, studd af NVIDIA fyrirtækisleyfi. Þetta tryggir að fyrirtæki geti innleitt öflugar gervigreindarlausnir með sjálfstrausti, og uppfyllt strangar öryggis- og rekstrarkröfur.
Að styrkja líkamlega gervigreindarumboðsmenn með NVIDIA Jetson
Getu nútíma líkamlegra gervigreindarumboðsmanna er í örri þróun, að mestu leyti vegna Gemma 4 líkana sem samþætta háþróaða hljóð-, fjölstillta skynjun og djúpa röksemdafærslu. Þessi háþróuðu líkön gera vélfærakerfum kleift að fara út fyrir einfalda framkvæmd verkefna, veita þeim getu til að skilja tal, túlka sjónrænt samhengi og röksemdafæra á snjallan hátt áður en þau bregðast við.
Á NVIDIA Jetson pöllum geta forritarar framkvæmt Gemma 4 ályktun á jaðrinum með því að nota llama.cpp og vLLM. Jetson Orin Nano, til dæmis, styður Gemma 4 E2B og E4B afbrigði, sem auðveldar fjölstillta ályktun á litlum, innbyggðum og orkutakmörkuðum kerfum. Þessi stigunargeta nær yfir allan Jetson pallinn, upp að hinum öfluga Jetson Thor, sem gerir kleift að innleiða líkön á stöðugan hátt óháð vélbúnaðarfótspori. Þetta er mikilvægt fyrir forrit í vélfærafræði, snjallvélum og iðnaðarsjálfvirkni þar sem lágleyndar afköst og greind á tækinu eru afar mikilvæg. Forritarar sem hafa áhuga á að kanna þessa eiginleika geta fundið kennsluefni og sérsniðna Gemma gáma á Jetson AI Lab.
Sérstilling og viðskiptaaðgengi með NVIDIA NeMo
Til að tryggja að Gemma 4 líkön séu sérsniðin að tilteknum forritum og sértækum gagnasöfnum, býður NVIDIA upp á öfluga fínstillingargetu í gegnum NVIDIA NeMo rammaverkið. NeMo Automodel safnið, sérstaklega, sameinar notendavænni innfæddrar PyTorch við fínstilltan afköst, sem gerir sérstillingarferlið aðgengilegt og skilvirkt.
Forritarar geta nýtt sér tækni eins og leiðbeinandi fínstillingu (SFT) og minnisvæna LoRA (Low-Rank Adaptation) til að framkvæma strax fínstillingu. Þetta ferli byrjar beint frá Gemma 4 líkanaskilapunktunum sem eru fáanlegir á Hugging Face, sem útilokar þörfina fyrir fyrirferðarmiklar umbreytingar. Þessi sveigjanleiki gerir fyrirtækjum og rannsakendum kleift að gefa Gemma 4 líkönum sérhæfða þekkingu á sviði, sem tryggir mikla nákvæmni og mikilvægi fyrir sérhæfð verkefni.
Gemma 4 líkön eru auðveldlega fáanleg á öllum NVIDIA gervigreindarpallinum og eru boðin undir Apache 2.0 leyfinu sem er viðskiptavænt. Þetta opna hugbúnaðarleyfi auðveldar víðtæka notkun og samþættingu í viðskiptavörur og þjónustu, sem gerir forriturum um allan heim kleift að nýsköpa með nýjustu gervigreindinni. Frá afköstum Blackwell til útbreiðslu Jetson palla, er Gemma 4 í stakk búin til að færa háþróaða gervigreind nær hverjum forritara og hverju tæki.
Upprunaleg heimild
https://developer.nvidia.com/blog/bringing-ai-closer-to-the-edge-and-on-device-with-gemma-4/Algengar spurningar
What is Gemma 4 and what are its key advancements for AI deployment?
How does Gemma 4 facilitate on-device and edge AI deployments, and which NVIDIA platforms support it?
What role do NVIDIA DGX Spark and NIM play in developing and deploying Gemma 4 models for enterprises?
How can developers fine-tune Gemma 4 models for specific domain data, and what tools are available?
What are the commercial licensing terms for Gemma 4 models, and how accessible are they to developers?
Fylgstu með
Fáðu nýjustu gervigreindarfréttirnar í pósthólfið.
