Code Velocity
Mifumo ya AI

Gemma 4: Kupanua AI kutoka Vituo vya Data hadi Mwisho wa Mtandao na NVIDIA

·5 dakika kusoma·NVIDIA·Chanzo asili
Shiriki
Mifumo ya NVIDIA Gemma 4 inayowezesha AI kwenye vifaa vya pembeni na vituo vya data

title: "Gemma 4: Kupanua AI kutoka Vituo vya Data hadi Mwisho wa Mtandao na NVIDIA" slug: "bringing-ai-closer-to-the-edge-and-on-device-with-gemma-4" date: "2026-04-05" lang: "sw" source: "https://developer.nvidia.com/blog/bringing-ai-closer-to-the-edge-and-on-device-with-gemma-4/" category: "Mifumo ya AI" keywords:

  • Gemma 4
  • NVIDIA
  • AI ya Pembeni
  • AI ya Kwenye Kifaa
  • AI ya Njia Nyingi
  • LLMs
  • Upelekaji wa AI
  • Blackwell
  • Jetson
  • RTX
  • vLLM
  • NeMo meta_description: "Gundua Gemma 4, mifumo ya AI ya NVIDIA ya njia nyingi na lugha nyingi iliyoundwa kwa ajili ya kupeleka kwa urahisi kutoka vituo vya data vya Blackwell hadi vifaa vya pembeni vya Jetson, ikiwezesha programu salama na zenye ucheleweshaji mdogo." image: "/images/articles/bringing-ai-closer-to-the-edge-and-on-device-with-gemma-4.png" image_alt: "Mifumo ya NVIDIA Gemma 4 inayowezesha AI kwenye vifaa vya pembeni na vituo vya data" quality_score: 94 content_score: 93 seo_score: 95 companies:
  • NVIDIA schema_type: "NewsArticle" reading_time: 5 faq:
  • question: "Gemma 4 ni nini na ni maendeleo gani muhimu inayoleta kwa upelekaji wa AI?" answer: "Gemma 4 inawakilisha kizazi kipya zaidi cha mifumo ya AI ya njia nyingi na lugha nyingi kutoka Google, iliyoundwa kwa ajili ya upelekaji mpana katika wigo mzima wa vifaa vya NVIDIA, kutoka vituo vya data vyenye nguvu vya Blackwell hadi vifaa vidogo vya pembeni vya Jetson. Maendeleo yake muhimu yanajumuisha ufanisi na usahihi ulioboreshwa sana, na kuifanya kufaa kwa kazi mbalimbali kama vile kutatua matatizo changamano, uzalishaji wa msimbo, na matumizi ya zana za wakala. Mifumo hii inajivunia uwezo tajiri wa njia nyingi, ikisaidia maandishi na picha zilizopishana, na imefunzwa awali kwa zaidi ya lugha 140. Uwezo huu mwingi na upanuaji unashughulikia mahitaji yanayoongezeka ya programu za AI za ndani, salama, zenye gharama nafuu, na zenye ucheleweshaji mdogo, zikisogeza akili karibu na chanzo cha data na hatua."
  • question: "Gemma 4 inawezeshaje upelekaji wa AI kwenye kifaa na pembeni, na ni mifumo gani ya NVIDIA inayoisaidia?" answer: "Gemma 4 imeboreshwa mahsusi kuwezesha upelekaji thabiti wa AI kwenye kifaa na pembeni, muhimu kwa programu zinazohitaji ucheleweshaji mdogo, faragha iliyoboreshwa, na gharama za uendeshaji zilizopunguzwa. Seti kamili ya mifumo ya mteja na pembeni ya NVIDIA—ikiwemo GPUs za RTX, DGX Spark, na vifaa vya Jetson—inatoa unyumbulifu na utendaji unaohitajika. Kwa mfano, mifumo ya Jetson inasaidia lahaja za Gemma 4 E2B na E4B kwa usahihi wa njia nyingi kwenye mifumo iliyopachikwa yenye mapungufu ya nishati, wakati GPUs za RTX zinatoa utendaji ulioboreshwa kwa usahihi wa ndani kwenye kompyuta za mezani. Ushirikiano na vLLM, Ollama, llama.cpp, na Unsloth unahakikisha uzoefu bora wa upelekaji wa ndani kwenye mifumo hii mbalimbali, ukiwapa waendelezaji uwezo wa kuunganisha AI ya hali ya juu moja kwa moja kwenye programu na vifaa vyao."
  • question: "NVIDIA DGX Spark na NIM zina jukumu gani katika kutengeneza na kupeleka mifumo ya Gemma 4 kwa makampuni?" answer: "NVIDIA DGX Spark inatoa jukwaa lenye nguvu kwa waendelezaji wa AI na wapenzi wa teknolojia kuunda na kujenga mtiririko wa kazi salama, za wakala wa AI na Gemma 4. Kwa kutumia GB10 Grace Blackwell Superchips na 128 GB ya kumbukumbu iliyounganishwa, DGX Spark inawezesha uendeshaji bora wa hata mifumo mikubwa zaidi ya Gemma 4 na uzito wa BF16, ikidumisha utekelezaji wa faragha na salama kwenye kifaa. Injini ya vLLM ya usahihi kwenye DGX Spark inaongeza zaidi utendaji wa LLM kwa mapato ya juu. Kwa upelekaji wa uzalishaji, NVIDIA NIM inatoa huduma ndogo ndogo zilizopakiwa na kuboreshwa, ikitoa suluhisho salama, la kujitegemea kwa makampuni yenye Leseni ya Biashara ya NVIDIA. API ya NIM iliyopangishwa pia inapatikana katika katalogi ya API ya NVIDIA kwa prototyping ya awali."
  • question: "Waendelezaji wanawezaje kuboresha mifumo ya Gemma 4 kwa data maalum ya kikoa, na ni zana gani zinazopatikana?" answer: "Waendelezaji wanaweza kuboresha mifumo ya Gemma 4 na data yao ya kipekee ya kikoa kwa kutumia mfumo wa NVIDIA NeMo, hasa maktaba ya NeMo Automodel. Zana hii yenye nguvu inachanganya urahisi wa matumizi ya PyTorch asili na utendaji ulioboreshwa, ikiruhusu uboreshaji bora. Mbinu kama vile uboreshaji unaosimamiwa (SFT) na LoRA (Low-Rank Adaptation) inayohifadhi kumbukumbu inaweza kutumika moja kwa moja kwenye sehemu za ukaguzi za mfumo wa Gemma 4 zinazopatikana kwenye Hugging Face, kuondoa hitaji la mabadiliko magumu. Hii inawezesha uboreshaji wa 'day-zero', kuhakikisha mifumo inafaa sana na sahihi kwa programu na hifadhidata maalum, ikiongeza manufaa yao katika sekta mbalimbali."
  • question: "Sheria na masharti ya leseni ya kibiashara ya mifumo ya Gemma 4 ni yapi, na yanapatikanaje kwa waendelezaji?" answer: "Mifumo ya Gemma 4 inapatikana kwa urahisi kwa waendelezaji na makampuni kupitia leseni ya Apache 2.0 inayofaa kibiashara. Leseni hii ya chanzo huru inaruhusu matumizi mapana, marekebisho, na usambazaji wa mifumo, ikiwezesha kuunganishwa kwake katika bidhaa na huduma mbalimbali za kibiashara bila ada za leseni zenye vikwazo. Zaidi ya hayo, NVIDIA inahakikisha upatikanaji mpana katika jukwaa lake lote la AI, kutoka vituo vya data vya Blackwell hadi vifaa vya pembeni vya Jetson. Waendelezaji wanaweza kuanza mara moja kwa kufikia sehemu za ukaguzi za mfumo kwenye Hugging Face, wakitumia nyaraka na mafunzo mengi ya NVIDIA, na kutumia zana kama vLLM, Ollama, na NeMo kwa upelekaji na ubinafsishaji, na kufanya AI ya hali ya juu ipatikane kwa urahisi kwa uvumbuzi."

Mandhari ya akili bandia (AI) inabadilika haraka, kukiwa na mahitaji yanayoongezeka ya kupeleka mifumo ya hali ya juu ya AI sio tu katika vituo vya data vya wingu, bali pia katika ncha kabisa za mitandao na moja kwa moja kwenye vifaa vya watumiaji. Mabadiliko haya yanatokana na hitaji la ucheleweshaji mdogo, faragha iliyoboreshwa, kupunguza gharama za uendeshaji, na uwezo wa kufanya kazi katika mazingira yenye muunganisho mdogo. Ikishughulikia mahitaji haya muhimu, NVIDIA na Google wameshirikiana kuanzisha mifumo ya hivi punde ya njia nyingi na lugha nyingi ya Gemma 4, iliyoundwa ili kupanuka kwa urahisi kutoka vituo vya data vyenye nguvu zaidi vya NVIDIA Blackwell hadi vifaa vidogo vya pembeni vya Jetson.

Mifumo hii inawakilisha hatua kubwa mbele katika ufanisi na usahihi, na kuifanya kuwa zana mbalimbali kwa kazi nyingi za kawaida za AI. Familia ya Gemma 4 iko tayari kufafanua upya jinsi AI inavyounganishwa katika programu za kila siku, ikitoa uwezo unaosukuma mipaka ya kile kinachowezekana katika upelekaji wa AI wa ndani.

Gemma 4: Kuendeleza AI ya Njia Nyingi na Lugha Nyingi

Ulimwengu wa Gemmaverse umepanuka kwa kuanzishwa kwa mifumo minne mpya ya Gemma 4, kila moja ikiwa imeundwa na hali maalum za upelekaji akilini huku ikitoa seti thabiti ya uwezo. Mifumo hii si tu kuhusu ukubwa; ni kuhusu muundo wa akili, ikitoa utendaji thabiti katika changamoto mbalimbali za AI.

Uwezo mkuu wa mifumo ya Gemma 4 unajumuisha:

  • Hoja: Utendaji wa kipekee katika kazi ngumu za kutatua matatizo, kuwezesha kufanya maamuzi ya kisasa zaidi.
  • Usimbaji: Vipengele vya juu vya uzalishaji wa msimbo na utatuzi wa hitilafu, kurahisisha mtiririko wa kazi za msanidi programu.
  • Mawakala: Msaada asilia kwa matumizi ya zana yaliyopangwa, kuwezesha uundaji wa mifumo ya AI yenye nguvu ya wakala.
  • Uwezo wa Kuona, Sauti, na Video: Mwingiliano tajiri wa njia nyingi kwa matumizi kama vile utambuzi wa kitu, utambuzi otomatiki wa hotuba (ASR), hati, na akili ya video.
  • Ingizo la Njia Nyingi Lililopishana: Uwezo wa kuchanganya maandishi na picha kwa uhuru ndani ya kidokezo kimoja, kutoa mwingiliano wa asili zaidi na wa kina.
  • Msaada wa Lugha Nyingi: Msaada wa nje ya sanduku kwa zaidi ya lugha 35, na mafunzo ya awali katika zaidi ya lugha 140, ikipanua upatikanaji wa kimataifa.

Familia ya Gemma 4 inajumuisha mfumo wa kwanza wa Mchanganyiko wa Wataalam (MoE) katika mfululizo wa Gemma, ulioboreshwa kwa ufanisi. Kwa kushangaza, mifumo yote minne inaweza kutoshea kwenye GPU moja ya NVIDIA H100, ikionyesha muundo wao ulioboreshwa. Lahaja za 31B na 26B A4B ni mifumo ya hoja yenye utendaji wa juu inayofaa kwa mazingira ya ndani na ya vituo vya data, wakati mifumo ya E4B na E2B imebuniwa mahsusi kwa programu za kwenye kifaa na za simu, ikijengwa juu ya urithi wa Gemma 3n.

Jina la MfumoAina ya UsanifuJumla ya VigezoVigezo Vinavyotumika au MadhubutiUrefu wa Muktadha wa Kuingiza (Ishara)Dirisha Linalosonga (Ishara)Aina za Modali
Gemma-4-31BDense Transformer31B256K1024Maandishi
Gemma-4-26B-A4BMoE – Wataalam 12826B3.8B256KMaandishi
Gemma-4-E4BDense Transformer7.9B na viambatanisho4.5B madhubuti128K512Maandishi, Sauti, Kuona, Video
Gemma-4-E2BDense Transformer5.1B na viambatanisho2.3B madhubuti128K512Maandishi, Sauti, Kuona, Video

Jedwali 1. Muhtasari wa familia ya mifumo ya Gemma 4, ikifupisha aina za usanifu, ukubwa wa vigezo, vigezo madhubuti, urefu wa muktadha unaotumika, na aina za modali zinazopatikana kusaidia waendelezaji kuchagua mfumo sahihi kwa vituo vya data, pembeni, na upelekaji kwenye kifaa.

Mifumo hii inapatikana kwenye Hugging Face na sehemu za ukaguzi za BF16. Kwa waendelezaji wanaotumia GPUs za NVIDIA Blackwell, sehemu ya ukaguzi ya NVFP4 iliyopangwa kwa Gemma-4-31B inapatikana kupitia NVIDIA Model Optimizer kwa matumizi na vLLM. Usahihi wa NVFP4 unadumisha usahihi karibu sawa na usahihi wa biti 8 huku ukiboresha sana utendaji kwa wati na kupunguza gharama kwa tokeni, muhimu kwa upelekaji mkubwa.

Kuleta AI Kwenye Pembeni: Upelekaji Kwenye Kifaa na Vifaa vya NVIDIA

Kadri mitiririko ya kazi ya AI na mawakala inavyozidi kuwa muhimu kwa shughuli za kila siku, uwezo wa kuendesha mifumo hii zaidi ya mazingira ya kawaida ya vituo vya data ni muhimu sana. NVIDIA inatoa mfumo kamili wa mifumo ya mteja na pembeni, kutoka gpus zenye nguvu kama GPUs za RTX hadi vifaa maalum vya Jetson na DGX Spark, ikiwapa waendelezaji unyumbulifu unaohitajika kuboresha gharama, ucheleweshaji, na usalama.

NVIDIA imeshirikiana na mifumo inayoongoza ya usahihi kama vLLM, Ollama, na llama.cpp ili kuhakikisha uzoefu bora wa upelekaji wa ndani kwa mifumo ya Gemma 4. Kwa kuongezea, Unsloth inatoa msaada wa siku ya kwanza na mifumo iliyoboreshwa na iliyopangwa, ikiwezesha upelekaji bora wa ndani kupitia Unsloth Studio. Mfumo huu thabiti wa usaidizi unawapa waendelezaji uwezo wa kupeleka AI ya kisasa moja kwa moja pale inapohitajika zaidi.

DGX SparkJetsonRTX / RTX PRO
Kesi ya MatumiziUtafiti wa AI na uundaji wa prototipiAI ya Pembeni na robotikiProgramu za Kompyuta na ukuzaji wa Windows
Vivutio MuhimuStack ya programu ya NVIDIA AI iliyosanikishwa awali na GB 128 ya kumbukumbu iliyounganishwa inawezesha uundaji wa prototipi wa ndani, uboreshaji, na mtiririko kamili wa kazi wa OpenClawUcheleweshaji karibu sifuri kutokana na vipengele vya usanifu kama vile upakiaji wa vigezo vya masharti na viambatanisho vya kila safu ambavyo vinaweza kuhifadhiwa kwa matumizi ya haraka na kupunguzwa kwa kumbukumbu ( maelezo zaidi)Utendaji ulioboreshwa kwa usahihi wa ndani kwa wapenzi, waumbaji, na wataalamu
Mwongozo wa KuanzaVitabu vya kucheza vya DGX Spark kwa vLLM, Ollama, Unsloth, na miongozo ya upelekaji wa llama.cpp
NeMo Automodel kwa mwongozo wa uboreshaji kwenye Spark
Jetson AI Lab kwa mafunzo na kontena maalum za GemmaRTX AI Garage kwa miongozo ya Ollama na llama.cpp. Wamiliki wa RTX Pro wanaweza kutumia vLLM pia.

Jedwali 2. Ulinganisho wa chaguzi za upelekaji wa ndani katika mifumo ya NVIDIA, ikionyesha kesi za matumizi ya msingi, uwezo muhimu, na rasilimali zinazopendekezwa za kuanzia kwa mifumo ya DGX Spark, Jetson, na RTX / RTX PRO inayoendesha mifumo ya Gemma 4.

Kujenga Mitiririko ya Kazi Salama ya Wakala na Upelekaji Tayari kwa Biashara

Kwa waendelezaji wa AI na wapenzi wa teknolojia, NVIDIA DGX Spark, iliyo na GB10 Grace Blackwell Superchip na GB 128 ya kumbukumbu iliyounganishwa, inatoa rasilimali zisizo na kifani. Jukwaa hili thabiti linafaa kwa kuendesha mfumo wa Gemma 4 31B na uzito wa BF16, kuwezesha uundaji bora wa prototipi na ujenzi wa mitiririko ya kazi tata ya wakala wa AI huku ikihakikisha utekelezaji wa faragha na salama kwenye kifaa. Mfumo wa uendeshaji wa DGX Linux OS na stack kamili ya programu ya NVIDIA hutoa mazingira ya ukuzaji yasiyo na mshono.

Injini ya vLLM ya usahihi, iliyoundwa kwa ajili ya huduma za LLM zenye ufanisi mkubwa, huongeza ufanisi na kupunguza matumizi ya kumbukumbu kwenye DGX Spark. Mchanganyiko huu hutoa jukwaa la utendaji wa juu kwa kupeleka mifumo mikubwa zaidi ya Gemma 4. Waendelezaji wanaweza kutumia kitabu cha kucheza cha vLLM for Inference DGX Spark au kuanza na Ollama au llama.cpp. Zaidi ya hayo, NeMo Automodel inaruhusu uboreshaji wa mifumo hii moja kwa moja kwenye DGX Spark.

Kwa watumiaji wa biashara, NVIDIA NIM inatoa njia ya kuelekea upelekaji tayari kwa uzalishaji. Waendelezaji wanaweza kujenga prototipi ya Gemma 4 31B wakitumia API ya NIM iliyopangishwa na NVIDIA kutoka katalogi ya API ya NVIDIA. Kwa uzalishaji kamili, huduma ndogo ndogo za NIM zilizopakiwa na kuboreshwa zinapatikana kwa upelekaji salama, wa kujitegemea, unaoungwa mkono na Leseni ya Biashara ya NVIDIA. Hii inahakikisha kuwa biashara zinaweza kupeleka suluhisho zenye nguvu za AI kwa ujasiri, zikikidhi mahitaji madhubuti ya usalama na uendeshaji.

Kuwezesha Mawakala wa Kimwili wa AI na NVIDIA Jetson

Uwezo wa mawakala wa kisasa wa AI ya kimwili unaendelea kwa kasi, kwa kiasi kikubwa kutokana na mifumo ya Gemma 4 kuunganisha sauti ya kisasa, utambuzi wa njia nyingi, na hoja za kina. Mifumo hii ya hali ya juu inawezesha mifumo ya robotiki kusonga zaidi ya utekelezaji rahisi wa kazi, ikiwapa uwezo wa kuelewa hotuba, kutafsiri muktadha wa kuona, na kufikiria kwa akili kabla ya kutenda.

Kwenye mifumo ya NVIDIA Jetson, waendelezaji wanaweza kufanya usahihi wa Gemma 4 kwenye pembeni kwa kutumia llama.cpp na vLLM. Jetson Orin Nano, kwa mfano, inasaidia lahaja za Gemma 4 E2B na E4B, ikiwezesha usahihi wa njia nyingi kwenye mifumo midogo, iliyopachikwa, na yenye mapungufu ya nishati. Uwezo huu wa kupanua unaenea katika jukwaa lote la Jetson, hadi Jetson Thor yenye nguvu, ikiruhusu upelekaji thabiti wa mfumo bila kujali ukubwa wa vifaa. Hii ni muhimu kwa programu za robotiki, mashine janja, na otomatiki ya viwandani ambapo utendaji wa ucheleweshaji mdogo na akili ya kwenye kifaa ni muhimu sana. Waendelezaji wanaopenda kuchunguza uwezo huu wanaweza kupata mafunzo na kontena maalum za Gemma kwenye Jetson AI Lab.

Ubinafsishaji na Upatikanaji wa Kibiashara na NVIDIA NeMo

Ili kuhakikisha kuwa mifumo ya Gemma 4 inaweza kuboreshwa kwa programu maalum na hifadhidata za umiliki, NVIDIA inatoa uwezo thabiti wa kuboresha kupitia mfumo wa NVIDIA NeMo. Maktaba ya NeMo Automodel, hasa, inachanganya urahisi wa matumizi ya PyTorch asili na utendaji ulioboreshwa, na kufanya mchakato wa ubinafsishaji kuwa rahisi na ufanisi.

Waendelezaji wanaweza kutumia mbinu kama vile uboreshaji unaosimamiwa (SFT) na LoRA (Low-Rank Adaptation) inayohifadhi kumbukumbu kufanya uboreshaji wa 'day-zero'. Mchakato huu unaanza moja kwa moja kutoka sehemu za ukaguzi za mfumo wa Gemma 4 zinazopatikana kwenye Hugging Face, kuondoa hitaji la hatua za ubadilishaji magumu. Unyumbulifu huu unaruhusu biashara na watafiti kuingiza mifumo ya Gemma 4 na maarifa maalum ya kikoa, kuhakikisha usahihi wa hali ya juu na umuhimu kwa kazi maalum.

Mifumo ya Gemma 4 inapatikana kwa urahisi katika jukwaa lote la NVIDIA AI na inatolewa chini ya leseni ya Apache 2.0 inayofaa kibiashara. Leseni hii ya chanzo huru inawezesha kuasili na kuunganishwa kwa upana katika bidhaa na huduma za kibiashara, ikiwapa waendelezaji ulimwenguni kote uwezo wa kuvumbua na AI ya kisasa. Kutoka utendaji wa Blackwell hadi upatikanaji wa mifumo ya Jetson, Gemma 4 iko tayari kuleta AI ya hali ya juu karibu na kila msanidi programu na kila kifaa.

Maswali Yanayoulizwa Mara kwa Mara

What is Gemma 4 and what are its key advancements for AI deployment?
Gemma 4 represents the latest generation of multimodal and multilingual AI models from Google, designed for broad deployment across the entire NVIDIA hardware spectrum, from powerful Blackwell data centers to compact Jetson edge devices. Its key advancements include significantly improved efficiency and accuracy, making it suitable for diverse tasks like complex problem-solving, code generation, and agent tool use. These models boast rich multimodal capabilities, supporting interleaved text and images, and are pre-trained on over 140 languages. This versatility and scalability address the growing demand for local, secure, cost-efficient, and low-latency AI applications, pushing intelligence closer to the source of data and action.
How does Gemma 4 facilitate on-device and edge AI deployments, and which NVIDIA platforms support it?
Gemma 4 is specifically optimized to enable robust on-device and edge AI deployments, crucial for applications requiring low latency, enhanced privacy, and reduced operational costs. NVIDIA's comprehensive suite of client and edge systems—including RTX GPUs, DGX Spark, and Jetson devices—provides the necessary flexibility and performance. For instance, Jetson platforms support Gemma 4 E2B and E4B variants for multimodal inference on power-constrained embedded systems, while RTX GPUs offer optimized performance for local inference on desktops. Collaborations with vLLM, Ollama, llama.cpp, and Unsloth ensure efficient local deployment experiences across these diverse platforms, empowering developers to integrate advanced AI directly into their applications and devices.
What role do NVIDIA DGX Spark and NIM play in developing and deploying Gemma 4 models for enterprises?
NVIDIA DGX Spark provides a powerful platform for AI developers and enthusiasts to prototype and build secure, agentic AI workflows with Gemma 4. Featuring GB10 Grace Blackwell Superchips and 128 GB of unified memory, DGX Spark enables efficient running of even the largest Gemma 4 models with BF16 weights, maintaining private and secure on-device execution. The vLLM inference engine on DGX Spark further optimizes LLM serving for high throughput. For production deployment, NVIDIA NIM offers prepackaged and optimized microservices, providing a secure, self-hosted solution for enterprises with an NVIDIA Enterprise License. A hosted NIM API is also available in the NVIDIA API catalog for initial prototyping.
How can developers fine-tune Gemma 4 models for specific domain data, and what tools are available?
Developers can customize Gemma 4 models with their unique domain data using the NVIDIA NeMo framework, particularly the NeMo Automodel library. This powerful tool combines the ease of use of native PyTorch with optimized performance, allowing for efficient fine-tuning. Techniques such as supervised fine-tuning (SFT) and memory-efficient LoRA (Low-Rank Adaptation) can be applied directly to Gemma 4 model checkpoints available on Hugging Face, eliminating the need for cumbersome conversions. This enables day-zero fine-tuning, ensuring models are highly relevant and accurate for specialized applications and datasets, enhancing their utility across various industry verticals.
What are the commercial licensing terms for Gemma 4 models, and how accessible are they to developers?
Gemma 4 models are made highly accessible to developers and enterprises through the commercial-friendly Apache 2.0 license. This open-source license allows for broad use, modification, and distribution of the models, facilitating their integration into various commercial products and services without restrictive licensing fees. Furthermore, NVIDIA ensures wide availability across its entire AI platform, from Blackwell data centers to Jetson edge devices. Developers can get started immediately by accessing model checkpoints on Hugging Face, utilizing NVIDIA's extensive documentation and tutorials, and leveraging tools like vLLM, Ollama, and NeMo for deployment and customization, making advanced AI readily available for innovation.

Baki na Habari

Pokea habari za hivi karibuni za AI kwenye barua pepe yako.

Shiriki