Code Velocity
AI மாதிரிகள்

Gemma 4: NVIDIA உடன் தரவு மையத்திலிருந்து எட்ஜ் வரை AI-ஐ அளவிடுதல்

·5 நிமிட வாசிப்பு·NVIDIA·அசல் மூலம்
பகிர்
NVIDIA Gemma 4 மாதிரிகள் எட்ஜ் சாதனங்கள் மற்றும் தரவு மையங்களில் AI-ஐ செயல்படுத்துகின்றன

AI-இன் நிலப்பரப்பு வேகமாக வளர்ந்து வருகிறது, மேலும் மேம்பட்ட AI மாதிரிகளை கிளவுட் தரவு மையங்களில் மட்டுமல்லாமல், நெட்வொர்க்குகளின் மிக முக்கிய எட்ஜ் பகுதிகளிலும், பயனர் சாதனங்களிலும் நேரடியாக வரிசைப்படுத்த வேண்டிய தேவை அதிகரித்து வருகிறது. இந்த மாற்றம் குறைந்த தாமதம், மேம்பட்ட தனியுரிமை, குறைக்கப்பட்ட செயல்பாட்டுச் செலவுகள் மற்றும் வரையறுக்கப்பட்ட இணைப்புடன் கூடிய சூழல்களில் செயல்படும் திறன் ஆகியவற்றின் தேவையால் உந்தப்படுகிறது. இந்த முக்கிய தேவைகளை நிவர்த்தி செய்ய, NVIDIA மற்றும் Google இணைந்து சமீபத்திய Gemma 4 பல்வகை மற்றும் பன்மொழி மாதிரிகளை அறிமுகப்படுத்தியுள்ளன, இவை மிகவும் சக்திவாய்ந்த NVIDIA Blackwell தரவு மையங்களிலிருந்து சிறிய Jetson எட்ஜ் சாதனங்கள் வரை தடையின்றி அளவிடுவதற்கு வடிவமைக்கப்பட்டுள்ளன.

இந்த மாதிரிகள் செயல்திறன் மற்றும் துல்லியத்தில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கின்றன, அவை பலதரப்பட்ட பொதுவான AI பணிகளுக்கு பல்துறை கருவிகளாக அமைகின்றன. Gemma 4 குடும்பம் AI அன்றாட பயன்பாடுகளில் எவ்வாறு ஒருங்கிணைக்கப்படுகிறது என்பதை மறுவரையறை செய்யத் தயாராக உள்ளது, உள்ளூர் AI வரிசைப்படுத்தலில் சாத்தியமானவற்றின் எல்லைகளைத் தள்ளும் திறன்களை வழங்குகிறது.

Gemma 4: பல்வகை மற்றும் பன்மொழி AI-ஐ மேம்படுத்துதல்

நான்கு புதிய Gemma 4 மாதிரிகளின் அறிமுகத்துடன் Gemmaverse விரிவடைந்துள்ளது, ஒவ்வொன்றும் குறிப்பிட்ட வரிசைப்படுத்தல் சூழ்நிலைகளை மனதில் கொண்டு வடிவமைக்கப்பட்டுள்ளன, அதே நேரத்தில் ஒரு வலுவான திறன்களின் தொகுப்பை வழங்குகின்றன. இந்த மாதிரிகள் அளவைப் பற்றியது மட்டுமல்ல; அவை புத்திசாலித்தனமான வடிவமைப்பு பற்றியது, பல்வேறு AI சவால்களில் வலுவான செயல்திறனை வழங்குகின்றன.

Gemma 4 மாதிரிகளின் முக்கிய திறன்கள் பின்வருமாறு:

  • காரணப்படுத்துதல்: சிக்கலான சிக்கல் தீர்க்கும் பணிகளில் விதிவிலக்கான செயல்திறன், மிகவும் அதிநவீன முடிவெடுக்கும் திறனை செயல்படுத்துகிறது.
  • குறியிடுதல்: மேம்பட்ட குறியீடு உருவாக்கம் மற்றும் பிழைத்திருத்த அம்சங்கள், டெவலப்பர் பணிப்பாய்வுகளை சீராக்குகின்றன.
  • முகவர்கள்: கட்டமைக்கப்பட்ட கருவி பயன்பாட்டிற்கான உள்ளூர் ஆதரவு, சக்திவாய்ந்த முகவர் AI அமைப்புகளை உருவாக்குவதற்கு உதவுகிறது.
  • பார்வை, ஆடியோ மற்றும் வீடியோ திறன்: பொருள் அங்கீகாரம், தானியங்கி பேச்சு அங்கீகாரம் (ASR), ஆவணம் மற்றும் வீடியோ நுண்ணறிவு போன்ற பயன்பாட்டு நிகழ்வுகளுக்கு செழுமையான பல்வகை தொடர்புகள்.
  • இடைச்செருகப்பட்ட பல்வகை உள்ளீடு: ஒரு ஒற்றை தூண்டுதலுக்குள் உரை மற்றும் படங்களை சுதந்திரமாக கலக்கும் திறன், மிகவும் இயற்கையான மற்றும் விரிவான தொடர்புகளை வழங்குகிறது.
  • பன்மொழி ஆதரவு: 35-க்கும் மேற்பட்ட மொழிகளுக்கான உடனடி ஆதரவு, 140-க்கும் மேற்பட்ட மொழிகளில் முன்பயிற்சி மூலம் உலகளாவிய அணுகலை விரிவுபடுத்துகிறது.

Gemma 4 குடும்பத்தில் Gemma தொடரில் முதல் Mixture-of-Experts (MoE) மாதிரி அடங்கும், இது செயல்திறனுக்காக மேம்படுத்தப்பட்டுள்ளது. குறிப்பிடத்தக்க வகையில், நான்கு மாதிரிகளும் ஒரு ஒற்றை NVIDIA H100 GPU-ல் பொருந்தும், இது அவற்றின் மேம்படுத்தப்பட்ட வடிவமைப்பைக் காட்டுகிறது. 31B மற்றும் 26B A4B வகைகள் உள்ளூர் மற்றும் தரவு மைய சூழல்கள் இரண்டிற்கும் ஏற்ற உயர்-செயல்திறன் கொண்ட காரணப்படுத்துதல் மாதிரிகள் ஆகும், அதேசமயம் E4B மற்றும் E2B மாதிரிகள் Gemma 3n இன் பாரம்பரியத்தின் அடிப்படையில் சாதனத்தில் மற்றும் மொபைல் பயன்பாடுகளுக்காக சிறப்பாக வடிவமைக்கப்பட்டுள்ளன.

மாடல் பெயர்கட்டமைப்பு வகைமொத்த அளவுருக்கள்செயலில் உள்ள அல்லது பயனுள்ள அளவுருக்கள்உள்ளீட்டு சூழல் நீளம் (டோக்கன்கள்)நகரும் சாளரம் (டோக்கன்கள்)முறைகள்
Gemma-4-31BDense Transformer31B256K1024Text
Gemma-4-26B-A4BMoE – 128 Experts26B3.8B256KText
Gemma-4-E4BDense Transformer7.9B with embeddings4.5B effective128K512Text, Audio, Vision, Video
Gemma-4-E2BDense Transformer5.1B with embeddings2.3B effective128K512Text, Audio, Vision, Video

அட்டவணை 1. Gemma 4 மாதிரி குடும்பத்தின் மேலோட்டம், கட்டமைப்பு வகைகள், அளவுரு அளவுகள், பயனுள்ள அளவுருக்கள், ஆதரிக்கப்படும் சூழல் நீளங்கள் மற்றும் கிடைக்கக்கூடிய முறைகளை சுருக்கமாகக் கூறுகிறது, இது தரவு மையம், எட்ஜ் மற்றும் சாதனத்தில் வரிசைப்படுத்தல்களுக்கு சரியான மாதிரியைத் தேர்வுசெய்ய டெவலப்பர்களுக்கு உதவுகிறது.

இந்த மாதிரிகள் Hugging Face-ல் BF16 சரிபார்ப்புப் புள்ளிகளுடன் கிடைக்கின்றன. NVIDIA Blackwell GPU-களைப் பயன்படுத்தும் டெவலப்பர்களுக்கு, vLLM உடன் பயன்படுத்த, Gemma-4-31B க்கான NVFP4 அளவிடப்பட்ட சரிபார்ப்புப் புள்ளி NVIDIA Model Optimizer வழியாகக் கிடைக்கிறது. NVFP4 துல்லியம் 8-பிட் துல்லியத்திற்கு கிட்டத்தட்ட ஒத்த துல்லியத்தைப் பராமரிக்கிறது, அதே நேரத்தில் ஒரு வாட்டிற்கு செயல்திறனை கணிசமாக மேம்படுத்துகிறது மற்றும் ஒரு டோக்கனுக்கு செலவைக் குறைக்கிறது, இது பெரிய அளவிலான வரிசைப்படுத்தல்களுக்கு மிகவும் முக்கியம்.

AI-ஐ எட்ஜ்-க்கு கொண்டு வருதல்: NVIDIA வன்பொருளுடன் சாதனத்தில் வரிசைப்படுத்தல்

AI பணிப்பாய்வுகள் மற்றும் முகவர்கள் தினசரி செயல்பாடுகளுக்கு மேலும் மேலும் ஒருங்கிணைந்ததாக மாறுவதால், இந்த மாதிரிகளை பாரம்பரிய தரவு மைய சூழல்களுக்கு அப்பால் இயக்குவதற்கான திறன் மிக முக்கியம். NVIDIA ஆனது RTX GPUகள் போன்ற சக்திவாய்ந்த gpus முதல் சிறப்பு Jetson சாதனங்கள் மற்றும் DGX Spark வரையிலான வாடிக்கையாளர் மற்றும் எட்ஜ் அமைப்புகளின் விரிவான சுற்றுச்சூழல் அமைப்பை வழங்குகிறது, இது டெவலப்பர்களுக்கு செலவு, தாமதம் மற்றும் பாதுகாப்பிற்காக மேம்படுத்த தேவையான நெகிழ்வுத்தன்மையை வழங்குகிறது.

NVIDIA ஆனது vLLM, Ollama மற்றும் llama.cpp போன்ற முன்னணி ஊகிப்பு கட்டமைப்புகளுடன் ஒத்துழைத்து Gemma 4 மாதிரிகளுக்கு உகந்த உள்ளூர் வரிசைப்படுத்தல் அனுபவத்தை உறுதி செய்துள்ளது. கூடுதலாக, Unsloth ஆனது மேம்படுத்தப்பட்ட மற்றும் அளவிடப்பட்ட மாதிரிகளுடன் பூஜ்ஜிய நாள் ஆதரவை வழங்குகிறது, இது Unsloth Studio மூலம் திறமையான உள்ளூர் வரிசைப்படுத்தலை செயல்படுத்துகிறது. இந்த வலுவான ஆதரவு அமைப்பு டெவலப்பர்களை மிகவும் தேவைப்படும் இடங்களில் அதிநவீன AI ஐ நேரடியாக வரிசைப்படுத்த உதவுகிறது.

DGX SparkJetsonRTX / RTX PRO
பயன்பாட்டு நிகழ்வுAI ஆராய்ச்சி மற்றும் முன்மாதிரி உருவாக்கம்எட்ஜ் AI மற்றும் ரோபோடிக்ஸ்டெஸ்க்டாப் பயன்பாடுகள் மற்றும் Windows உருவாக்கம்
முக்கிய சிறப்பம்சங்கள்முன்பே நிறுவப்பட்ட NVIDIA AI மென்பொருள் தொகுப்பு மற்றும் 128 GB ஒருங்கிணைந்த நினைவகம் உள்ளூர் முன்மாதிரி உருவாக்கம், நுண்-டியூனிங் மற்றும் முழுமையாக உள்ளூர் OpenClaw பணிப்பாய்வுகளுக்கு ஆற்றலை வழங்குகிறதுநிபந்தனை அளவுரு ஏற்றுதல் மற்றும் அடுக்கு வாரியான உட்பொதிப்புகள் போன்ற கட்டமைப்பு அம்சங்களால் கிட்டத்தட்ட பூஜ்ஜிய தாமதம், இது விரைவான மற்றும் குறைக்கப்பட்ட நினைவக பயன்பாட்டிற்காக தற்காலிகமாக சேமிக்கப்படலாம் ( மேலும் தகவல்)பிரியர்கள், படைப்பாளிகள் மற்றும் தொழில் வல்லுநர்களுக்கான உள்ளூர் ஊகிப்பிற்கான மேம்படுத்தப்பட்ட செயல்திறன்
தொடங்குவதற்கான வழிகாட்டிvLLM, Ollama, Unsloth மற்றும் llama.cpp வரிசைப்படுத்தல் வழிகாட்டிகளுக்கான DGX Spark Playbooks
Spark இல் நுண்-டியூனிங்கிற்கான NeMo Automodel வழிகாட்டி
பயிற்சிகள் மற்றும் தனிப்பயன் Gemma கண்டெய்னர்களுக்கான Jetson AI LabOllama மற்றும் llama.cpp வழிகாட்டிகளுக்கான RTX AI Garage. RTX Pro உரிமையாளர்களும் vLLM ஐப் பயன்படுத்தலாம்.

அட்டவணை 2. NVIDIA தளங்களில் உள்ளூர் வரிசைப்படுத்தல் விருப்பங்களின் ஒப்பீடு, DGX Spark, Jetson மற்றும் RTX / RTX PRO அமைப்புகளில் Gemma 4 மாதிரிகளை இயக்கும் முதன்மை பயன்பாட்டு நிகழ்வுகள், முக்கிய திறன்கள் மற்றும் பரிந்துரைக்கப்பட்ட தொடக்க வளங்களை எடுத்துக்காட்டுகிறது.

பாதுகாப்பான முகவர் பணிப்பாய்வுகள் மற்றும் நிறுவனத்திற்குத் தயாரான வரிசைப்படுத்தல்களை உருவாக்குதல்

AI உருவாக்குநர்கள் மற்றும் ஆர்வலர்களுக்கு, GB10 Grace Blackwell Superchip மற்றும் 128 GB ஒருங்கிணைந்த நினைவகத்தைக் கொண்ட NVIDIA DGX Spark, ஒப்பிடமுடியாத வளங்களை வழங்குகிறது. இந்த வலுவான தளம் BF16 எடைகளுடன் Gemma 4 31B மாதிரியை இயக்குவதற்கு ஏற்றது, சிக்கலான முகவர் AI பணிப்பாய்வுகளை திறமையாக முன்மாதிரி செய்யவும் உருவாக்கவும் உதவுகிறது, அதே நேரத்தில் தனிப்பட்ட மற்றும் பாதுகாப்பான சாதனத்தில் செயல்படுதலை உறுதி செய்கிறது. DGX Linux OS மற்றும் முழு NVIDIA மென்பொருள் தொகுப்பு ஒரு தடையற்ற மேம்பாட்டு சூழலை வழங்குகின்றன.

உயர் வெளியீட்டு LLM சேவைக்காக வடிவமைக்கப்பட்ட vLLM ஊகிப்பு இயந்திரம், DGX Spark-ல் செயல்திறனை அதிகரிக்கிறது மற்றும் நினைவகப் பயன்பாட்டைக் குறைக்கிறது. இந்த கலவையானது மிகப்பெரிய Gemma 4 மாதிரிகளை வரிசைப்படுத்துவதற்கான உயர்-செயல்திறன் தளத்தை வழங்குகிறது. டெவலப்பர்கள் vLLM for Inference DGX Spark playbook-ஐப் பயன்படுத்தலாம் அல்லது Ollama அல்லது llama.cpp உடன் தொடங்கலாம். மேலும், NeMo Automodel இந்த மாதிரிகளை நேரடியாக DGX Spark-ல் நுண்-டியூன் செய்ய அனுமதிக்கிறது.

நிறுவனப் பயனர்களுக்கு, NVIDIA NIM உற்பத்திக்குத் தயாரான வரிசைப்படுத்தலுக்கான ஒரு வழியை வழங்குகிறது. டெவலப்பர்கள் NVIDIA API catalog-ல் இருந்து NVIDIA-ஆல் ஹோஸ்ட் செய்யப்பட்ட NIM API ஐப் பயன்படுத்தி Gemma 4 31B ஐ முன்மாதிரி செய்யலாம். முழு அளவிலான உற்பத்திக்காக, முன் தொகுக்கப்பட்ட மற்றும் மேம்படுத்தப்பட்ட NIM மைக்ரோசேவைகள் பாதுகாப்பான, சுயமாக ஹோஸ்ட் செய்யப்பட்ட வரிசைப்படுத்தலுக்காக கிடைக்கின்றன, இது NVIDIA என்டர்பிரைஸ் உரிமத்தால் ஆதரிக்கப்படுகிறது. இது நிறுவனங்கள் சக்திவாய்ந்த AI தீர்வுகளை நம்பிக்கையுடன் வரிசைப்படுத்த முடியும் என்பதை உறுதிசெய்கிறது, கடுமையான பாதுகாப்பு மற்றும் செயல்பாட்டுத் தேவைகளைப் பூர்த்தி செய்கிறது.

NVIDIA Jetson உடன் இயற்பியல் AI முகவர்களுக்கு அதிகாரம் அளித்தல்

நவீன இயற்பியல் AI முகவர்களின் திறன்கள் வேகமாக வளர்ந்து வருகின்றன, இது Gemma 4 மாதிரிகள் அதிநவீன ஆடியோ, பல்வகை உணர்வு மற்றும் ஆழமான காரணப்படுத்துதலை ஒருங்கிணைத்ததன் காரணமாகும். இந்த மேம்பட்ட மாதிரிகள் ரோபோடிக்ஸ் அமைப்புகளை எளிமையான பணிகளைச் செய்வதற்கு அப்பால் செல்ல உதவுகின்றன, பேச்சு புரிந்து கொள்ளும், காட்சி சூழலை விளக்கும் மற்றும் செயல்படுவதற்கு முன் புத்திசாலித்தனமாக காரணப்படுத்தும் திறனை அவற்றுக்கு வழங்குகின்றன.

NVIDIA Jetson தளங்களில், டெவலப்பர்கள் llama.cpp மற்றும் vLLM ஐப் பயன்படுத்தி எட்ஜ்-ல் Gemma 4 ஊகிப்பைச் செய்யலாம். உதாரணமாக, Jetson Orin Nano, Gemma 4 E2B மற்றும் E4B வகைகளை ஆதரிக்கிறது, இது சிறிய, உட்பொதிக்கப்பட்ட மற்றும் மின்சாரம் கட்டுப்பாடுள்ள அமைப்புகளில் பல்வகை ஊகிப்பை எளிதாக்குகிறது. இந்த அளவிடுதல் திறன் முழு Jetson தளத்திலும், சக்திவாய்ந்த Jetson Thor வரையிலும் நீண்டுள்ளது, வன்பொருள் தடயங்களைப் பொருட்படுத்தாமல் சீரான மாதிரி வரிசைப்படுத்தலை அனுமதிக்கிறது. குறைந்த தாமத செயல்திறன் மற்றும் சாதனத்தில் நுண்ணறிவு மிக முக்கியம் ஆன ரோபோடிக்ஸ், ஸ்மார்ட் இயந்திரங்கள் மற்றும் தொழில்துறை ஆட்டோமேஷன் பயன்பாடுகளுக்கு இது மிகவும் முக்கியம். இந்த திறன்களை ஆராய ஆர்வமுள்ள டெவலப்பர்கள் Jetson AI Lab-ல் பயிற்சிகள் மற்றும் தனிப்பயன் Gemma கண்டெய்னர்களைக் காணலாம்.

NVIDIA NeMo உடன் தனிப்பயனாக்கம் மற்றும் வணிக அணுகல்

Gemma 4 மாதிரிகள் குறிப்பிட்ட பயன்பாடுகள் மற்றும் தனியுரிமை தரவுத்தொகுப்புகளுக்கு ஏற்றவாறு உருவாக்கப்படலாம் என்பதை உறுதிப்படுத்த, NVIDIA NVIDIA NeMo framework மூலம் வலுவான நுண்-டியூனிங் திறன்களை வழங்குகிறது. குறிப்பாக NeMo Automodel நூலகம், உள்ளூர் PyTorch-இன் பயன்பாட்டு எளிமையை மேம்படுத்தப்பட்ட செயல்திறனுடன் ஒருங்கிணைக்கிறது, இது தனிப்பயனாக்க செயல்முறையை அணுகக்கூடியதாகவும் திறமையாகவும் ஆக்குகிறது.

டெவலப்பர்கள் மேற்பார்வையிடப்பட்ட நுண்-டியூனிங் (SFT) மற்றும் நினைவகத் திறன் கொண்ட LoRA (Low-Rank Adaptation) போன்ற நுட்பங்களைப் பயன்படுத்தி பூஜ்ஜிய நாள் நுண்-டியூனிங்கைச் செய்யலாம். இந்த செயல்முறை Hugging Face-ல் கிடைக்கும் Gemma 4 மாதிரி சரிபார்ப்புப் புள்ளிகளிலிருந்து நேரடியாகத் தொடங்குகிறது, இது சிக்கலான மாற்ற படிகளின் தேவையை நீக்குகிறது. இந்த நெகிழ்வுத்தன்மை நிறுவனங்கள் மற்றும் ஆராய்ச்சியாளர்கள் Gemma 4 மாதிரிகளை டொமைன் சார்ந்த அறிவுடன் உட்புகுத்த அனுமதிக்கிறது, சிறப்புப் பணிகளுக்கு உயர் துல்லியம் மற்றும் பொருத்தத்தை உறுதிசெய்கிறது.

Gemma 4 மாதிரிகள் NVIDIA AI தளத்தில் எளிதாகக் கிடைக்கின்றன மற்றும் வணிக ரீதியாக நட்புரீதியான Apache 2.0 உரிமத்தின் கீழ் வழங்கப்படுகின்றன. இந்த திறந்த மூல உரிமம் வணிக தயாரிப்புகள் மற்றும் சேவைகளில் பரந்த தத்தெடுப்பு மற்றும் ஒருங்கிணைப்பை எளிதாக்குகிறது, உலகெங்கிலும் உள்ள டெவலப்பர்களை அதிநவீன AI உடன் புதுமைப்படுத்த உதவுகிறது. Blackwell இன் செயல்திறன் முதல் Jetson தளங்களின் பரவல் வரை, Gemma 4 ஒவ்வொரு டெவலப்பர் மற்றும் ஒவ்வொரு சாதனத்திற்கும் மேம்பட்ட AI ஐக் கொண்டுவரத் தயாராக உள்ளது.

அடிக்கடி கேட்கப்படும் கேள்விகள்

What is Gemma 4 and what are its key advancements for AI deployment?
Gemma 4 represents the latest generation of multimodal and multilingual AI models from Google, designed for broad deployment across the entire NVIDIA hardware spectrum, from powerful Blackwell data centers to compact Jetson edge devices. Its key advancements include significantly improved efficiency and accuracy, making it suitable for diverse tasks like complex problem-solving, code generation, and agent tool use. These models boast rich multimodal capabilities, supporting interleaved text and images, and are pre-trained on over 140 languages. This versatility and scalability address the growing demand for local, secure, cost-efficient, and low-latency AI applications, pushing intelligence closer to the source of data and action.
How does Gemma 4 facilitate on-device and edge AI deployments, and which NVIDIA platforms support it?
Gemma 4 is specifically optimized to enable robust on-device and edge AI deployments, crucial for applications requiring low latency, enhanced privacy, and reduced operational costs. NVIDIA's comprehensive suite of client and edge systems—including RTX GPUs, DGX Spark, and Jetson devices—provides the necessary flexibility and performance. For instance, Jetson platforms support Gemma 4 E2B and E4B variants for multimodal inference on power-constrained embedded systems, while RTX GPUs offer optimized performance for local inference on desktops. Collaborations with vLLM, Ollama, llama.cpp, and Unsloth ensure efficient local deployment experiences across these diverse platforms, empowering developers to integrate advanced AI directly into their applications and devices.
What role do NVIDIA DGX Spark and NIM play in developing and deploying Gemma 4 models for enterprises?
NVIDIA DGX Spark provides a powerful platform for AI developers and enthusiasts to prototype and build secure, agentic AI workflows with Gemma 4. Featuring GB10 Grace Blackwell Superchips and 128 GB of unified memory, DGX Spark enables efficient running of even the largest Gemma 4 models with BF16 weights, maintaining private and secure on-device execution. The vLLM inference engine on DGX Spark further optimizes LLM serving for high throughput. For production deployment, NVIDIA NIM offers prepackaged and optimized microservices, providing a secure, self-hosted solution for enterprises with an NVIDIA Enterprise License. A hosted NIM API is also available in the NVIDIA API catalog for initial prototyping.
How can developers fine-tune Gemma 4 models for specific domain data, and what tools are available?
Developers can customize Gemma 4 models with their unique domain data using the NVIDIA NeMo framework, particularly the NeMo Automodel library. This powerful tool combines the ease of use of native PyTorch with optimized performance, allowing for efficient fine-tuning. Techniques such as supervised fine-tuning (SFT) and memory-efficient LoRA (Low-Rank Adaptation) can be applied directly to Gemma 4 model checkpoints available on Hugging Face, eliminating the need for cumbersome conversions. This enables day-zero fine-tuning, ensuring models are highly relevant and accurate for specialized applications and datasets, enhancing their utility across various industry verticals.
What are the commercial licensing terms for Gemma 4 models, and how accessible are they to developers?
Gemma 4 models are made highly accessible to developers and enterprises through the commercial-friendly Apache 2.0 license. This open-source license allows for broad use, modification, and distribution of the models, facilitating their integration into various commercial products and services without restrictive licensing fees. Furthermore, NVIDIA ensures wide availability across its entire AI platform, from Blackwell data centers to Jetson edge devices. Developers can get started immediately by accessing model checkpoints on Hugging Face, utilizing NVIDIA's extensive documentation and tutorials, and leveraging tools like vLLM, Ollama, and NeMo for deployment and customization, making advanced AI readily available for innovation.

புதுப்பிப்புகளைப் பெறுங்கள்

சமீபத்திய AI செய்திகளை மின்னஞ்சலில் பெறுங்கள்.

பகிர்