AI-இன் நிலப்பரப்பு வேகமாக வளர்ந்து வருகிறது, மேலும் மேம்பட்ட AI மாதிரிகளை கிளவுட் தரவு மையங்களில் மட்டுமல்லாமல், நெட்வொர்க்குகளின் மிக முக்கிய எட்ஜ் பகுதிகளிலும், பயனர் சாதனங்களிலும் நேரடியாக வரிசைப்படுத்த வேண்டிய தேவை அதிகரித்து வருகிறது. இந்த மாற்றம் குறைந்த தாமதம், மேம்பட்ட தனியுரிமை, குறைக்கப்பட்ட செயல்பாட்டுச் செலவுகள் மற்றும் வரையறுக்கப்பட்ட இணைப்புடன் கூடிய சூழல்களில் செயல்படும் திறன் ஆகியவற்றின் தேவையால் உந்தப்படுகிறது. இந்த முக்கிய தேவைகளை நிவர்த்தி செய்ய, NVIDIA மற்றும் Google இணைந்து சமீபத்திய Gemma 4 பல்வகை மற்றும் பன்மொழி மாதிரிகளை அறிமுகப்படுத்தியுள்ளன, இவை மிகவும் சக்திவாய்ந்த NVIDIA Blackwell தரவு மையங்களிலிருந்து சிறிய Jetson எட்ஜ் சாதனங்கள் வரை தடையின்றி அளவிடுவதற்கு வடிவமைக்கப்பட்டுள்ளன.
இந்த மாதிரிகள் செயல்திறன் மற்றும் துல்லியத்தில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கின்றன, அவை பலதரப்பட்ட பொதுவான AI பணிகளுக்கு பல்துறை கருவிகளாக அமைகின்றன. Gemma 4 குடும்பம் AI அன்றாட பயன்பாடுகளில் எவ்வாறு ஒருங்கிணைக்கப்படுகிறது என்பதை மறுவரையறை செய்யத் தயாராக உள்ளது, உள்ளூர் AI வரிசைப்படுத்தலில் சாத்தியமானவற்றின் எல்லைகளைத் தள்ளும் திறன்களை வழங்குகிறது.
Gemma 4: பல்வகை மற்றும் பன்மொழி AI-ஐ மேம்படுத்துதல்
நான்கு புதிய Gemma 4 மாதிரிகளின் அறிமுகத்துடன் Gemmaverse விரிவடைந்துள்ளது, ஒவ்வொன்றும் குறிப்பிட்ட வரிசைப்படுத்தல் சூழ்நிலைகளை மனதில் கொண்டு வடிவமைக்கப்பட்டுள்ளன, அதே நேரத்தில் ஒரு வலுவான திறன்களின் தொகுப்பை வழங்குகின்றன. இந்த மாதிரிகள் அளவைப் பற்றியது மட்டுமல்ல; அவை புத்திசாலித்தனமான வடிவமைப்பு பற்றியது, பல்வேறு AI சவால்களில் வலுவான செயல்திறனை வழங்குகின்றன.
Gemma 4 மாதிரிகளின் முக்கிய திறன்கள் பின்வருமாறு:
- காரணப்படுத்துதல்: சிக்கலான சிக்கல் தீர்க்கும் பணிகளில் விதிவிலக்கான செயல்திறன், மிகவும் அதிநவீன முடிவெடுக்கும் திறனை செயல்படுத்துகிறது.
- குறியிடுதல்: மேம்பட்ட குறியீடு உருவாக்கம் மற்றும் பிழைத்திருத்த அம்சங்கள், டெவலப்பர் பணிப்பாய்வுகளை சீராக்குகின்றன.
- முகவர்கள்: கட்டமைக்கப்பட்ட கருவி பயன்பாட்டிற்கான உள்ளூர் ஆதரவு, சக்திவாய்ந்த முகவர் AI அமைப்புகளை உருவாக்குவதற்கு உதவுகிறது.
- பார்வை, ஆடியோ மற்றும் வீடியோ திறன்: பொருள் அங்கீகாரம், தானியங்கி பேச்சு அங்கீகாரம் (ASR), ஆவணம் மற்றும் வீடியோ நுண்ணறிவு போன்ற பயன்பாட்டு நிகழ்வுகளுக்கு செழுமையான பல்வகை தொடர்புகள்.
- இடைச்செருகப்பட்ட பல்வகை உள்ளீடு: ஒரு ஒற்றை தூண்டுதலுக்குள் உரை மற்றும் படங்களை சுதந்திரமாக கலக்கும் திறன், மிகவும் இயற்கையான மற்றும் விரிவான தொடர்புகளை வழங்குகிறது.
- பன்மொழி ஆதரவு: 35-க்கும் மேற்பட்ட மொழிகளுக்கான உடனடி ஆதரவு, 140-க்கும் மேற்பட்ட மொழிகளில் முன்பயிற்சி மூலம் உலகளாவிய அணுகலை விரிவுபடுத்துகிறது.
Gemma 4 குடும்பத்தில் Gemma தொடரில் முதல் Mixture-of-Experts (MoE) மாதிரி அடங்கும், இது செயல்திறனுக்காக மேம்படுத்தப்பட்டுள்ளது. குறிப்பிடத்தக்க வகையில், நான்கு மாதிரிகளும் ஒரு ஒற்றை NVIDIA H100 GPU-ல் பொருந்தும், இது அவற்றின் மேம்படுத்தப்பட்ட வடிவமைப்பைக் காட்டுகிறது. 31B மற்றும் 26B A4B வகைகள் உள்ளூர் மற்றும் தரவு மைய சூழல்கள் இரண்டிற்கும் ஏற்ற உயர்-செயல்திறன் கொண்ட காரணப்படுத்துதல் மாதிரிகள் ஆகும், அதேசமயம் E4B மற்றும் E2B மாதிரிகள் Gemma 3n இன் பாரம்பரியத்தின் அடிப்படையில் சாதனத்தில் மற்றும் மொபைல் பயன்பாடுகளுக்காக சிறப்பாக வடிவமைக்கப்பட்டுள்ளன.
| மாடல் பெயர் | கட்டமைப்பு வகை | மொத்த அளவுருக்கள் | செயலில் உள்ள அல்லது பயனுள்ள அளவுருக்கள் | உள்ளீட்டு சூழல் நீளம் (டோக்கன்கள்) | நகரும் சாளரம் (டோக்கன்கள்) | முறைகள் |
|---|---|---|---|---|---|---|
| Gemma-4-31B | Dense Transformer | 31B | — | 256K | 1024 | Text |
| Gemma-4-26B-A4B | MoE – 128 Experts | 26B | 3.8B | 256K | — | Text |
| Gemma-4-E4B | Dense Transformer | 7.9B with embeddings | 4.5B effective | 128K | 512 | Text, Audio, Vision, Video |
| Gemma-4-E2B | Dense Transformer | 5.1B with embeddings | 2.3B effective | 128K | 512 | Text, Audio, Vision, Video |
அட்டவணை 1. Gemma 4 மாதிரி குடும்பத்தின் மேலோட்டம், கட்டமைப்பு வகைகள், அளவுரு அளவுகள், பயனுள்ள அளவுருக்கள், ஆதரிக்கப்படும் சூழல் நீளங்கள் மற்றும் கிடைக்கக்கூடிய முறைகளை சுருக்கமாகக் கூறுகிறது, இது தரவு மையம், எட்ஜ் மற்றும் சாதனத்தில் வரிசைப்படுத்தல்களுக்கு சரியான மாதிரியைத் தேர்வுசெய்ய டெவலப்பர்களுக்கு உதவுகிறது.
இந்த மாதிரிகள் Hugging Face-ல் BF16 சரிபார்ப்புப் புள்ளிகளுடன் கிடைக்கின்றன. NVIDIA Blackwell GPU-களைப் பயன்படுத்தும் டெவலப்பர்களுக்கு, vLLM உடன் பயன்படுத்த, Gemma-4-31B க்கான NVFP4 அளவிடப்பட்ட சரிபார்ப்புப் புள்ளி NVIDIA Model Optimizer வழியாகக் கிடைக்கிறது. NVFP4 துல்லியம் 8-பிட் துல்லியத்திற்கு கிட்டத்தட்ட ஒத்த துல்லியத்தைப் பராமரிக்கிறது, அதே நேரத்தில் ஒரு வாட்டிற்கு செயல்திறனை கணிசமாக மேம்படுத்துகிறது மற்றும் ஒரு டோக்கனுக்கு செலவைக் குறைக்கிறது, இது பெரிய அளவிலான வரிசைப்படுத்தல்களுக்கு மிகவும் முக்கியம்.
AI-ஐ எட்ஜ்-க்கு கொண்டு வருதல்: NVIDIA வன்பொருளுடன் சாதனத்தில் வரிசைப்படுத்தல்
AI பணிப்பாய்வுகள் மற்றும் முகவர்கள் தினசரி செயல்பாடுகளுக்கு மேலும் மேலும் ஒருங்கிணைந்ததாக மாறுவதால், இந்த மாதிரிகளை பாரம்பரிய தரவு மைய சூழல்களுக்கு அப்பால் இயக்குவதற்கான திறன் மிக முக்கியம். NVIDIA ஆனது RTX GPUகள் போன்ற சக்திவாய்ந்த gpus முதல் சிறப்பு Jetson சாதனங்கள் மற்றும் DGX Spark வரையிலான வாடிக்கையாளர் மற்றும் எட்ஜ் அமைப்புகளின் விரிவான சுற்றுச்சூழல் அமைப்பை வழங்குகிறது, இது டெவலப்பர்களுக்கு செலவு, தாமதம் மற்றும் பாதுகாப்பிற்காக மேம்படுத்த தேவையான நெகிழ்வுத்தன்மையை வழங்குகிறது.
NVIDIA ஆனது vLLM, Ollama மற்றும் llama.cpp போன்ற முன்னணி ஊகிப்பு கட்டமைப்புகளுடன் ஒத்துழைத்து Gemma 4 மாதிரிகளுக்கு உகந்த உள்ளூர் வரிசைப்படுத்தல் அனுபவத்தை உறுதி செய்துள்ளது. கூடுதலாக, Unsloth ஆனது மேம்படுத்தப்பட்ட மற்றும் அளவிடப்பட்ட மாதிரிகளுடன் பூஜ்ஜிய நாள் ஆதரவை வழங்குகிறது, இது Unsloth Studio மூலம் திறமையான உள்ளூர் வரிசைப்படுத்தலை செயல்படுத்துகிறது. இந்த வலுவான ஆதரவு அமைப்பு டெவலப்பர்களை மிகவும் தேவைப்படும் இடங்களில் அதிநவீன AI ஐ நேரடியாக வரிசைப்படுத்த உதவுகிறது.
| DGX Spark | Jetson | RTX / RTX PRO | |
|---|---|---|---|
| பயன்பாட்டு நிகழ்வு | AI ஆராய்ச்சி மற்றும் முன்மாதிரி உருவாக்கம் | எட்ஜ் AI மற்றும் ரோபோடிக்ஸ் | டெஸ்க்டாப் பயன்பாடுகள் மற்றும் Windows உருவாக்கம் |
| முக்கிய சிறப்பம்சங்கள் | முன்பே நிறுவப்பட்ட NVIDIA AI மென்பொருள் தொகுப்பு மற்றும் 128 GB ஒருங்கிணைந்த நினைவகம் உள்ளூர் முன்மாதிரி உருவாக்கம், நுண்-டியூனிங் மற்றும் முழுமையாக உள்ளூர் OpenClaw பணிப்பாய்வுகளுக்கு ஆற்றலை வழங்குகிறது | நிபந்தனை அளவுரு ஏற்றுதல் மற்றும் அடுக்கு வாரியான உட்பொதிப்புகள் போன்ற கட்டமைப்பு அம்சங்களால் கிட்டத்தட்ட பூஜ்ஜிய தாமதம், இது விரைவான மற்றும் குறைக்கப்பட்ட நினைவக பயன்பாட்டிற்காக தற்காலிகமாக சேமிக்கப்படலாம் ( மேலும் தகவல்) | பிரியர்கள், படைப்பாளிகள் மற்றும் தொழில் வல்லுநர்களுக்கான உள்ளூர் ஊகிப்பிற்கான மேம்படுத்தப்பட்ட செயல்திறன் |
| தொடங்குவதற்கான வழிகாட்டி | vLLM, Ollama, Unsloth மற்றும் llama.cpp வரிசைப்படுத்தல் வழிகாட்டிகளுக்கான DGX Spark Playbooks Spark இல் நுண்-டியூனிங்கிற்கான NeMo Automodel வழிகாட்டி | பயிற்சிகள் மற்றும் தனிப்பயன் Gemma கண்டெய்னர்களுக்கான Jetson AI Lab | Ollama மற்றும் llama.cpp வழிகாட்டிகளுக்கான RTX AI Garage. RTX Pro உரிமையாளர்களும் vLLM ஐப் பயன்படுத்தலாம். |
அட்டவணை 2. NVIDIA தளங்களில் உள்ளூர் வரிசைப்படுத்தல் விருப்பங்களின் ஒப்பீடு, DGX Spark, Jetson மற்றும் RTX / RTX PRO அமைப்புகளில் Gemma 4 மாதிரிகளை இயக்கும் முதன்மை பயன்பாட்டு நிகழ்வுகள், முக்கிய திறன்கள் மற்றும் பரிந்துரைக்கப்பட்ட தொடக்க வளங்களை எடுத்துக்காட்டுகிறது.
பாதுகாப்பான முகவர் பணிப்பாய்வுகள் மற்றும் நிறுவனத்திற்குத் தயாரான வரிசைப்படுத்தல்களை உருவாக்குதல்
AI உருவாக்குநர்கள் மற்றும் ஆர்வலர்களுக்கு, GB10 Grace Blackwell Superchip மற்றும் 128 GB ஒருங்கிணைந்த நினைவகத்தைக் கொண்ட NVIDIA DGX Spark, ஒப்பிடமுடியாத வளங்களை வழங்குகிறது. இந்த வலுவான தளம் BF16 எடைகளுடன் Gemma 4 31B மாதிரியை இயக்குவதற்கு ஏற்றது, சிக்கலான முகவர் AI பணிப்பாய்வுகளை திறமையாக முன்மாதிரி செய்யவும் உருவாக்கவும் உதவுகிறது, அதே நேரத்தில் தனிப்பட்ட மற்றும் பாதுகாப்பான சாதனத்தில் செயல்படுதலை உறுதி செய்கிறது. DGX Linux OS மற்றும் முழு NVIDIA மென்பொருள் தொகுப்பு ஒரு தடையற்ற மேம்பாட்டு சூழலை வழங்குகின்றன.
உயர் வெளியீட்டு LLM சேவைக்காக வடிவமைக்கப்பட்ட vLLM ஊகிப்பு இயந்திரம், DGX Spark-ல் செயல்திறனை அதிகரிக்கிறது மற்றும் நினைவகப் பயன்பாட்டைக் குறைக்கிறது. இந்த கலவையானது மிகப்பெரிய Gemma 4 மாதிரிகளை வரிசைப்படுத்துவதற்கான உயர்-செயல்திறன் தளத்தை வழங்குகிறது. டெவலப்பர்கள் vLLM for Inference DGX Spark playbook-ஐப் பயன்படுத்தலாம் அல்லது Ollama அல்லது llama.cpp உடன் தொடங்கலாம். மேலும், NeMo Automodel இந்த மாதிரிகளை நேரடியாக DGX Spark-ல் நுண்-டியூன் செய்ய அனுமதிக்கிறது.
நிறுவனப் பயனர்களுக்கு, NVIDIA NIM உற்பத்திக்குத் தயாரான வரிசைப்படுத்தலுக்கான ஒரு வழியை வழங்குகிறது. டெவலப்பர்கள் NVIDIA API catalog-ல் இருந்து NVIDIA-ஆல் ஹோஸ்ட் செய்யப்பட்ட NIM API ஐப் பயன்படுத்தி Gemma 4 31B ஐ முன்மாதிரி செய்யலாம். முழு அளவிலான உற்பத்திக்காக, முன் தொகுக்கப்பட்ட மற்றும் மேம்படுத்தப்பட்ட NIM மைக்ரோசேவைகள் பாதுகாப்பான, சுயமாக ஹோஸ்ட் செய்யப்பட்ட வரிசைப்படுத்தலுக்காக கிடைக்கின்றன, இது NVIDIA என்டர்பிரைஸ் உரிமத்தால் ஆதரிக்கப்படுகிறது. இது நிறுவனங்கள் சக்திவாய்ந்த AI தீர்வுகளை நம்பிக்கையுடன் வரிசைப்படுத்த முடியும் என்பதை உறுதிசெய்கிறது, கடுமையான பாதுகாப்பு மற்றும் செயல்பாட்டுத் தேவைகளைப் பூர்த்தி செய்கிறது.
NVIDIA Jetson உடன் இயற்பியல் AI முகவர்களுக்கு அதிகாரம் அளித்தல்
நவீன இயற்பியல் AI முகவர்களின் திறன்கள் வேகமாக வளர்ந்து வருகின்றன, இது Gemma 4 மாதிரிகள் அதிநவீன ஆடியோ, பல்வகை உணர்வு மற்றும் ஆழமான காரணப்படுத்துதலை ஒருங்கிணைத்ததன் காரணமாகும். இந்த மேம்பட்ட மாதிரிகள் ரோபோடிக்ஸ் அமைப்புகளை எளிமையான பணிகளைச் செய்வதற்கு அப்பால் செல்ல உதவுகின்றன, பேச்சு புரிந்து கொள்ளும், காட்சி சூழலை விளக்கும் மற்றும் செயல்படுவதற்கு முன் புத்திசாலித்தனமாக காரணப்படுத்தும் திறனை அவற்றுக்கு வழங்குகின்றன.
NVIDIA Jetson தளங்களில், டெவலப்பர்கள் llama.cpp மற்றும் vLLM ஐப் பயன்படுத்தி எட்ஜ்-ல் Gemma 4 ஊகிப்பைச் செய்யலாம். உதாரணமாக, Jetson Orin Nano, Gemma 4 E2B மற்றும் E4B வகைகளை ஆதரிக்கிறது, இது சிறிய, உட்பொதிக்கப்பட்ட மற்றும் மின்சாரம் கட்டுப்பாடுள்ள அமைப்புகளில் பல்வகை ஊகிப்பை எளிதாக்குகிறது. இந்த அளவிடுதல் திறன் முழு Jetson தளத்திலும், சக்திவாய்ந்த Jetson Thor வரையிலும் நீண்டுள்ளது, வன்பொருள் தடயங்களைப் பொருட்படுத்தாமல் சீரான மாதிரி வரிசைப்படுத்தலை அனுமதிக்கிறது. குறைந்த தாமத செயல்திறன் மற்றும் சாதனத்தில் நுண்ணறிவு மிக முக்கியம் ஆன ரோபோடிக்ஸ், ஸ்மார்ட் இயந்திரங்கள் மற்றும் தொழில்துறை ஆட்டோமேஷன் பயன்பாடுகளுக்கு இது மிகவும் முக்கியம். இந்த திறன்களை ஆராய ஆர்வமுள்ள டெவலப்பர்கள் Jetson AI Lab-ல் பயிற்சிகள் மற்றும் தனிப்பயன் Gemma கண்டெய்னர்களைக் காணலாம்.
NVIDIA NeMo உடன் தனிப்பயனாக்கம் மற்றும் வணிக அணுகல்
Gemma 4 மாதிரிகள் குறிப்பிட்ட பயன்பாடுகள் மற்றும் தனியுரிமை தரவுத்தொகுப்புகளுக்கு ஏற்றவாறு உருவாக்கப்படலாம் என்பதை உறுதிப்படுத்த, NVIDIA NVIDIA NeMo framework மூலம் வலுவான நுண்-டியூனிங் திறன்களை வழங்குகிறது. குறிப்பாக NeMo Automodel நூலகம், உள்ளூர் PyTorch-இன் பயன்பாட்டு எளிமையை மேம்படுத்தப்பட்ட செயல்திறனுடன் ஒருங்கிணைக்கிறது, இது தனிப்பயனாக்க செயல்முறையை அணுகக்கூடியதாகவும் திறமையாகவும் ஆக்குகிறது.
டெவலப்பர்கள் மேற்பார்வையிடப்பட்ட நுண்-டியூனிங் (SFT) மற்றும் நினைவகத் திறன் கொண்ட LoRA (Low-Rank Adaptation) போன்ற நுட்பங்களைப் பயன்படுத்தி பூஜ்ஜிய நாள் நுண்-டியூனிங்கைச் செய்யலாம். இந்த செயல்முறை Hugging Face-ல் கிடைக்கும் Gemma 4 மாதிரி சரிபார்ப்புப் புள்ளிகளிலிருந்து நேரடியாகத் தொடங்குகிறது, இது சிக்கலான மாற்ற படிகளின் தேவையை நீக்குகிறது. இந்த நெகிழ்வுத்தன்மை நிறுவனங்கள் மற்றும் ஆராய்ச்சியாளர்கள் Gemma 4 மாதிரிகளை டொமைன் சார்ந்த அறிவுடன் உட்புகுத்த அனுமதிக்கிறது, சிறப்புப் பணிகளுக்கு உயர் துல்லியம் மற்றும் பொருத்தத்தை உறுதிசெய்கிறது.
Gemma 4 மாதிரிகள் NVIDIA AI தளத்தில் எளிதாகக் கிடைக்கின்றன மற்றும் வணிக ரீதியாக நட்புரீதியான Apache 2.0 உரிமத்தின் கீழ் வழங்கப்படுகின்றன. இந்த திறந்த மூல உரிமம் வணிக தயாரிப்புகள் மற்றும் சேவைகளில் பரந்த தத்தெடுப்பு மற்றும் ஒருங்கிணைப்பை எளிதாக்குகிறது, உலகெங்கிலும் உள்ள டெவலப்பர்களை அதிநவீன AI உடன் புதுமைப்படுத்த உதவுகிறது. Blackwell இன் செயல்திறன் முதல் Jetson தளங்களின் பரவல் வரை, Gemma 4 ஒவ்வொரு டெவலப்பர் மற்றும் ஒவ்வொரு சாதனத்திற்கும் மேம்பட்ட AI ஐக் கொண்டுவரத் தயாராக உள்ளது.
அசல் மூலம்
https://developer.nvidia.com/blog/bringing-ai-closer-to-the-edge-and-on-device-with-gemma-4/அடிக்கடி கேட்கப்படும் கேள்விகள்
What is Gemma 4 and what are its key advancements for AI deployment?
How does Gemma 4 facilitate on-device and edge AI deployments, and which NVIDIA platforms support it?
What role do NVIDIA DGX Spark and NIM play in developing and deploying Gemma 4 models for enterprises?
How can developers fine-tune Gemma 4 models for specific domain data, and what tools are available?
What are the commercial licensing terms for Gemma 4 models, and how accessible are they to developers?
புதுப்பிப்புகளைப் பெறுங்கள்
சமீபத்திய AI செய்திகளை மின்னஞ்சலில் பெறுங்கள்.
