Google ఈ గురువారం Gemma 4 కుటుంబాన్ని ప్రకటించింది, ఇది అందుబాటులో ఉన్న బరువులతో కొత్త ఓపెన్ సోర్స్ కృత్రిమ మేధస్సు నమూనాలతో రూపొందించబడింది. నవీకరణ ఒక సంవత్సరం క్రితం గెమ్మ 3ని ప్రారంభించిన తర్వాత లైన్లో మొదటి ప్రధాన పురోగతిని సూచిస్తుంది. డెవలపర్లు ఇప్పుడు Apache 2.0 లైసెన్స్ని కలిగి ఉన్నారు, ఇది మునుపటి సంస్కరణల్లో ఉన్న వాణిజ్య పరిమితులను తొలగిస్తుంది.
మోడల్లు టెక్స్ట్, ఆడియో మరియు ఇమేజ్ ఇన్పుట్కు మద్దతు ఇస్తాయి, కాంటెక్స్ట్ విండోస్తో అతిపెద్ద వేరియంట్లలో 256 వేల టోకెన్లను చేరుకుంటుంది. వినియోగదారు GPUలు మరియు మొబైల్ పరికరాలతో సహా సరసమైన హార్డ్వేర్పై స్థానికంగా అమలు చేయడానికి అవి ప్రాథమికంగా రూపొందించబడ్డాయి. లైసెన్స్ మార్పు Google విధించిన అదనపు బాధ్యతలు లేకుండా వాణిజ్య వినియోగాన్ని సులభతరం చేస్తుంది.
రీజనింగ్ మరియు మల్టీమోడల్లో సాంకేతిక మెరుగుదలలు
కొత్త మోడల్లు మునుపటి తరంతో పోల్చినప్పుడు తార్కికం, గణితం మరియు సూచనలను అనుసరించడంలో గణనీయమైన పురోగతిని తెచ్చాయి. వారు స్థానిక ఫంక్షన్ కాలింగ్ మద్దతు మరియు JSON నిర్మాణాత్మక అవుట్పుట్ జనరేషన్ను కలిగి ఉంటారు, ఇది ఏజెంట్ వర్క్ఫ్లోలకు ప్రయోజనం చేకూరుస్తుంది.
కోడ్ ప్రాసెసింగ్ సామర్థ్యం ఆఫ్లైన్ పరిసరాల కోసం ఆప్టిమైజ్ చేయబడింది, జెమిని ప్రో వంటి క్లౌడ్ సేవలతో పోల్చదగిన పనితీరును సాధించింది. విజువల్ ఇన్పుట్ సపోర్ట్ ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ మరియు గ్రాఫ్ ఇంటర్ప్రెటేషన్ వంటి టాస్క్లను ఎక్కువ ఖచ్చితత్వంతో అనుమతిస్తుంది.
- వేరియంట్లలో స్మార్ట్ఫోన్లలో తక్కువ జాప్యం కోసం ఆప్టిమైజ్ చేయబడిన ఎఫెక్టివ్ 2B మరియు 4B మోడల్లు ఉన్నాయి.
- Qualcomm మరియు MediaTekతో సహకారం మొబైల్ పరికరాలలో ఏకీకరణను సులభతరం చేస్తుంది.
- పెద్ద మోడల్లు పరిమాణీకరణ లేకుండా ఒకే 80GB H100 GPUతో రన్ అవుతాయి.
పరిమాణ వైవిధ్యాలు మరియు శక్తి సామర్థ్యం
Gemma 4 కుటుంబం నాలుగు ప్రధాన పరిమాణ కాన్ఫిగరేషన్లను కలిగి ఉంది. 26B నిపుణుల మిశ్రమం మరియు 31B డెన్స్ వెర్షన్లు అధిక పనితీరును అందిస్తాయి మరియు సర్వర్ లేదా వర్క్స్టేషన్ హార్డ్వేర్లో రన్ అవుతాయి. ప్రభావవంతమైన 2B మరియు 4B ఎడ్జ్ పరికరాల్లో అమలు చేయడానికి సమర్థతకు ప్రాధాన్యతనిస్తాయి.
26B MoE మోడల్ అనుమితి సమయంలో కేవలం 3.8 బిలియన్ పారామితులను సక్రియం చేస్తుంది, జాప్యం మరియు విద్యుత్ వినియోగాన్ని తగ్గిస్తుంది. అన్ని వేరియంట్లు 140కి పైగా భాషలను హ్యాండిల్ చేస్తాయి. డెవలపర్లు హగ్గింగ్ ఫేస్, కాగ్లే మరియు ఒల్లామా వంటి ప్లాట్ఫారమ్లలో పూర్తి బరువులను డౌన్లోడ్ చేసుకోవచ్చు.
ప్లాట్ఫారమ్లలో తక్షణ లభ్యత
Google యొక్క AI స్టూడియోలో పెద్ద 31B మరియు 26B మోడల్లు అందుబాటులో ఉన్నాయి. తేలికపాటి E4B మరియు E2B వెర్షన్లను AI ఎడ్జ్ గ్యాలరీలో యాక్సెస్ చేయవచ్చు. పబ్లిక్ రిపోజిటరీల నుండి తక్షణ డౌన్లోడ్ కోసం పూర్తి బరువులు అందుబాటులో ఉన్నాయి.
కంపెనీలు మరియు పరిశోధకులు పునరావృతమయ్యే API ఖర్చులు లేకుండా మోడల్లను స్థానిక అనువర్తనాల్లోకి చేర్చవచ్చు. ఆండ్రాయిడ్ పరికరాల్లో రాబోయే జెమినీ నానో 4కి 2B మరియు 4B వేరియంట్లు ఆధారం అవుతాయని గూగుల్ సూచించింది.
Apache 2.0 లైసెన్స్కి మారడం ప్రభావం
Apache 2.0 లైసెన్స్ యొక్క స్వీకరణ మునుపటి కస్టమ్ లైసెన్స్ యొక్క పరిమితులను తొలగిస్తుంది, ఇందులో ఏకపక్షంగా నవీకరించదగిన ఉపయోగం లేని విధానాలు ఉన్నాయి. డెవలపర్లు డేటా మరియు వ్యాపార విస్తరణలపై ఎక్కువ నియంత్రణను పొందుతారు.
ఈ మార్పు సమాజంలో కొత్త ప్రాజెక్ట్ల సృష్టిని ప్రోత్సహించాలి, అనధికారికంగా Gemmaverse అని పిలుస్తారు. స్థానిక అమలుపై దృష్టి జెమిని లైన్ యొక్క క్లోజ్డ్ మోడల్లకు బహిరంగ ప్రత్యామ్నాయాలను అందించే వ్యూహాన్ని బలోపేతం చేస్తుంది.
నిర్దిష్ట హార్డ్వేర్ కోసం ఆప్టిమైజేషన్లు
మొబైల్ చిప్ తయారీదారుల భాగస్వామ్యంతో తేలికపాటి వెర్షన్లు అభివృద్ధి చేయబడ్డాయి. తగ్గిన బ్యాటరీ వినియోగాన్ని కొనసాగిస్తూ రోజువారీ పనులలో అవి దాదాపు జీరో జాప్యాన్ని అందిస్తాయి. పరీక్షలు రాస్ప్బెర్రీ పై మరియు జెట్సన్ నానో వంటి బోర్డులపై మంచి పనితీరును సూచిస్తున్నాయి.
పెద్ద మోడల్లు దట్టమైన కాన్ఫిగరేషన్ లేదా MoEలో కూడా సామర్థ్యాన్ని నిర్వహిస్తాయి. స్థానిక ప్రాసెసింగ్లో జాప్యాన్ని తగ్గించడం అనేది సర్వర్లకు స్థిరమైన కనెక్షన్ లేకుండా గోప్యత మరియు వేగవంతమైన ప్రతిస్పందన అవసరమయ్యే అప్లికేషన్లకు ఆచరణాత్మక లాభాన్ని సూచిస్తుంది.
బహుళ ఇన్పుట్ పద్ధతులకు మద్దతు ఇవ్వండి
వచనంతో పాటు, మోడల్లు ఆడియో మరియు చిత్రాలను స్థానికంగా ప్రాసెస్ చేస్తాయి. స్పీచ్ రికగ్నిషన్ ఫీచర్స్ గెమ్మా 3 కంటే మెరుగుదలలు. మల్టీమోడల్ సామర్ధ్యం నిజ సమయంలో వివిధ రకాల డేటాను మిళితం చేసే అప్లికేషన్ల కోసం అవకాశాలను తెరుస్తుంది.
డెవలపర్లు లైట్ వెయిట్ వేరియంట్లను ఉపయోగించి AI కోర్ డెవలపర్ ప్రివ్యూలో నేరుగా ఏజెంట్ ఫ్లోలను ప్రోటోటైప్ చేయవచ్చు. ఈ అమలులు రాబోయే జెమిని నానో 4కి ఫార్వర్డ్-అనుకూలంగా ఉన్నాయి.
Gemma 4 కుటుంబం అందుబాటులో ఉండే బరువులతో ఓపెన్ మోడల్లను అందించడంలో Google యొక్క నిబద్ధతను బలపరుస్తుంది. మెరుగైన పనితీరు, పర్మిసివ్ లైసెన్సింగ్ మరియు విభిన్న హార్డ్వేర్ మద్దతు కలయిక స్థానికంగా అమలు చేయగల AI పరిష్కారాలను కోరుకునే వారికి ఎంపికలను విస్తరిస్తుంది.

