Google ഈ വ്യാഴാഴ്ച Gemma 4 കുടുംബത്തെ പ്രഖ്യാപിച്ചു, ലഭ്യമായ ഭാരങ്ങളുള്ള പുതിയ ഓപ്പൺ സോഴ്സ് ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് മോഡലുകൾ നിർമ്മിച്ചതാണ്. ഒരു വർഷം മുമ്പ് Gemma 3 സമാരംഭിച്ചതിന് ശേഷമുള്ള ലൈനിലെ ആദ്യത്തെ പ്രധാന മുന്നേറ്റത്തെയാണ് അപ്ഡേറ്റ് പ്രതിനിധീകരിക്കുന്നത്. ഡെവലപ്പർമാർക്ക് ഇപ്പോൾ ലൈസൻസ് Apache 2.0 ഉണ്ട്, ഇത് മുൻ പതിപ്പുകളിൽ നിലവിലുള്ള വാണിജ്യ നിയന്ത്രണങ്ങൾ നീക്കം ചെയ്യുന്നു.
മോഡലുകൾ ടെക്സ്റ്റ്, ഓഡിയോ, ഇമേജ് ഇൻപുട്ട് എന്നിവയെ പിന്തുണയ്ക്കുന്നു, ഏറ്റവും വലിയ വേരിയൻ്റുകളിൽ 256 ആയിരം ടോക്കണുകളിൽ എത്തുന്ന സന്ദർഭ വിൻഡോകൾ. Eles പ്രാഥമികമായി രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത് ഉപഭോക്തൃ ജിപിയുകളും മൊബൈൽ ഉപകരണങ്ങളും ഉൾപ്പെടെ താങ്ങാനാവുന്ന ഹാർഡ്വെയറിൽ പ്രാദേശികമായി പ്രവർത്തിക്കാനാണ്. ലൈസൻസ് മാറ്റം Google ചുമത്തിയ അധിക ബാധ്യതകളില്ലാതെ വാണിജ്യപരമായ ഉപയോഗത്തിന് സൗകര്യമൊരുക്കുന്നു.
ന്യായവാദത്തിലും മൾട്ടിമോഡലിലും സാങ്കേതിക മെച്ചപ്പെടുത്തലുകൾ
മുൻ തലമുറയുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പുതിയ മോഡലുകൾ ന്യായവാദം, ഗണിതശാസ്ത്രം, നിർദ്ദേശങ്ങൾ പാലിക്കൽ എന്നിവയിൽ കാര്യമായ പുരോഗതി കൈവരിക്കുന്നു. Eles ഫംഗ്ഷൻ കോളിംഗിനും JSON ഘടനാപരമായ ഔട്ട്പുട്ട് ജനറേഷനുമുള്ള നേറ്റീവ് പിന്തുണ സംയോജിപ്പിക്കുന്നു, ഇത് ഏജൻ്റ് വർക്ക്ഫ്ലോകൾക്ക് ഗുണം ചെയ്യും.
Gemini Pro പോലുള്ള ക്ലൗഡ് സേവനങ്ങളുമായി താരതമ്യപ്പെടുത്താവുന്ന പ്രകടനം കൈവരിക്കുന്ന ഓഫ്ലൈൻ എൻവയോൺമെൻ്റുകൾക്കായി കോഡ് പ്രോസസ്സിംഗ് ശേഷി ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു. വിഷ്വൽ ഇൻപുട്ട് പിന്തുണ ഒപ്റ്റിക്കൽ ക്യാരക്ടർ തിരിച്ചറിയൽ, ഗ്രാഫ് വ്യാഖ്യാനം തുടങ്ങിയ ജോലികൾ കൂടുതൽ കൃത്യതയോടെ പ്രാപ്തമാക്കുന്നു.
- സ്മാർട്ട്ഫോണുകളിൽ കുറഞ്ഞ കാലതാമസത്തിനായി ഒപ്റ്റിമൈസ് ചെയ്ത Effective 2B, 4B മോഡലുകൾ വേരിയൻ്റുകളിൽ ഉൾപ്പെടുന്നു.
- Qualcomm, MediaTek എന്നിവയുമായുള്ള സഹകരണം മൊബൈൽ ഉപകരണങ്ങളിൽ സംയോജിപ്പിക്കാൻ സഹായിക്കുന്നു.
- വലിയ മോഡലുകൾ ഒരു 80GB H100 GPU-ൽ പ്രവർത്തിക്കുന്നു.
വലിപ്പം വകഭേദങ്ങളും ഊർജ്ജ കാര്യക്ഷമതയും
Gemma 4 കുടുംബത്തിന് നാല് പ്രധാന വലുപ്പ കോൺഫിഗറേഷനുകളുണ്ട്. Experts, 31B Dense എന്നിവയുടെ 26B Mixture പതിപ്പുകൾ ഉയർന്ന പ്രകടനവും സെർവറിലോ വർക്ക്സ്റ്റേഷൻ ഹാർഡ്വെയറിലോ പ്രവർത്തിക്കുന്നു. Já ആയി Effective 2B, 4B എന്നിവ എഡ്ജ് ഉപകരണങ്ങളിൽ നിർവ്വഹിക്കുന്നതിനുള്ള കാര്യക്ഷമതയ്ക്ക് മുൻഗണന നൽകുന്നു.
26B MoE മോഡൽ അനുമാന സമയത്ത് വെറും 3.8 ബില്യൺ പാരാമീറ്ററുകൾ സജീവമാക്കുന്നു, ഇത് ലേറ്റൻസിയും വൈദ്യുതി ഉപഭോഗവും കുറയ്ക്കുന്നു. Todas വകഭേദങ്ങൾ 140-ലധികം ഭാഷകൾ കൈകാര്യം ചെയ്യുന്നു. Hugging Face, Kaggle, Ollama തുടങ്ങിയ പ്ലാറ്റ്ഫോമുകളിൽ ഡെവലപ്പർമാർക്ക് മുഴുവൻ വെയ്റ്റുകളും ഡൗൺലോഡ് ചെയ്യാം.
പ്ലാറ്റ്ഫോമുകളിലുടനീളം ഉടനടി ലഭ്യത
വലിയ 31B, 26B മോഡലുകൾ AI Studio, Google എന്നിവയിൽ ലഭ്യമാണ്. ഭാരം കുറഞ്ഞ E4B, E2B പതിപ്പുകൾ AI Edge Gallery-ൽ ആക്സസ് ചെയ്യാൻ കഴിയും. പബ്ലിക് റിപ്പോസിറ്ററികളിൽ നിന്ന് ഉടനടി ഡൗൺലോഡ് ചെയ്യാൻ പൂർണ്ണ ഭാരം ലഭ്യമാണ്.
കമ്പനികൾക്കും ഗവേഷകർക്കും ആവർത്തന API ചെലവുകളില്ലാതെ മോഡലുകളെ പ്രാദേശിക ആപ്ലിക്കേഷനുകളിലേക്ക് സംയോജിപ്പിക്കാൻ കഴിയും. Google Android ഉപകരണങ്ങളിൽ വരാനിരിക്കുന്ന Gemini Nano 4 ൻ്റെ അടിസ്ഥാനമായി 2B, 4B എന്നീ വേരിയൻ്റുകൾ പ്രവർത്തിക്കുമെന്ന് സൂചിപ്പിച്ചു.
ലൈസൻസ് Apache 2.0-ലേക്ക് മാറുന്നതിൻ്റെ ആഘാതം
ലൈസൻസ് Apache 2.0 സ്വീകരിക്കുന്നത് മുൻ ഇഷ്ടാനുസൃത ലൈസൻസിൻ്റെ നിയന്ത്രണങ്ങൾ ഇല്ലാതാക്കുന്നു, അതിൽ ഏകപക്ഷീയമായി അപ്ഡേറ്റ് ചെയ്യാവുന്ന ഉപയോഗ രഹിത നയങ്ങൾ ഉൾപ്പെടുന്നു. Desenvolvedores ഡാറ്റയിലും ബിസിനസ്സ് വിന്യാസത്തിലും കൂടുതൽ നിയന്ത്രണം നേടുക.
ഈ മാറ്റം കമ്മ്യൂണിറ്റിയിൽ അനൗപചാരികമായി Gemmaverse എന്നറിയപ്പെടുന്ന പുതിയ പ്രോജക്ടുകളുടെ സൃഷ്ടിയെ പ്രോത്സാഹിപ്പിക്കണം. ലോക്കൽ എക്സിക്യൂഷനിലെ ശ്രദ്ധ Gemini ലൈനിൻ്റെ അടച്ച മോഡലുകൾക്ക് തുറന്ന ബദലുകൾ വാഗ്ദാനം ചെയ്യുന്ന തന്ത്രത്തെ ശക്തിപ്പെടുത്തുന്നു.
നിർദ്ദിഷ്ട ഹാർഡ്വെയറിനുള്ള ഒപ്റ്റിമൈസേഷനുകൾ
മൊബൈൽ ചിപ്പ് നിർമ്മാതാക്കളുടെ പങ്കാളിത്തത്തോടെയാണ് ഭാരം കുറഞ്ഞ പതിപ്പുകൾ വികസിപ്പിച്ചത്. Elas കുറഞ്ഞ ബാറ്ററി ഉപഭോഗം നിലനിർത്തിക്കൊണ്ട് ദൈനംദിന ജോലികളിൽ പൂജ്യത്തിനടുത്തുള്ള ലേറ്റൻസി നൽകുന്നു. Testes, Raspberry Pi, Jetson Nano തുടങ്ങിയ കാർഡുകളിലെ മികച്ച പ്രകടനം സൂചിപ്പിക്കുന്നു.
വലിയ മോഡലുകൾ സാന്ദ്രമായ കോൺഫിഗറേഷനിലോ MoEയിലോ പോലും കാര്യക്ഷമത നിലനിർത്തുന്നു. പ്രാദേശിക പ്രോസസ്സിംഗിലെ കാലതാമസം കുറയ്ക്കുന്നത് സെർവറുകളുമായുള്ള നിരന്തരമായ കണക്ഷനില്ലാതെ സ്വകാര്യതയും വേഗത്തിലുള്ള പ്രതികരണവും ആവശ്യമുള്ള ആപ്ലിക്കേഷനുകൾക്കുള്ള പ്രായോഗിക നേട്ടത്തെ പ്രതിനിധീകരിക്കുന്നു.
ഒന്നിലധികം ഇൻപുട്ട് രീതികളെ പിന്തുണയ്ക്കുക
വാചകത്തിന് പുറമേ, മോഡലുകൾ ഓഡിയോയും ചിത്രങ്ങളും നേറ്റീവ് ആയി പ്രോസസ്സ് ചെയ്യുന്നു. Gemma-നേക്കാൾ സ്പീച്ച് റെക്കഗ്നിഷൻ മെച്ചപ്പെടുന്നു 3. മൾട്ടിമോഡൽ ശേഷി തത്സമയം വ്യത്യസ്ത തരം ഡാറ്റകൾ സംയോജിപ്പിക്കുന്ന ആപ്ലിക്കേഷനുകൾക്കുള്ള സാധ്യതകൾ തുറക്കുന്നു.
ഭാരം കുറഞ്ഞ വകഭേദങ്ങൾ ഉപയോഗിച്ച് ഡെവലപ്പർമാർക്ക് നേരിട്ട് AI Core Developer Preview-ൽ പ്രോട്ടോടൈപ്പ് ചെയ്യാനാകും. Essas നടപ്പിലാക്കലുകൾ ഭാവിയുമായി പൊരുത്തപ്പെടുന്നതാണ് Gemini Nano 4.
Gemma 4 കുടുംബം Google-ൻ്റെ ആക്സസ് ചെയ്യാവുന്ന ഭാരമുള്ള ഓപ്പൺ മോഡലുകൾ വാഗ്ദാനം ചെയ്യുന്ന പ്രതിബദ്ധത ശക്തിപ്പെടുത്തുന്നു. മെച്ചപ്പെട്ട പ്രകടനം, അനുവദനീയമായ ലൈസൻസിംഗ്, വൈവിധ്യമാർന്ന ഹാർഡ്വെയർ പിന്തുണ എന്നിവയുടെ സംയോജനം പ്രാദേശികമായി പ്രവർത്തിപ്പിക്കാവുന്ന AI സൊല്യൂഷനുകൾ തേടുന്നവർക്കുള്ള ഓപ്ഷനുകൾ വികസിപ്പിക്കുന്നു.

