Google បានប្រកាសនៅថ្ងៃព្រហស្បតិ៍នេះនូវគ្រួសារ Gemma 4 ដែលបង្កើតឡើងដោយគំរូបញ្ញាសិប្បនិមិត្តបើកចំហរថ្មីជាមួយនឹងទម្ងន់ដែលមាន។ ការអាប់ដេតតំណាងឱ្យការរីកចំរើនដ៏សំខាន់លើកដំបូងនៅក្នុងបន្ទាត់ចាប់តាំងពីការចាប់ផ្តើមនៃ Gemma 3 ច្រើនជាងមួយឆ្នាំមុន។ ឥឡូវនេះអ្នកអភិវឌ្ឍន៍មានអាជ្ញាប័ណ្ណ Apache 2.0 ដែលលុបចោលការរឹតបន្តឹងពាណិជ្ជកម្មដែលមាននៅក្នុងកំណែមុន។
ម៉ូដែលគាំទ្រការបញ្ចូលអត្ថបទ អូឌីយ៉ូ និងរូបភាព ជាមួយនឹងបង្អួចបរិបទដែលឈានដល់ 256 ពាន់សញ្ញាសម្ងាត់នៅក្នុងវ៉ារ្យ៉ង់ធំបំផុត។ Eles ត្រូវបានរចនាឡើងជាចម្បងដើម្បីដំណើរការក្នុងមូលដ្ឋានលើផ្នែករឹងដែលមានតម្លៃសមរម្យ រួមទាំង GPUs អ្នកប្រើប្រាស់ និងឧបករណ៍ចល័ត។ ការផ្លាស់ប្តូរអាជ្ញាប័ណ្ណជួយសម្រួលដល់ការប្រើប្រាស់ពាណិជ្ជកម្មដោយគ្មានកាតព្វកិច្ចបន្ថែមដែលកំណត់ដោយ Google។
ការកែលម្អបច្ចេកទេសក្នុងហេតុផល និងពហុទម្រង់
ម៉ូដែលថ្មីនាំមកនូវភាពជឿនលឿនយ៉ាងសំខាន់ក្នុងការវែកញែក គណិតវិទ្យា និងការធ្វើតាមការណែនាំ បើប្រៀបធៀបទៅនឹងជំនាន់មុន។ Eles រួមបញ្ចូលការគាំទ្រដើមសម្រាប់ការហៅតាមមុខងារ និងការបង្កើតលទ្ធផលដែលមានរចនាសម្ព័ន្ធ JSON ដែលផ្តល់អត្ថប្រយោជន៍ដល់លំហូរការងារភ្នាក់ងារ។
សមត្ថភាពដំណើរការកូដត្រូវបានធ្វើឱ្យប្រសើរសម្រាប់បរិស្ថានក្រៅបណ្តាញ ដោយសម្រេចបាននូវប្រតិបត្តិការដែលអាចប្រៀបធៀបទៅនឹងសេវាកម្មពពកដូចជា Gemini Pro។ ជំនួយការបញ្ចូលដែលមើលឃើញអាចឱ្យកិច្ចការដូចជាការសម្គាល់តួអក្សរអុបទិក និងការបកស្រាយក្រាហ្វជាមួយនឹងភាពត្រឹមត្រូវជាងមុន។
- វ៉ារ្យ៉ង់រួមមានម៉ូដែល Effective 2B និង 4B ដែលត្រូវបានកែលម្អសម្រាប់ភាពយឺតយ៉ាវទាបនៅលើស្មាតហ្វូន។
- កិច្ចសហប្រតិបត្តិការជាមួយ Qualcomm និង MediaTek សម្របសម្រួលការរួមបញ្ចូលនៅលើឧបករណ៍ចល័ត។
- ម៉ូដែលធំជាងដំណើរការលើ 80GB H100 GPU តែមួយដោយគ្មានបរិមាណ។
បំរែបំរួលទំហំ និងប្រសិទ្ធភាពថាមពល
គ្រួសារ Gemma 4 មានការកំណត់ទំហំសំខាន់ៗចំនួនបួន។ កំណែ 26B Mixture នៃ Experts និង 31B Dense ផ្តល់នូវដំណើរការខ្ពស់ និងដំណើរការលើផ្នែករឹងម៉ាស៊ីនមេ ឬស្ថានីយការងារ។ Já ដូចជា Effective 2B និង 4B ផ្តល់អាទិភាពដល់ប្រសិទ្ធភាពសម្រាប់ការប្រតិបត្តិលើឧបករណ៍គែម។
គំរូ 26B MoE ធ្វើសកម្មភាពត្រឹមតែ 3.8 ពាន់លានប៉ារ៉ាម៉ែត្រកំឡុងពេលសន្និដ្ឋាន ដោយកាត់បន្ថយភាពយឺតយ៉ាវ និងការប្រើប្រាស់ថាមពល។ វ៉ារ្យ៉ង់ Todas គ្រប់គ្រងជាង 140 ភាសា។ អ្នកអភិវឌ្ឍន៍អាចទាញយកទម្ងន់ពេញលេញនៅលើវេទិកាដូចជា Hugging Face, Kaggle, និង Ollama។
ភាពអាចរកបានភ្លាមៗនៅទូទាំងវេទិកា
ម៉ូដែល 31B និង 26B ធំជាងមាននៅក្នុង AI Studio និង Google។ កំណែ E4B និង E2B ទម្ងន់ស្រាលអាចចូលប្រើបានក្នុង AI Edge Gallery។ ទម្ងន់ពេញលេញអាចរកបានសម្រាប់ទាញយកភ្លាមៗពីឃ្លាំងសាធារណៈ។
ក្រុមហ៊ុន និងអ្នកស្រាវជ្រាវអាចបញ្ចូលគំរូទៅក្នុងកម្មវិធីក្នុងស្រុកដោយមិនចាំបាច់ចំណាយ API ដដែលៗ។ Google ក៏បានចង្អុលបង្ហាញថាវ៉ារ្យ៉ង់ 2B និង 4B នឹងបម្រើជាមូលដ្ឋានសម្រាប់ Gemini Nano 4 នាពេលខាងមុខនៅលើឧបករណ៍ Android។
ផលប៉ះពាល់នៃការប្តូរទៅអាជ្ញាប័ណ្ណ Apache 2.0
ការអនុម័តអាជ្ញាប័ណ្ណ Apache 2.0 លុបបំបាត់ការរឹតបន្តឹងនៃអាជ្ញាប័ណ្ណផ្ទាល់ខ្លួនពីមុន ដែលរួមបញ្ចូលគោលការណ៍មិនប្រើប្រាស់ដែលអាចធ្វើបច្ចុប្បន្នភាពជាឯកតោភាគី។ Desenvolvedores ទទួលបានការគ្រប់គ្រងកាន់តែខ្លាំងលើទិន្នន័យ និងការដាក់ពង្រាយអាជីវកម្ម។
ការផ្លាស់ប្តូរនេះគួរតែលើកទឹកចិត្តដល់ការបង្កើតគម្រោងថ្មីនៅក្នុងសហគមន៍ ដែលគេស្គាល់ក្រៅផ្លូវការថា Gemmaverse។ ការផ្តោតទៅលើការប្រតិបត្តិក្នុងមូលដ្ឋានពង្រឹងយុទ្ធសាស្រ្តនៃការផ្តល់ជម្រើសបើកចំហចំពោះគំរូបិទនៃបន្ទាត់ Gemini។
ការបង្កើនប្រសិទ្ធភាពសម្រាប់ផ្នែករឹងជាក់លាក់
កំណែទម្ងន់ស្រាលត្រូវបានបង្កើតឡើងក្នុងភាពជាដៃគូជាមួយក្រុមហ៊ុនផលិតបន្ទះឈីបចល័ត។ Elas ផ្តល់ភាពយឺតយ៉ាវជិតសូន្យក្នុងកិច្ចការប្រចាំថ្ងៃ ខណៈពេលដែលរក្សាបាននូវការប្រើប្រាស់ថ្មដែលកាត់បន្ថយ។ Testes បង្ហាញពីដំណើរការល្អនៅលើកាតដូចជា Raspberry Pi និង Jetson Nano។
ម៉ូដែលធំ ៗ រក្សាប្រសិទ្ធភាពសូម្បីតែនៅក្នុងការកំណត់រចនាសម្ព័ន្ធក្រាស់ឬ MoE ។ ការកាត់បន្ថយភាពយឺតយ៉ាវក្នុងដំណើរការក្នុងស្រុកតំណាងឱ្យការទទួលបានជាក់ស្តែងសម្រាប់កម្មវិធីដែលទាមទារភាពឯកជន និងការឆ្លើយតបរហ័សដោយមិនមានការតភ្ជាប់ថេរទៅម៉ាស៊ីនមេ។
គាំទ្រវិធីសាស្ត្របញ្ចូលច្រើន។
បន្ថែមពីលើអត្ថបទ ម៉ូដែលដំណើរការសំឡេង និងរូបភាពដើម។ ការទទួលស្គាល់ការនិយាយធ្វើអោយប្រសើរឡើងជាង Gemma 3. សមត្ថភាពពហុមុខងារបើកលទ្ធភាពសម្រាប់កម្មវិធីដែលរួមបញ្ចូលគ្នានូវប្រភេទទិន្នន័យផ្សេងៗគ្នាក្នុងពេលវេលាជាក់ស្តែង។
អ្នកអភិវឌ្ឍន៍អាចបង្កើតគំរូលំហូរភ្នាក់ងារដោយផ្ទាល់នៅក្នុង AI Core Developer Preview ដោយប្រើវ៉ារ្យ៉ង់ទម្ងន់ស្រាល។ Essas ការអនុវត្តគឺត្រូវគ្នានឹងអនាគត Gemini Nano ៤.
គ្រួសារ Gemma 4 ពង្រឹងការប្តេជ្ញាចិត្តរបស់ Google ក្នុងការផ្តល់ជូននូវម៉ូដែលបើកចំហជាមួយនឹងទម្ងន់ដែលអាចចូលដំណើរការបាន។ ការរួមបញ្ចូលគ្នានៃការអនុវត្តប្រសើរឡើង ការផ្តល់អាជ្ញាប័ណ្ណអនុញ្ញាត និងការគាំទ្រផ្នែករឹងចម្រុះ ពង្រីកជម្រើសសម្រាប់អ្នកដែលកំពុងស្វែងរកដំណោះស្រាយ AI ដែលអាចដំណើរការបានក្នុងមូលដ្ឋាន។