Google mengumumkan Gemma 4 dengan lesen dan templat Apache 2.0 untuk peranti tempatan
Google mengumumkan Khamis ini keluarga Gemma 4, yang terdiri daripada model kecerdasan buatan sumber terbuka baharu dengan pemberat yang tersedia. Kemas kini mewakili kemajuan besar pertama dalam barisan sejak pelancaran Gemma 3 lebih setahun yang lalu. Pembangun kini mempunyai lesen Apache 2.0, yang mengalih keluar sekatan komersial yang terdapat dalam versi sebelumnya.
Model menyokong input teks, audio dan imej, dengan tetingkap konteks yang mencapai 256 ribu token dalam varian terbesar. Eles direka terutamanya untuk dijalankan secara tempatan pada perkakasan mampu milik, termasuk GPU pengguna dan peranti mudah alih. Perubahan lesen memudahkan penggunaan komersial tanpa obligasi tambahan yang dikenakan oleh Google.
Penambahbaikan teknikal dalam penaakulan dan multimodal
Model baharu ini membawa kemajuan yang ketara dalam penaakulan, matematik dan arahan mengikut jika dibandingkan dengan generasi sebelumnya. Eles menggabungkan sokongan asli untuk panggilan fungsi dan penjanaan output berstruktur JSON, yang memanfaatkan aliran kerja agen.
Keupayaan pemprosesan kod telah dioptimumkan untuk persekitaran luar talian, mencapai prestasi yang setanding dengan perkhidmatan awan seperti Gemini Pro. Sokongan input visual membolehkan tugas seperti pengecaman aksara optik dan tafsiran graf dengan lebih ketepatan.
- Varian termasuk model Effective 2B dan 4B yang dioptimumkan untuk kependaman rendah pada telefon pintar.
- Kerjasama dengan Qualcomm dan MediaTek memudahkan penyepaduan pada peranti mudah alih.
- Model yang lebih besar dijalankan pada satu GPU 80GB H100 tanpa pengkuantitian.
Varian saiz dan kecekapan tenaga
Keluarga Gemma 4 mempunyai empat konfigurasi saiz utama. Versi 26B Mixture daripada Experts dan 31B Dense menawarkan prestasi tinggi dan dijalankan pada perkakasan pelayan atau stesen kerja. Já sebagai Effective 2B dan 4B mengutamakan kecekapan untuk pelaksanaan pada peranti tepi.
Model 26B MoE mengaktifkan hanya 3.8 bilion parameter semasa inferens, mengurangkan kependaman dan penggunaan kuasa. Todas varian mengendalikan lebih 140 bahasa. Pembangun boleh memuat turun pemberat penuh pada platform seperti Hugging Face, Kaggle dan Ollama.
Ketersediaan segera merentas platform
Model 31B dan 26B yang lebih besar tersedia dalam AI Studio dan Google. Versi E4B dan E2B yang ringan boleh diakses dalam AI Edge Gallery. Pemberat penuh tersedia untuk muat turun segera daripada repositori awam.
Syarikat dan penyelidik boleh menyepadukan model ke dalam aplikasi tempatan tanpa kos API berulang. Google juga menunjukkan bahawa varian 2B dan 4B akan menjadi asas untuk Gemini Nano 4 yang akan datang pada peranti Android.
Kesan bertukar kepada lesen Apache 2.0
Penggunaan lesen Apache 2.0 menghapuskan sekatan lesen tersuai sebelumnya, yang termasuk dasar larangan penggunaan boleh dikemas kini secara unilateral. Desenvolvedores Dapatkan kawalan yang lebih besar ke atas data dan penempatan perniagaan.
Perubahan ini seharusnya menggalakkan penciptaan projek baharu dalam komuniti, yang dikenali secara tidak rasmi sebagai Gemmaverse. Tumpuan pada pelaksanaan tempatan mengukuhkan strategi menawarkan alternatif terbuka kepada model tertutup barisan Gemini.
Pengoptimuman untuk perkakasan tertentu
Versi ringan telah dibangunkan dengan kerjasama pengeluar cip mudah alih. Elas menyampaikan kependaman hampir sifar dalam tugas harian sambil mengekalkan penggunaan bateri yang berkurangan. Testes menunjukkan prestasi yang baik pada kad seperti Raspberry Pi dan Jetson Nano.
Model yang lebih besar mengekalkan kecekapan walaupun dalam konfigurasi padat atau MoE. Mengurangkan kependaman dalam pemprosesan tempatan mewakili keuntungan praktikal untuk aplikasi yang memerlukan privasi dan tindak balas pantas tanpa sambungan berterusan ke pelayan.
Menyokong pelbagai modaliti input
Selain teks, model memproses audio dan imej secara asli. Pengecaman pertuturan bertambah baik berbanding Gemma 3. Keupayaan pelbagai mod membuka kemungkinan untuk aplikasi yang menggabungkan jenis data yang berbeza dalam masa nyata.
Pembangun boleh prototaip aliran agenik terus dalam AI Core Developer Preview menggunakan varian ringan. Essas pelaksanaan adalah serasi ke hadapan dengan masa hadapan Gemini Nano 4.
Keluarga Gemma 4 mengukuhkan komitmen Google untuk menawarkan model terbuka dengan berat yang boleh diakses. Gabungan prestasi yang dipertingkatkan, pelesenan permisif dan sokongan perkakasan yang pelbagai memperluaskan pilihan bagi mereka yang mencari penyelesaian AI boleh jalan tempatan.
Veja Tambem em News (MS)
Penurunan harga PlayStation 5 Pro mempercepatkan jualan runcit digital dan menghapuskan stok global
Kemas kini sistem Apple baharu mengoptimumkan pengurusan tugasan segera untuk pengguna iPhone
Kebocoran butiran perkakasan PlayStation mudah alih baharu dengan grafik unggul kepada Xbox Series S
Oppo secara rasmi melancarkan Find X9 Ultra di seluruh dunia dengan kanta Hasselblad dan bateri yang teguh
Edisi baharu telefon pintar boleh lipat membawa kemasan emas kepada pesaing Sukan Musim Sejuk
Tim Cook mendedahkan prototaip iPhone dan iPod baharu dalam sambutan ulang tahun kelima puluh Apple
Leak mendedahkan Lords of the Fallen dan Sword Art Online dalam katalog PS Plus Essential April
Sistem Android menerima integrasi Gemini Nano 4 asli untuk pemprosesan luar talian pada telefon pintar
Samsung mengemas kini modul QuickStar dan mengembangkan kawalan visual panel dalam antara muka One UI 8.5
Pengilang mengemas kini penderia foto telefon pintar premium dengan fokus pada zum dan kecerdasan buatan
Apple membangunkan iPhone boleh lipat baharu dan menyediakan edisi khas untuk meraikan 20 tahun jenama itu