Google mengumumkan Gemma 4 dengan lisensi dan template Apache 2.0 untuk perangkat lokal

Gemma 4

Gemma 4 - Google

Google Kamis ini mengumumkan keluarga Gemma 4, yang terdiri dari model kecerdasan buatan sumber terbuka baru dengan bobot yang tersedia. Pembaruan ini mewakili kemajuan besar pertama sejak peluncuran Gemma 3 lebih dari setahun yang lalu. Pengembang sekarang memiliki lisensi Apache 2.0, yang menghilangkan batasan komersial yang ada di versi sebelumnya.

Model tersebut mendukung input teks, audio dan gambar, dengan jendela konteks yang mencapai 256 ribu token dalam varian terbesar. Eles terutama dirancang untuk berjalan secara lokal pada perangkat keras yang terjangkau, termasuk GPU konsumen dan perangkat seluler. Perubahan lisensi memfasilitasi penggunaan komersial tanpa kewajiban tambahan yang dikenakan oleh Google.

Peningkatan teknis dalam penalaran dan multimodal

Model-model baru ini membawa kemajuan signifikan dalam penalaran, matematika, dan mengikuti instruksi jika dibandingkan dengan generasi sebelumnya. Eles menggabungkan dukungan asli untuk pemanggilan fungsi dan pembuatan keluaran terstruktur JSON, yang menguntungkan alur kerja agen.

Kemampuan pemrosesan kode telah dioptimalkan untuk lingkungan offline, mencapai kinerja yang sebanding dengan layanan cloud seperti Gemini Pro. Dukungan input visual memungkinkan tugas-tugas seperti pengenalan karakter optik dan interpretasi grafik dengan akurasi lebih tinggi.

  • Variannya mencakup model Effective 2B dan 4B yang dioptimalkan untuk latensi rendah pada ponsel cerdas.
  • Kolaborasi dengan Qualcomm dan MediaTek memfasilitasi integrasi pada perangkat seluler.
  • Model yang lebih besar berjalan pada satu GPU H100 80GB tanpa kuantisasi.

Varian ukuran dan efisiensi energi

Keluarga Gemma 4 memiliki empat konfigurasi ukuran utama. Versi 26B Mixture dari Experts dan 31B Dense menawarkan kinerja tinggi dan dijalankan pada perangkat keras server atau stasiun kerja. Já sebagai Effective 2B dan 4B memprioritaskan efisiensi untuk eksekusi pada perangkat edge.

Model 26B MoE mengaktifkan hanya 3,8 miliar parameter selama inferensi, sehingga mengurangi latensi dan konsumsi daya. Varian Todas menangani lebih dari 140 bahasa. Pengembang dapat mengunduh bobot lengkap pada platform seperti Hugging Face, Kaggle, dan Ollama.

Ketersediaan langsung di seluruh platform

Model 31B dan 26B yang lebih besar tersedia dalam AI Studio dan Google. Versi E4B dan E2B yang ringan dapat diakses di AI Edge Gallery. Bobot lengkap tersedia untuk diunduh langsung dari repositori publik.

Perusahaan dan peneliti dapat mengintegrasikan model ke dalam aplikasi lokal tanpa biaya API berulang. Google juga menunjukkan bahwa varian 2B dan 4B akan menjadi dasar untuk Gemini Nano 4 mendatang pada perangkat Android.

Dampak peralihan ke lisensi Apache 2.0

Penerapan lisensi Apache 2.0 menghilangkan batasan lisensi khusus sebelumnya, yang mencakup kebijakan larangan penggunaan yang dapat diperbarui secara sepihak. Desenvolvedores Dapatkan kontrol lebih besar atas data dan penerapan bisnis.

Perubahan ini harus mendorong terciptanya proyek baru di masyarakat, yang secara informal dikenal sebagai Gemmaverse. Fokus pada pelaksanaan lokal memperkuat strategi menawarkan alternatif terbuka terhadap model tertutup dari jalur Gemini.

Pengoptimalan untuk perangkat keras tertentu

Versi ringannya dikembangkan melalui kemitraan dengan produsen chip seluler. Elas memberikan latensi mendekati nol dalam tugas sehari-hari dengan tetap menjaga konsumsi baterai tetap rendah. Testes menunjukkan kinerja yang baik pada kartu seperti Raspberry Pi dan Jetson Nano.

Model yang lebih besar mempertahankan efisiensi bahkan dalam konfigurasi padat atau MoE. Mengurangi latensi dalam pemrosesan lokal merupakan keuntungan praktis untuk aplikasi yang memerlukan privasi dan respons cepat tanpa koneksi konstan ke server.

Mendukung berbagai modalitas masukan

Selain teks, model memproses audio dan gambar secara asli. Pengenalan ucapan meningkat dibandingkan Gemma 3. Kemampuan multimodal membuka kemungkinan untuk aplikasi yang menggabungkan berbagai jenis data secara real time.

Pengembang dapat membuat prototipe aliran agen langsung di AI Core Developer Preview menggunakan varian ringan. Essas implementasi kompatibel ke depan dengan masa depan Gemini Nano 4.

Rangkaian Gemma 4 memperkuat komitmen Google untuk menawarkan model terbuka dengan bobot yang dapat diakses. Kombinasi peningkatan kinerja, lisensi yang permisif, dan beragam dukungan perangkat keras memperluas pilihan bagi mereka yang mencari solusi AI yang dapat dijalankan secara lokal.