Haberler (TR)

Google, Apache 2.0 lisansı ve yerel cihazlar için şablonlar içeren Gemma 4’ü duyurdu

Gemma 4
Foto: Gemma 4 - Google

Google, bu Perşembe günü, mevcut ağırlıklara sahip yeni açık kaynaklı yapay zeka modellerinden oluşan Gemma 4 ailesini duyurdu. Güncelleme, bir yıldan fazla bir süre önce Gemma 3’ün piyasaya sürülmesinden bu yana serideki ilk büyük ilerlemeyi temsil ediyor. Geliştiriciler artık önceki sürümlerde mevcut olan ticari kısıtlamaları ortadan kaldıran Apache 2.0 lisansına sahiptir.

Modeller, en büyük varyantlarda 256 bin jetona ulaşan bağlam pencereleriyle metin, ses ve görüntü girişini destekliyor. Eles, öncelikle tüketici GPU’ları ve mobil cihazlar da dahil olmak üzere uygun fiyatlı donanımlarda yerel olarak çalışacak şekilde tasarlanmıştır. Lisans değişikliği, Google’in getirdiği ek yükümlülükler olmaksızın ticari kullanımı kolaylaştırır.

Akıl yürütme ve çok modlu teknik iyileştirmeler

Yeni modeller önceki nesle kıyasla akıl yürütme, matematik ve talimatları takip etme konularında önemli ilerlemeler sağlıyor. Eles, işlev çağırma ve JSON yapılandırılmış çıktı oluşturma için yerel destek içerir ve bu da aracı iş akışlarına fayda sağlar.

Kod işleme yeteneği, çevrimdışı ortamlar için optimize edilerek Gemini Pro gibi bulut hizmetleriyle karşılaştırılabilir bir performans elde edilmiştir. Görsel giriş desteği, optik karakter tanıma ve grafik yorumlama gibi görevlerin daha yüksek doğrulukla gerçekleştirilmesine olanak sağlar.

  • Varyantlar arasında akıllı telefonlarda düşük gecikme süresi için optimize edilmiş Effective 2B ve 4B modelleri yer alıyor.
  • Qualcomm ve MediaTek ile işbirliği, mobil cihazlara entegrasyonu kolaylaştırır.
  • Daha büyük modeller, niceleme olmadan tek bir 80 GB H100 GPU üzerinde çalışır.

Boyut çeşitleri ve enerji verimliliği

Gemma 4 ailesinin dört ana boyut konfigürasyonu vardır. Experts ve 31B Dense’ün 26B Mixture sürümleri, yüksek performans sunar ve sunucu veya iş istasyonu donanımında çalışır. Já, Effective 2B ve 4B olarak uç cihazlarda yürütme verimliliğine öncelik verir.

26B MoE modeli, çıkarım sırasında yalnızca 3,8 milyar parametreyi etkinleştirerek gecikmeyi ve güç tüketimini azaltır. Todas çeşidi 140’tan fazla dili destekler. Geliştiriciler tam ağırlıkları Hugging Face, Kaggle ve Ollama gibi platformlardan indirebilirler.

Platformlar arasında anında kullanılabilirlik

Daha büyük 31B ve 26B modelleri AI Studio ve Google’de mevcuttur. Hafif E4B ve E2B versiyonlarına AI Edge Gallery’ten erişilebilir. Tam ağırlıklar, genel depolardan anında indirilebilir.

Şirketler ve araştırmacılar, yinelenen API maliyetleri olmadan modelleri yerel uygulamalara entegre edebilirler. Google ayrıca 2B ve 4B varyantlarının, Android cihazlarda gelecek Gemini Nano 4 için temel oluşturacağını belirtti.

Apache 2.0 lisansına geçişin etkisi

Apache 2.0 lisansının benimsenmesi, tek taraflı olarak güncellenebilir kullanmama politikaları içeren önceki özel lisansın kısıtlamalarını ortadan kaldırır. Desenvolvedores Veriler ve iş dağıtımları üzerinde daha fazla kontrol sahibi olun.

Bu değişiklik, toplulukta gayri resmi olarak Gemmaverse olarak bilinen yeni projelerin oluşturulmasını teşvik etmelidir. Yerel uygulamaya odaklanma, Gemini serisinin kapalı modellerine açık alternatifler sunma stratejisini güçlendirir.

Belirli donanımlar için optimizasyonlar

Hafif versiyonlar mobil çip üreticileriyle ortaklaşa geliştirildi. Elas, günlük görevlerde sıfıra yakın gecikme sağlarken pil tüketimini de azaltır. Testes, Raspberry Pi ve Jetson Nano gibi kartlarda iyi performansı gösterir.

Daha büyük modeller yoğun konfigürasyonda veya MoE’de bile verimliliği korur. Yerel işlemlerde gecikmenin azaltılması, sunuculara sürekli bağlantı olmadan gizlilik ve hızlı yanıt gerektiren uygulamalar için pratik bir kazanç anlamına gelir.

Çoklu giriş yöntemlerini destekleyin

Modeller, metne ek olarak ses ve görüntüleri de yerel olarak işler. Konuşma tanıma Gemma’dan fazla gelişme gösteriyor 3. Çoklu mod yeteneği, farklı veri türlerini gerçek zamanlı olarak birleştiren uygulamalara yönelik olasılıkların önünü açıyor.

Geliştiriciler, hafif değişkenleri kullanarak doğrudan AI Core Developer Preview’da ajan akışlarının prototipini oluşturabilir. Essas uygulamaları geleceğe dönük Gemini Nano 4 ile uyumludur.

Gemma 4 ailesi, Google’in erişilebilir ağırlıklara sahip açık modeller sunma konusundaki kararlılığını güçlendiriyor. İyileştirilmiş performans, izin verilen lisanslama ve çeşitli donanım desteğinin birleşimi, yerel olarak çalıştırılabilir yapay zeka çözümleri arayanlar için seçenekleri genişletir.