Apple mengungkapkan Senin ini (8) generasi ketiga Apple Foundation Models (AFM), yang mendorong fase berikutnya dari Apple Intelligence. Keluarga ini mencakup lima model khusus, dengan kemajuan signifikan dalam pemrosesan cloud pada perangkat dan pribadi, bekerja sama dengan Google dan NVIDIA.
Model-model baru ini mendukung Siri yang lebih mumpuni, alat pintar dalam aplikasi sehari-hari, dan fitur multimodal seperti suara ekspresif dan pengeditan gambar tingkat lanjut. Semuanya dengan tetap menjaga privasi sebagai prinsip utama, dengan data diproses tanpa penyimpanan atau pembagian.
Inovasi Perangkat: Efisiensi dengan Arsitektur Jarang
Dua model dijalankan langsung di perangkat. AFM 3 Core adalah evolusi model padat dengan 3 miliar parameter, dengan peningkatan kualitas. Yang paling menonjol adalah AFM 3 Core Advanced, dengan 20 miliar parameter, multimodal asli dan dioptimalkan untuk chip Apple Silicon yang lebih canggih.
Berita besarnya ada pada arsitektur. Alih-alih memuat semua bobot ke dalam RAM (DRAM), model ini menggunakan pemangkasan mengikuti instruksi (IFP). Model lengkap disimpan dalam memori flash (NAND) dan hanya mengaktifkan 1 hingga 4 miliar parameter per permintaan, bergantung pada kompleksitas. Hal ini mengatasi keterbatasan perangkat keras konsumen tradisional dan memungkinkan skalabilitas tanpa mengorbankan latensi atau konsumsi daya.
Pendekatan ini berbeda dengan Mixture-of-Experts (MoE) konvensional, yang menukar bobot token dengan token. Di sini, keputusan perutean dibuat secara cepat, dengan pakar bersama selalu aktif dan pakar lainnya dimuat hanya jika diperlukan.
Model cloud pribadi dan kemitraan strategis
Tiga model beroperasi pada Private Cloud Compute (PCC), yang memastikan bahwa data pengguna tidak pernah disimpan atau diakses oleh Apple atau pihak ketiga:
- AFM 3 Cloud: Dioptimalkan untuk kecepatan dan kinerja secara keseluruhan.
- ADM 3 Cloud (Gambar): berfokus pada pembuatan dan pengeditan gambar, termasuk Image Playground dan Genmoji.
- AFM 3 Cloud Pro: terlengkap, untuk tugas kompleks dengan agen dan penalaran tingkat lanjut.
Untuk model Pro, Apple telah memperluas PCC ke GPU NVIDIA di Google Cloud, menjaga jaminan privasi yang sama melalui komputasi rahasia. Kolaborasi ini menggabungkan arsitektur milik Apple dengan teknologi Google (berdasarkan Gemini) dan perangkat keras NVIDIA.
Perubahan apa yang terjadi dalam praktik bagi pengguna dan pengembang
Generasi ketiga merupakan lompatan maju dibandingkan generasi sebelumnya, terutama dalam multimodalitas dan efisiensi energi. Fitur-fitur seperti dikte yang lebih akurat, suara ekspresif, dan pengeditan foto yang cerdas hadir dengan lebih sedikit ketergantungan pada cloud untuk tugas-tugas umum.
Tidak semua perangkat yang mendukung Apple Intelligence akan menerima model Lanjutan penuh — perangkat ini memerlukan perangkat keras kelas atas seperti iPhone 17 Pro atau Mac dengan M4 atau lebih tinggi. Model lama akan menggunakan AFM 3 Core basis atau cloud.
Strategi ini menyeimbangkan kinerja lokal (cepat dan pribadi) dengan kapasitas cloud untuk kasus-kasus yang lebih menuntut, sehingga membedakannya dari pendekatan all-cloud pesaing.
Pengembang mendapatkan akses terhadap kemampuan ini melalui API, dengan integrasi mendalam ke dalam sistem operasi.
Apple akan segera menyediakan fitur-fitur baru untuk pengujian pengembang, dengan peluncuran untuk pengguna pada musim gugur (musim semi di Brasil), melalui pembaruan iOS, iPadOS, dan macOS gratis.