A Apple revelou nesta segunda-feira (8) a terceira geração de seus Apple Foundation Models (AFM), que impulsionam a próxima fase da Apple Intelligence. A família inclui cinco modelos personalizados, com avanços significativos em processamento no dispositivo e na nuvem privada, em colaboração com Google e NVIDIA.
Os novos modelos alimentam uma Siri mais capaz, ferramentas inteligentes em aplicativos do dia a dia e recursos multimodais, como vozes expressivas e edição avançada de imagens. Tudo mantendo a privacidade como princípio central, com dados processados sem armazenamento ou compartilhamento.
Inovações no dispositivo: eficiência com arquitetura esparsa
Dois modelos rodam diretamente nos aparelhos. O AFM 3 Core é a evolução do modelo denso de 3 bilhões de parâmetros, com ganho de qualidade. Já o destaque é o AFM 3 Core Advanced, de 20 bilhões de parâmetros, nativamente multimodal e otimizado para chips Apple Silicon mais avançados.
A grande novidade está na arquitetura. Em vez de carregar todos os pesos na memória RAM (DRAM), o modelo usa poda por seguimento de instruções (IFP). O modelo completo fica armazenado na memória flash (NAND) e ativa apenas 1 a 4 bilhões de parâmetros por solicitação, dependendo da complexidade. Isso resolve limitações tradicionais de hardware de consumo e permite escalabilidade sem comprometer latência ou consumo de energia.
Essa abordagem difere de Mixture-of-Experts (MoE) convencionais, que trocam pesos token por token. Aqui, a decisão de roteamento é feita por prompt inteiro, com especialistas compartilhados sempre ativos e outros carregados somente quando necessário.
Modelos na nuvem privada e parcerias estratégicas
Três modelos operam no Private Cloud Compute (PCC), garantindo que os dados do usuário nunca sejam armazenados ou acessados pela Apple ou terceiros:
- AFM 3 Cloud: otimizado para velocidade e desempenho geral.
- ADM 3 Cloud (Imagem): focado em geração e edição de imagens, incluindo Image Playground e Genmoji.
- AFM 3 Cloud Pro: o mais completo, para tarefas complexas com agentes e raciocínio avançado.
Para o modelo Pro, a Apple estendeu o PCC para GPUs NVIDIA no Google Cloud, mantendo as mesmas garantias de privacidade por meio de confidential computing. Essa colaboração combina a arquitetura própria da Apple com tecnologias do Google (baseadas em Gemini) e hardware da NVIDIA.
O que muda na prática para usuários e desenvolvedores
A terceira geração representa um salto em relação às gerações anteriores, especialmente em multimodalidade e eficiência energética. Recursos como ditado mais preciso, vozes expressivas e edição inteligente de fotos chegam com menor dependência de nuvem para tarefas comuns.
Nem todos os dispositivos compatíveis com Apple Intelligence receberão o modelo Advanced completo — ele exige hardware topo de linha, como iPhone 17 Pro ou Macs com M4 ou superior. Modelos mais antigos usarão o AFM 3 Core básico ou nuvem.
Essa estratégia equilibra desempenho local (rápido e privado) com capacidade de nuvem para casos mais exigentes, diferenciando-se de abordagens totalmente na nuvem de concorrentes.
Os desenvolvedores ganham acesso a essas capacidades via APIs, com integração profunda nos sistemas operacionais.
A Apple deve disponibilizar as novidades para testes de desenvolvedores em breve, com lançamento para usuários no outono (primavera no Brasil), via atualizações gratuitas de iOS, iPadOS e macOS.