Apple reveló este lunes (8) la tercera generación de sus Apple Foundation Models (AFM), que impulsan la siguiente fase de Apple Intelligence. La familia incluye cinco modelos personalizados, con importantes avances en el procesamiento en el dispositivo y en la nube privada, en colaboración con Google y NVIDIA.
Los nuevos modelos potencian Siri más capaz, herramientas inteligentes en aplicaciones cotidianas y funciones multimodales como voces expresivas y edición avanzada de imágenes. Todo ello manteniendo la privacidad como principio central, con datos procesados sin almacenarlos ni compartirlos.
Innovaciones en dispositivos: eficiencia con arquitectura dispersa
Dos modelos se ejecutan directamente en los dispositivos. AFM 3 Core es la evolución del modelo denso con 3 mil millones de parámetros, con ganancias de calidad. Lo más destacado es el AFM 3 Core Advanced, con 20 mil millones de parámetros, multimodal de forma nativa y optimizado para chips Apple Silicon más avanzados.
La gran novedad está en la arquitectura. En lugar de cargar todos los pesos en la RAM (DRAM), el modelo utiliza poda de seguimiento de instrucciones (IFP). El modelo completo se almacena en una memoria flash (NAND) y activa sólo entre 1 y 4 mil millones de parámetros por solicitud, dependiendo de la complejidad. Esto resuelve las limitaciones tradicionales del hardware de consumo y permite la escalabilidad sin comprometer la latencia o el consumo de energía.
Este enfoque difiere de la mezcla de expertos (MoE) convencional, que intercambia pesos token por token. Aquí, la decisión de enrutamiento se toma de forma rápida, con expertos compartidos siempre activos y otros cargados solo cuando es necesario.
Modelos de nube privada y asociaciones estratégicas
Tres modelos operan en Private Cloud Compute (PCC), lo que garantiza que Apple o terceros nunca almacenen ni accedan a los datos del usuario:
- AFM 3 Cloud: optimizado para velocidad y rendimiento general.
- ADM 3 Cloud (Imagen): enfocado a la generación y edición de imágenes, incluyendo Image Playground y Genmoji.
- AFM 3 Cloud Pro: el más completo, para tareas complejas con agentes y razonamiento avanzado.
Para el modelo Pro, Apple ha ampliado PCC a las GPU NVIDIA en Google Cloud, manteniendo las mismas garantías de privacidad a través de la informática confidencial. Esta colaboración combina la arquitectura propia de Apple con tecnologías de Google (basadas en Gemini) y hardware de NVIDIA.
Qué cambios en la práctica para usuarios y desarrolladores
La tercera generación supone un salto respecto a las generaciones anteriores, especialmente en multimodalidad y eficiencia energética. Funciones como dictado más preciso, voces expresivas y edición de fotografías inteligente llegan con una menor dependencia de la nube para tareas comunes.
No todos los dispositivos compatibles con Apple Intelligence recibirán el modelo Avanzado completo; requiere hardware de alta gama como el iPhone 17 Pro o Mac con M4 o superior. Los modelos más antiguos utilizarán AFM 3 Core base o en la nube.
Esta estrategia equilibra el rendimiento local (rápido y privado) con la capacidad de la nube para casos más exigentes, diferenciándose de los enfoques totalmente en la nube de la competencia.
Los desarrolladores obtienen acceso a estas capacidades a través de API, con una profunda integración en los sistemas operativos.
Apple debería poner las nuevas funciones a disposición de los desarrolladores pronto para que las prueben, con un lanzamiento para los usuarios en el otoño (primavera en Brasil), a través de actualizaciones gratuitas de iOS, iPadOS y macOS.