В этот понедельник (8) компания Apple представила третье поколение своих моделей Apple Foundation (AFM), которые лежат в основе следующего этапа разработки Apple Intelligence. Семейство включает пять специальных моделей со значительными улучшениями в области обработки данных на устройстве и в частном облаке, созданных в сотрудничестве с Google и NVIDIA.
Новые модели оснащены более мощными функциями Siri, интеллектуальными инструментами в повседневных приложениях и мультимодальными функциями, такими как выразительный голос и расширенное редактирование изображений. При этом конфиденциальность является основным принципом, при этом данные обрабатываются без хранения или совместного использования.
Инновации в устройствах: эффективность с разреженной архитектурой
Две модели работают непосредственно на устройствах. AFM 3 Core — это эволюция плотной модели с 3 миллиардами параметров с улучшением качества. Изюминкой является процессор AFM 3 Core Advanced с 20 миллиардами параметров, изначально мультимодальный и оптимизированный для более совершенных чипов Apple Silicon.
Большие новости в архитектуре. Вместо загрузки всех весов в ОЗУ (DRAM) модель использует сокращение по инструкциям (IFP). Полная модель хранится во флэш-памяти (NAND) и активирует только от 1 до 4 миллиардов параметров за запрос, в зависимости от сложности. Это устраняет традиционные ограничения потребительского оборудования и обеспечивает масштабируемость без ущерба для задержек и энергопотребления.
Этот подход отличается от обычного подхода «Смесь экспертов» (MoE), в котором весы обмениваются токенами. Здесь решение о маршрутизации принимается мгновенно: общие эксперты всегда активны, а другие загружаются только при необходимости.
Модели частного облака и стратегическое партнерство
Три модели работают на базе вычислений в частном облаке (PCC), гарантируя, что пользовательские данные никогда не будут храниться и не будут доступны Apple или третьим лицам:
- Облако AFM 3: оптимизировано по скорости и общей производительности.
- ADM 3 Cloud (Image): ориентирован на создание и редактирование изображений, включая Image Playground и Genmoji.
- AFM 3 Cloud Pro: наиболее полный, для сложных задач с агентами и расширенными рассуждениями.
Для модели Pro Apple распространила PCC на графические процессоры NVIDIA в Google Cloud, сохранив те же гарантии конфиденциальности за счет конфиденциальных вычислений. Это сотрудничество сочетает в себе собственную архитектуру Apple с технологиями Google (на базе Gemini) и оборудованием NVIDIA.
Что меняется на практике для пользователей и разработчиков
Третье поколение представляет собой шаг вперед по сравнению с предыдущими поколениями, особенно в области мультимодальности и энергоэффективности. Такие функции, как более точная диктовка, выразительный голос и интеллектуальное редактирование фотографий, теперь меньше зависят от облака при выполнении повседневных задач.
Не все устройства, поддерживающие Apple Intelligence, получат полную модель Advanced — для этого требуется высокопроизводительное оборудование, такое как iPhone 17 Pro или компьютеры Mac с M4 или новее. Старые модели будут использовать базовый или облачный процессор AFM 3 Core.
Эта стратегия сочетает в себе локальную производительность (быструю и конфиденциальную) с облачными возможностями для более требовательных случаев, отличаясь от полностью облачных подходов конкурентов.
Разработчики получают доступ к этим возможностям через API-интерфейсы с глубокой интеграцией в операционные системы.
Apple должна вскоре сделать новые функции доступными для тестирования разработчиками, а запуск для пользователей состоится осенью (весной в Бразилии) посредством бесплатных обновлений iOS, iPadOS и macOS.