Notizie (IT)

Arm annuncia CPU AGI con un massimo di 136 core per l’infrastruttura AI degli agenti nei data center

inteligência artificial
Foto: inteligência artificial - Summit Art Creations/Shutterstock.com

Arm ha introdotto la CPU AGI Arm, la sua prima soluzione proprietaria in silicio pronta per la produzione costruita sulla piattaforma Neoverse. Il processore è stato sviluppato per supportare la crescente domanda di infrastrutture AI per agenti, in cui i sistemi coordinano le attività in modo autonomo e continuo su scala globale.

Questa iniziativa segna una significativa espansione dell’offerta dell’azienda, che ora offre processori completi oltre a licenze IP e sottosistemi. L’iniziativa risponde alle richieste dei partner che cercano piattaforme Arm mature per una rapida implementazione nei data center su vasta scala.

L’ascesa dell’intelligenza artificiale degli agenti cambia il ruolo centrale della CPU nelle infrastrutture moderne. Sistemas I sistemi di intelligenza artificiale funzionano senza problemi, con agenti software che interagiscono con più modelli ed eseguono decisioni in tempo reale senza un costante intervento umano.

In questa configurazione, la CPU gestisce l’orchestrazione dell’acceleratore, l’allocazione della memoria, l’archiviazione e lo spostamento dei dati tra migliaia di attività distribuite. La nuova architettura cerca di eliminare i colli di bottiglia che limitavano le prestazioni sostenute in carichi complessi e paralleli.

Prestazioni e densità su scala rack

La CPU Arm AGI è progettata per fornire prestazioni elevate per attività in condizioni di carico sostenuto su migliaia di core simultanei. Il componente Cada, inclusi frequenza, sottosistema di memoria e interfacce I/O, è ottimizzato per ambienti densi con vincoli di alimentazione e raffreddamento tipici dei data center odierni.

La configurazione di riferimento in un server 1U a due nodi utilizza due chip e totalizza 272 core per blade. Un rack standard raffreddato ad aria da 36 kW può ospitare 30 blade, per un totale di 8160 core.

In collaborazione con Supermicro, è stato sviluppato un design raffreddato a liquido da 200 kW che supporta 336 CPU e oltre 45mila core per rack. Nessas, la soluzione offre più del doppio delle prestazioni per rack rispetto ai recenti sistemi x86 equivalenti.

Diversi fattori contribuiscono a questo vantaggio. La larghezza di banda della memoria leader della categoria consente thread di esecuzione più efficaci per rack, evitando il degrado osservato nelle architetture che competono per le risorse sotto carico pesante.

I core Neoverse V3 forniscono una migliore elaborazione a thread singolo, consentendo a ciascun thread di svolgere un lavoro più utile. La combinazione di thread più utilizzabili e maggiore efficienza per thread produce vantaggi significativi a livello dell’intero rack.

  • Fino a 136 Neoverse core V3 per CPU
  • Larghezza di banda della memoria fino a 6 GB/s per core con latenza inferiore a 100 ns
  • Supporto PCIe Gen6 con 96 corsie e CXL 3.0
  • TDP configurabile nell’intervallo da 230 W a 420 W a seconda del modello
https://www.youtube.com/embed/sqJancqeVbk

Partenariati e adozione anticipata nell’ecosistema

Meta funge da partner principale e cliente nello sviluppo congiunto della CPU AGI Arm. Il processore è stato ottimizzato per integrarsi con l’infrastruttura su scala gigawatt dell’azienda e funzionare insieme agli acceleratori MTIA personalizzati di Meta.

Altri partner di lancio includono Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP e SK Telecom. L’organizzazione Cada collabora all’implementazione della soluzione per accelerare i servizi di intelligenza artificiale in ambienti cloud, di rete e aziendali.

I sistemi commerciali basati sulla CPU AGI Arm sono ora disponibili per l’ordine presso ASRockRack, Lenovo e Supermicro. La disponibilità anticipata consente ai provider di iniziare i test e la pianificazione dell’implementazione su larga scala.

Arm ha rilasciato anche il server di riferimento Arm AGI CPU 1OU Dual Node, nel formato DC-MHS standard Open Compute Project. L’azienda prevede di contribuire con la progettazione aperta, supportando firmware, specifiche di architettura e strumenti diagnostici.

Questi contributi mirano ad accelerare l’adozione in tutto l’ecosistema e a garantire un’ampia compatibilità con il software e l’hardware esistenti basati su Arm.

Espansione della piattaforma Arm al full silicon

Il lancio rappresenta l’inizio di una nuova linea di prodotti in silicio per data center di Arm. La CPU AGI è prodotta da TSMC con un processo a 3 nm e utilizza core ad alte prestazioni con estensioni vettoriali per carichi di lavoro AI.

I vari modelli includono versioni a 136 core focalizzate sulle prestazioni complessive, opzioni a 128 core ottimizzate per i costi e varianti a 64 core che danno priorità alla larghezza di banda della memoria per core. Todas condivide l’architettura Armv9.2 con il supporto per le istruzioni bfloat16 e INT8.

L’iniziativa si svolge parallelamente alla roadmap dei sottosistemi informatici Neoverse CSS, consentendo ai clienti di scegliere tra IP personalizzati, soluzioni di piattaforma o processori Arm già pronti.

Oltre 50 aziende leader nel settore hyperscale, cloud, semiconduttori, memorie, reti e software supportano l’espansione della piattaforma Arm al silicio completo. La collaborazione Essa rafforza la maturità dell’ecosistema per i carichi di lavoro di intelligenza artificiale degli agenti.

Prossimi passi e disponibilità

La CPU Arm AGI è ora disponibile per l’ordine, con una produzione in volume prevista nella seconda metà del 2026. La soluzione mira a fornire una base computazionale efficiente per l’innovazione continua nei settori che si affidano all’infrastruttura AI.

I partner evidenziano vantaggi quali una maggiore densità di prestazioni, un consumo energetico ridotto e una migliore scalabilità per l’orchestrazione degli agenti. L’architettura consente un coordinamento preciso tra CPU e acceleratori specializzati in ambienti eterogenei.

Arm continua a impegnarsi nell’evoluzione della piattaforma per soddisfare le richieste future dei fornitori di servizi cloud in rapida crescita e delle aziende di intelligenza artificiale.