La nouvelle puce Jalapeño d’OpenAI vise à optimiser les opérations d’intelligence artificielle et à réduire les dépenses
OpenAI, développeur du célèbre ChatGPT, a annoncé la création de sa première puce d’intelligence artificielle personnalisée, appelée Jalapeño. Ce semi-conducteur, fruit d’une collaboration stratégique avec Broadcom, représente une étape cruciale pour l’entreprise, qui recherche une plus grande autonomie et efficacité du matériel chargé d’exécuter ses modèles d’IA complexes. L’initiative prévoit d’importantes économies de coûts opérationnels, estimées jusqu’à 50 %, en adaptant l’infrastructure informatique aux exigences spécifiques des plateformes d’intelligence artificielle.
Le partenariat stratégique avec Broadcom renforce les tests initiaux de puces
Présentée conjointement par OpenAI et Broadcom, la puce Jalapeño est déjà à un stade avancé de tests. Les premiers échantillons de l’accélérateur font l’objet d’une évaluation rigoureuse et les données préliminaires révèlent une réduction considérable des coûts, de l’ordre de 50 %, par rapport aux unités de traitement graphique (GPU) traditionnellement utilisées dans les tâches d’intelligence artificielle. Hock Tan, PDG de Broadcom, s’est montré optimiste, suggérant que le potentiel de déploiement pourrait dépasser la prévision initiale de 1,3 gigawatts de capacité l’année prochaine.
Réduction des coûts et optimisation des performances dans les centres de données
L’intégration des puces définitives devrait avoir lieu à la fin de l’année, en se concentrant sur les grands centres de données de Microsoft, l’un des principaux investisseurs d’OpenAI, et d’autres partenaires stratégiques. L’objectif primordial est de garantir une exécution plus efficace et plus rentable de vastes charges de travail d’intelligence artificielle. L’optimisation du matériel pour la phase d’inférence – le moment où les modèles d’IA effectuent réellement leurs tâches après la formation – est essentielle à l’évolutivité et à la durabilité économique de services comme ChatGPT à grande échelle. Le recours continu aux GPU à usage général, bien que puissants, peut entraîner des coûts prohibitifs pour les opérations de routine des grands modèles de langage (LLM).
OpenAI cherche à diversifier les fournisseurs de semi-conducteurs
Bien qu’OpenAI reste toujours fortement dépendant des puces de Nvidia, leader du marché des processeurs d’IA, la société investit activement dans l’expansion de son réseau de fournisseurs de matériel. Cette diversification est vitale pour répondre à la demande croissante pour ses services et modèles d’intelligence artificielle. La société a déjà conclu d’importants accords financiers avec d’autres fabricants de puces, notamment Advanced Micro Devices (AMD) et Cerebras Systems, ce qui témoigne d’un effort conscient pour atténuer les risques et garantir un approvisionnement constant en composants spécialisés.
Un investissement d’un milliard de dollars et un soutien financier pour de nouvelles infrastructures
OpenAI prévoit d’investir des dizaines de milliards de dollars dans l’acquisition de puces Broadcom, soulignant l’ampleur de sa contribution à l’infrastructure physique pour maintenir ses opérations d’IA, même dans un scénario sans profit. Pour faciliter ce mouvement stratégique, Broadcom a créé un véhicule de financement en collaboration avec d’importants gestionnaires d’actifs du marché :
- Gestion Globale Apollo Inc.
- Pierre Noire Inc.
Plus tôt cette année, OpenAI avait déjà obtenu un financement supplémentaire de 122 milliards de dollars, renforçant ainsi sa capacité à se développer dans les puces et les centres de données et à attirer des talents spécialisés.
Percée dans la conception des puces Jalapeño pour les grands modèles de langage
Le développement des nouvelles chips Jalapeño a été réalisé en un temps record, à partir de zéro, soulignant l’agilité et l’intense collaboration entre les deux sociétés. Bien qu’encore en phase d’évaluation, les données préliminaires publiées par OpenAI indiquent que Jalapeño offre des performances par watt d’énergie « considérablement supérieures à l’état actuel de la technique ». La puce est conçue spécifiquement pour les grands modèles de langage (LLM) et optimisée pour la phase d’inférence cruciale. Richard Ho, directeur du matériel chez OpenAI, a souligné que malgré sa focalisation sur les LLM, le dispositif a un objectif très général, capable de prendre en charge les futures innovations dans ce domaine.
Feuille de route de développement et avenir de l’autonomie matérielle
OpenAI et Broadcom ont déjà défini une feuille de route de développement claire pour les prochaines générations de puces Jalapeño. Une nouvelle version devrait être publiée en 2028, avec des mises à jour annuelles ultérieures attendues. Alors que le Jalapeño actuel se concentre principalement sur l’inférence, les éditions futures pourraient être conçues pour couvrir d’autres charges de travail d’intelligence artificielle. Pour OpenAI, cette initiative marque le début d’une quête d’un plus grand contrôle sur tous les niveaux de l’infrastructure technologique dont elle dépend, une démarche qui, selon Hock Tan de Broadcom, sera reproduite par d’autres grands développeurs de modèles d’IA, notamment en dehors de la Chine, à la recherche d’accélérateurs et de solutions de réseau personnalisées. Cette avancée représente une recherche continue d’un avantage concurrentiel durable et d’une plus grande indépendance technologique.
















