OpenAI dévoile Jalapeño, sa première puce d'inférence LLM
TL;DR
- Jalapeño reached tape-out in nine months, a timeline Broadcom and OpenAI attribute partly to OpenAI models accelerating chip engineering workflow.
- Microsoft is contractually obligated to purchase 40% of initial Jalapeño output, creating guaranteed demand before commercial shipment begins.
- Both companies are targeting gigawatt-scale data center deployments from late 2026, implying dedicated facility buildout alongside Microsoft and unnamed partners.
OpenAI a présenté mardi Jalapeño, son premier processeur d'inférence sur mesure, développé avec Broadcom en neuf mois de la conception initiale au tape-out de fabrication. Selon TechCrunch, l'entreprise affirme que ce cycle est le plus rapide dont elle a connaissance pour un ASIC haute performance dans les semi-conducteurs avancés, les propres modèles d'OpenAI ayant contribué à accélérer certaines phases du design et de l'optimisation.
La puce est décrite comme une conception pensée de zéro pour l'inférence LLM moderne, et non comme un accélérateur généraliste adapté de travaux antérieurs. L'architecture réduit les mouvements de données et équilibre les ressources de calcul, de mémoire et de réseau pour atteindre une utilisation plus proche des performances théoriques maximales. Les échantillons d'ingénierie font déjà tourner des charges de travail en laboratoire à la fréquence et la puissance cibles de production, notamment GPT-5.3-Codex-Spark. OpenAI revendique une performance par watt nettement supérieure aux solutions actuelles de l'état de l'art, des chiffres auto-déclarés qui n'ont pas encore fait l'objet d'une vérification indépendante.
Le déploiement à grande échelle est prévu d'ici fin 2026, dans des data centers à l'échelle du gigawatt avec Microsoft et d'autres partenaires. Microsoft devrait absorber 40 % de la production de la première phase. L'infrastructure associe le silicium et les technologies réseau de Broadcom, dont ses puces Tomahawk, à l'expertise de Celestica pour les cartes, racks et l'intégration système.
La motivation stratégique est explicite : réduire la dépendance aux GPU Nvidia. Greg Brockman, président d'OpenAI, a résumé l'approche : « Nous avons une compréhension profonde des charges de travail. Nous cherchions des workloads spécifiques mal desservis. » Google et Amazon ont emprunté la même voie avec leurs propres accélérateurs sur mesure. Ce que les reportages ne précisent pas encore : dans quelle mesure Jalapeño sera limité à l'inférence et laissera le pré-entraînement aux mains de Nvidia, et si la montée en puissance gigawatt tiendra les délais annoncés.
Si les performances se confirment en production, OpenAI dispose d'un levier inédit sur ses coûts d'inférence, ce qui pourrait se traduire par des baisses de tarifs sur son API et ouvrir l'accès à de nouveaux marchés sensibles aux prix.
Ce qu'en disent les autres médias
-
OpenAI Lire →
Provides the chip's architecture rationale directly: Jalapeño was optimized around OpenAI's own inference kernels, memory access patterns, and serving topology.
-
Broadcom Investor Relations Lire →
Broadcom's official release includes named executive quotes from Hock Tan and Charlie Kawwas; the only source with Broadcom's own language on the deal terms.
-
CNBC Lire →
Covers the financial market angle; the only major business TV outlet with a dedicated story on the partnership structure at launch.
-
VentureBeat Lire →
Leads with the AI-assisted design loop angle: OpenAI's own models compressed the nine-month engineering cycle, a detail underplayed in official press releases.
-
Tom's Hardware Lire →
Hardware-specialist framing: identifies Jalapeño as a reticle-sized ASIC and contextualizes nine months as unusually fast for custom silicon from a greenfield design.
OpenAI's first chip is a massive reticle-sized ASIC built in an ultra-fast nine-month development cycle
-
Engadget Lire →
Frames the chip as a path to cheaper ChatGPT delivery for end users; the only outlet to lead with consumer cost-of-service rather than silicon specs.
Article original publié par techcrunch.com
Lire l'article original →Titre original : OpenAI et Broadcom dévoilent Jalapeño, leur premier processeur d'inférence IA sur mesure développé en neuf mois avec l'aide des modèles d'OpenAI