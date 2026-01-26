Microsoft dévoile la puce Maia 200 et entend rivaliser avec l'écosystème logiciel de Nvidia

Microsoft a présenté lundi la Maia 200, deuxième génération de sa puce d'intelligence artificielle conçue en interne, accompagnée d'une suite logicielle visant à concurrencer l'environnement Cuda de Nvidia. Cette puce, désormais opérationnelle dans un centre de données dans l'Iowa, représente un pas de plus dans la volonté de Microsoft de réduire sa dépendance technologique à Nvidia, tout en renforçant sa maîtrise de la chaîne de valeur de l'IA. Un second site d'exploitation est prévu en Arizona dans les mois à venir.



Conçue pour les besoins en calcul intensif dans le cloud, la Maia 200 est fabriquée par TSMC en technologie 3 nm et intègre de la mémoire HBM, bien que dans une version moins avancée que celle attendue dans les prochaines puces Nvidia. Microsoft mise également sur l'intégration d'une mémoire SRAM importante, inspirée de concurrents comme Cerebras ou Groq, afin d'optimiser les performances dans les usages interactifs de l'IA, notamment les chatbots.



Microsoft présente Maia 200 comme le silicium tiers le plus performant de tous les hyperscalers, avec des performances FP4 trois fois supérieures à celles de la troisième génération d'Amazon Trainium et des performances FP8 supérieures à celles de la septième génération de TPU de Google.



Parallèlement, l'entreprise propose de nouveaux outils logiciels, dont Triton, un projet open source co-développé avec OpenAI et présenté comme une alternative directe à Cuda, l'un des principaux avantages concurrentiels de Nvidia.



Cette annonce intervient dans un contexte de recomposition accélérée du secteur des semi-conducteurs pour l'IA. Alors que Cerebras a signé un accord de 10 milliards de dollars avec OpenAI, Nvidia a récemment conclu un partenariat estimé à 20 milliards de dollars avec la start-up Groq. Face à ces alliances stratégiques, Microsoft renforce son intégration verticale, avec l'ambition de se positionner non seulement comme fournisseur d'infrastructure cloud, mais aussi comme acteur central dans la conception de puces et le développement logiciel dans le domaine de l'intelligence artificielle.