Le géant du cloud a déclaré progresser dans la résolution du problème après qu'une hausse rapide des températures dans un seul centre de données du nord de la Virginie a provoqué une coupure de courant jeudi. Un rétablissement complet prendrait plusieurs heures, a précisé le groupe. Coinbase a indiqué que ses services avaient été restaurés après que la panne en a entravé la disponibilité.
La surchauffe des centres de données est devenue un défi majeur pour les entreprises : les serveurs d'IA avancée et de cloud traitant des volumes massifs de données nécessitent une puissance électrique colossale et dégagent une chaleur intense. Pour réguler cette température, les opérateurs de centres de données se tournent de plus en plus vers l'eau ou des fluides de refroidissement spécialisés, des milliers de fois plus efficaces que le refroidissement par air traditionnel.
La panne de jeudi constitue la deuxième interruption majeure liée à une surchauffe ces derniers mois, après que le marché de dérivés CME Group a subi en novembre dernier l'une de ses plus longues pannes depuis des années, en raison d'une défaillance du système de refroidissement dans les centres de données gérés par CyrusOne.
À 8h12 (heure de l'Est), les signalements de pannes pour AWS sur le site de suivi Downdetector étaient retombés à 72, contre un pic de près de 600 jeudi soir.
AWS a mis en service des capacités supplémentaires de refroidissement, mais a précisé que l'ajout de la capacité requise pour restaurer en toute sécurité l'ensemble des systèmes affectés prenait plus de temps que prévu.
La plateforme de cloud computing a également indiqué avoir détourné le trafic de la 'Zone de Disponibilité' impactée pour la plupart des services. Une 'Zone de Disponibilité' comprend un ou plusieurs centres de données physiques connectés et est conçue pour fonctionner de manière indépendante au sein d'une région AWS.
La plateforme de négociation de CME Group, le plus grand marché de dérivés au monde, avait également rencontré quelques problèmes techniques plus tôt, mais était de nouveau opérationnelle après avoir achevé des travaux de maintenance essentiels. La panne d'AWS n'a eu aucun impact sur CME Group, a précisé la société.
AWS avait connu une panne majeure en octobre dernier, provoquant des perturbations mondiales pour des milliers de sites, y compris certaines des applications les plus populaires comme Snapchat et Reddit.
Il s'agissait de l'interruption internet la plus importante depuis le dysfonctionnement de CrowdStrike en 2024, qui avait paralysé les systèmes technologiques des hôpitaux, des banques et des aéroports, soulignant la vulnérabilité des technologies interconnectées mondiales.




















