Le cloud AWS d’Amazon tombe en panne et le monde de l’informatique s’arrête (ou pas)

Mardi, de 9h37 à 16h35 PST, au moins une partie de la région AWS US-EAST-1 du cloud d’Amazon est tombée en panne. Selon l’endroit où l’on se trouve, cette perturbation de près de sept heures a eu des conséquences plus ou moins dramatiques : alors que plus rien ne semblait fonctionner aux Etats-Unis, le reste du monde informatique a été beaucoup moins touché – du moins en ce qui concerne les grands services.

En tête de liste des disparus : Netflix, Disney+ et Amazon Prime. Selon plusieurs rapports, le streaming vidéo ne fonctionnait plus aux Etats-Unis, mais encore en Europe. Les répercussions sur le propre service de livraison d’Amazon semblent toutefois avoir été nettement plus graves aux États-Unis : Celui-ci s’appuie sur des applications internes comme Flex et A to Z, sans lesquelles les magasiniers et les coursiers ainsi que d’autres employés ne peuvent pas travailler – et les colis s’empilent. D’autres offres d’Amazon, comme le système de sécurité Ring, ont également cessé de fonctionner.

Même après la réparation officielle de la panne, on ne sait toujours pas combien de services de quels autres fournisseurs ont été touchés, où et dans quelle mesure. En outre, il n’est pas certain que l’ampleur de la panne puisse être facilement appréhendée : Ce n’est qu’après les premiers rapports sur des forums tels que Reddit et Hacker News qu’Amazon a rendu public dans le tableau de bord AWS Service Health que plusieurs services cloud sur US-EAST-1 n’étaient pas accessibles via les API. Trois heures plus tard, il était clair que cette situation était due à des « équipements de réseau affectés ».

Entre-temps, la panne a officiellement été complètement résolue. Mais il manque encore des détails techniques sur les raisons de cette panne.

(Image : Capture d’écran AWS Service Health Dashboard)

La région US-EAST-1 est si importante que des économistes sérieux craignent même une récession en cas de panne de durée moyenne. EC2, Connect, DynamoDB, Glue, Athena, Timestream et Chime ont été définitivement touchés – entre autres, comme l’indique Amazon lui-même. Et surtout, les clients du monde entier n’ont pas pu se connecter à la console AWS, car sa version mondiale est également basée ici. Ce n’est qu’en se tournant vers l’une des variantes régionales que l’on a pu y remédier.

En dehors des rapports, on ne saura pas combien d’applications internes à l’entreprise sont tombées en panne. Selon plusieurs études de marché, Amazon est de loin le plus grand fournisseur de cloud, en particulier dans le domaine de l’infrastructure. En conséquence, l’informatique de nombreuses entreprises dépend en coulisses de ce fournisseur unique – mais, comme il vient de s’avérer contrairement à l’importance et aux craintes, du moins pas globalement d’une région.

Malgré cela, cette panne s’ajoute à celles de Cloudflare en 2020 et de Facebook en milieu d’année : L’interconnexion croissante de l’informatique et le pouvoir de certains fournisseurs provoquent de plus en plus souvent des pannes importantes et inattendues. On ne sait pas si Amazon fournira un article sur les raisons techniques au-delà du bref et vague rapport sur le Service Health Dashboard d’AWS – dans le passé, le fournisseur en a toutefois fait suivre sur son blog.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici