アマゾン・ウェブ・サービス(AWS)は、複数のアプリに影響を与えた大規模な世界的障害の後、復旧し始めている。米国東部のUS-EAST-1リージョンで発生したAWSの障害により、Snapchat、Fortnite、Ring、Roblox、Coinbase、Signalのユーザー、そしてプライム・ビデオやアレクサといったアマゾンのサービスの利用者が、世界的にサービスへアクセスできなくなった。
AWSのユーザーはDown Detectorで問題を報告し、米国東部標準時(EST/UTC-0500)20日午前4時頃(日本時間20日午後6時頃)に報告が急増した。
AWSは問題を特定し、現在は修正済みだとしている。しかし、一部の法人ユーザーは特定のサービスへのアクセスに依然として問題があると報告している。
知っておくべきことは次のとおりだ。
何が起きたのか?
Down Detectorのユーザーによると、問題はEST20日午前3時頃(日本時間20日午後5時頃)に始まった。1時間後には、米国内だけで約5000件の問題報告が寄せられていた。
その直後、アマゾンはUS-EAST-1リージョンにおける中核データベースサービスであるDynamoDBの問題について、潜在的な根本原因を特定したと述べた。問題をDNS(ドメイン・ネーム・システム)に起因するとし、認証・認可基盤IAM(Identity and Access Management)の更新やDynamoDB Global TablesのようにUS-EAST-1のエンドポイントに依存するグローバルなサービスや機能も「問題が発生している可能性がある」と認めた。
「この問題はUS-EAST-1リージョン内の他のAWSサービスにも影響している」と同社はサービスヘルスダッシュボードに記した。
米国東海岸のバージニア北部に位置するアマゾンのUS-EAST-1リージョンには、複数のデータセンターが含まれる。ここはアプリケーションやサービスを展開する主要リージョンであり、そのため多くのサービスが影響を受けたとみられる。
AWSは、自社のリージョンは「可能な限り最大のフォールトトレランスと安定性」を実現するために「分離されるよう設計されている」としている。
認証のようなAWSの主要機能は影響を受けたリージョンに集中しており、障害が「世界的な波及効果」をもたらし得ると、e2e-assureのCEOであるロブ・デメインは述べた。
原因はなお調査中だが、デメインは、設定上の問題、ネットワークルーティングの不具合、またはDNSエラーに関連していたと考えている。「現時点でサイバー攻撃を示す兆候はないが、大規模なDDoS(分散型サービス妨害)活動の可能性は排除できない」と述べた。



