
UAEとバーレーンにあるAWSのデータセンターが、イランによってドローン空爆されました。
ステータスページに掲載されている情報を元に要約しました。
- 3/1 21:56:バーレーンリージョンの1つのAZ(アベイラビリティゾーン)でAPIエラーの上昇を確認
- 3/1 23:09:同ゾーンで電力および接続の問題が発生。他ゾーンへ回避を推奨
- 3/2 16:22:原因が紛争によるドローン攻撃であったと公表
- UAEリージョンで2つの施設が直接攻撃を受け、3つのAZのうち2つが深刻な被害
- バーレーンリージョンで1つの施設近傍への攻撃により物理的被害が発生
- 3/2 22:27:電力と接続の完全復旧には少なくとも1日以上かかるとの見通しを発表
- S3やDynamoDBなどの基盤サービスをソフトウェア側から修復する「ソフトウェアベースの復旧パス」を優先。これにより他の依存サービスの復旧を狙う
- 中東リージョンのデータを米国、欧州、アジアなどの他リージョンへ即座に複製・移行することを強く推奨
- 3/3 8:40:初期段階の状況が明確になったため、全体向けの頻繁な更新から、影響を受けている顧客への直接的なコミュニケーション(Personal Health Dashboard)へ移行
- 復旧作業は進展しているものの、完全復旧には依然として多くの作業が残っている状態。引き続き他リージョンへのワークロード移行を強く推奨
3月3日以降は発信がなく、規模も大きいことからおそらく障害は継続しているのだと思われます。
ドローン攻撃であることを公表した報告の中では、下記のような消火活動や従業員の安全確保といった生々しい情報も垣間見えました。
中東で続く紛争により、影響を受けている両リージョンは、ドローン攻撃の結果、インフラストラクチャに物理的な被害を受けています。UAE では、当社の施設2箇所が直接攻撃を受け、バーレーンでは、当社の施設の1箇所に近接したドローン攻撃により、インフラストラクチャに物理的な被害が発生しました。これらの攻撃により、構造的な損傷、インフラストラクチャへの電力供給の中断、場合によっては消火活動が必要となり、その結果、水害が発生しました。当社は、復旧作業全体を通して、現地当局と緊密に連携し、従業員の安全を最優先しています。
さぞかし現場は混乱していたと察するのですが、かなり速やかな対応だったと私は思います。
AWSの障害による影響範囲
データセンターではさまざまなサービスのアプリケーションが管理・運用されており、AWSは最大手のサービスです。
私たちが日常や業務で使用するWebサービスもAWSで運用されていることが多く、Webサイトのような身近なものから、電話交換機や製造システムといったビジネス用途でも使用されています。
さらに、AWSは米軍のクラウド基盤(JWCC等)を担う主要ベンダーの一つ1ですので、民間施設であるはずのデータセンターが狙われたのはそのためでしょう。
このようにデータセンターは社会機能を大きく担う、重要インフラの一つであると考えることができます。
データセンターの場所はどのように特定したか
データセンターはセキュリティ上の理由で大まかなエリアは公表するものの、正確な住所は公開しないことが多いです。
AWSのデータセンターも同様に場所は秘匿されていたでしょうし、どのように場所を特定したのでしょうか。
公開情報としてはリージョンから大まかなエリアは推測できますし、求人情報から地域を推測できるかもしれません。また、衛星写真で外観からデータセンターの特徴を確認したり、建設中に運び込まれる資材からAWSのものと特定できるかもしれません。もし軍用回線が接続されているとわかればAWSか否かは関係なく標的になる理由になります。
あとはデータセンターに出入りする人から情報を集めるという手もあります。公表はされていなくてもその地域に住んでいる人の間では情報が出回っているといことも考えられますから、そういったところから場所を特定できる可能性があります。このような手法をHUMINT(ヒューミント:人的諜報)といいます。
クラウドのリスク
今回の事件を受けて、クラウドも物理拠点を持つ以上は逃れられないリスクがあると実感しました。
ただ、クラウドはリスク分散による可用性の観点で有利な手段と考えています。AWSであれば複数のAZやリージョンにデータを複製することで冗長化しているので、データセンターが1か所が損壊して使えなくなっても、他のAZやリージョンに切り替えて運用を続けることが可能です。
これが自社のオンプレミスや1拠点で運用しているホスティングサービスがドローン攻撃や災害で損壊した場合、今回のAWSと同じレベルで復旧が進むとは考えにくいですし、そもそも復旧困難となるリスクが大きいです。
ただ、国内のデータセンターに置かなければいけない法規制があると、複数リージョンでの分散ができなくなり、この利点をスポイルしてしまいます。
なお、AWSはインフラの安全は保証しますが、その上でデータをどう冗長化(別リージョンへバックアップ等)するかはユーザー側の責任とする責任共有モデルという原則を掲げています。ステータスページで他リージョンへの移行を強く推奨していたのはそのためです。

コメント