マルチリージョンの基本 1: 要件の理解

前述のように、高可用性とオペレーションの継続性が、マルチリージョンアーキテクチャを追求する一般的な理由です。可用性メトリクスは、定義された期間にワークロードを使用できる時間の割合を測定しますが、オペレーションの継続性メトリクスは、大規模で通常はより長い期間イベントの復旧時間を測定します。

可用性の測定はほぼ継続的なプロセスです。特定の測定値は異なる場合がありますが、通常はターゲット可用性メトリクスを中心に合体し、ほとんどの場合 9 と呼ばれています (99.99% の可用性など）。可用性の目標は、常に同じではありません。すべてのワークロードに単一の目標を適用するのではなく、ワークロードレベルで可用性目標を設定し、重要でないコンポーネントと重要なコンポーネントを分離する必要があります。

オペレーションを継続するためには、通常、以下のポイントインタイム測定が使用されます。

目標復旧時間 (RTO) — RTO は、サービスの中断とサービスの復旧の間の最大許容遅延です。この値によって、サービスが停止される許容時間が決まります。
目標復旧時点 (RPO) – RPO は、最後のデータ復旧時点からの最大許容時間です。これにより、最新の復旧時点からサービス中断までの間のデータ損失がどの程度まで許容されるかが決まります。

可用性目標の設定と同様に、RTO と RPO もワークロードレベルで定義する必要があります。より積極的な運用の継続性や高可用性を実現するには、投資を増やす必要があります。とはいえ、すべてのアプリケーションが同じレベルの耐障害性を要求したり、必要とするわけではありません。ビジネスオーナーと IT オーナーを調整して、ビジネスへの影響に基づいてアプリケーションの重要度を評価し、それに応じて階層化することで、出発点を提供することができます。次の表は、階層化の例を示しています。

この表は、サービスレベルアグリーメント (SLAs。

耐障害性階層	アベイラビリティー SLA	許容ダウンタイム/年
プラチナ	99.99%	52.60 分
ゴールド	99.90%	8.77 時間
シルバー	99.5%	1.83 日間

次の表は、RTO と RPO の耐障害性階層化の例を示しています。

耐障害性階層	最大 RTO	最大 RPO	条件	コスト
プラチナ	15 分	5 分	ミッションクリティカルなワークロード	$$$
ゴールド	15 分～6 時間	2 時間	重要だがミッションクリティカルではないワークロード	$$
シルバー	6 時間 – 数日	24 時間	重要でないワークロード	$

回復力のあるワークロードを設計する場合は、高可用性と運用の継続性の関係を考慮してください。たとえば、ワークロードに 99.99% の可用性が必要な場合、許容できるダウンタイムは 1 年あたり 53 分以下です。障害を検出するには少なくとも 5 分、オペレーターがエンゲージして復旧ステップを決定し、これらのステップを実行するにはさらに 10 分かかる場合があります。1 つの問題から復旧するまでに 30～45 分かかることは珍しくありません。この場合、相関関係のある影響を排除する独立したインスタンスを提供するマルチリージョン戦略を持つことが有益です。これにより、初期障害を個別にトリアージしながら、制限時間内にフェイルオーバーすることで、オペレーションを継続できます。ここでは、適切な制限された復旧時間を定義し、調整する必要があります。

マルチリージョンアプローチは、極端な可用性のニーズ (99.99% 以上の可用性など) や、別のリージョンにフェイルオーバーすることによってのみ満たすことができる厳格な運用継続性要件を持つミッションクリティカルなワークロードに適しています。ただし、これらの要件は通常、数分または数時間で測定される制限された復旧時間を持つ企業のワークロードポートフォリオの小さなサブセットにのみ適用されます。アプリケーションが数分または数時間の復旧時間を必要とする場合を除き、影響を受けるリージョン内でアプリケーションのリージョンの中断が修正されるのを待つことをお勧めします。このアプローチは通常、低層ワークロードと一致します。

マルチリージョンアーキテクチャを実装する前に、ビジネスの意思決定者と技術チームは、運用コストやインフラストラクチャのコスト要因などのコストへの影響について調整する必要があります。一般的なマルチリージョンアーキテクチャでは、単一リージョンアプローチの 2 倍のコストが発生する可能性があります。ホットスタンバイ、ウォームスタンバイ、パイロットライトを使用した実行など、ビジネス継続性のための複数のマルチリージョンパターンがありますが、復旧目標を達成するリスクが最も低いパターンにはホットスタンバイの実行が含まれ、ワークロードのコストが 2 倍になります。

主なガイダンス

RTO や RPO などのオペレーションの可用性と継続性の目標は、ワークロードごとに設定し、ビジネスと IT の利害関係者と調整する必要があります。
可用性とオペレーションの継続性に関する目標は、ほとんどの場合 1 つのリージョン内で達成できます。1 つのリージョン内で達成できない目標については、コスト、複雑さ、利点のトレードオフを明確に把握したマルチリージョンを検討してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

1 つのリージョンでの回復性のためのエンジニアリングと運用

マルチリージョンの基本 2: データについて