耐障害性分析フレームワーク - AWS 規範ガイダンス

耐障害性分析フレームワーク

Amazon Web Services (AWS)、John Formento、Bruno Emer、Steven Hooper、Jason Barto、Michael Haken

2023 年 9 月 (ドキュメント履歴)

一貫性があり繰り返し可能な標準とプロセスは、継続的な改善の重要な部分です。これは、分散システムの耐障害性にも当てはまります。このガイダンスの目的は、障害モードを分析する一貫した方法と、それらがワークロードにどのように影響するかを提供する耐障害性分析フレームワークを導入することです。設計から運用まで、ワークロードのライフサイクル全体でこのフレームワークを使用すると、ワークロードの耐障害性を継続的に改善し、一貫性のある反復可能な方法で潜在的な障害モードの範囲を広げることができます。これにより、耐障害性目標を達成し、ワークロードの適切な耐障害性を維持できます。

このフレームワークは、AWS ソリューションアーキテクチャのフィールドチームが、さまざまな業界の顧客と連携した経験を通じて作成されました。製品マネージャー、ソフトウェア開発者、システムエンジニア、運用チーム、アーキテクトなど、多くの役職を担うビルダーを対象としています。彼らは、分析されているシステム、サービス、または製品について最も詳しい人です。継続的な演習でフレームワークを使用することで着実に進歩し、長期的な耐障害性目標を達成できるようになります。

フレームワークの焦点は、潜在的な障害モードと、その影響を軽減するために使用できる予防的および是正的コントロールを特定することです。依存関係におけるエラー率の増加など、直接制御されていないコンポーネントで障害が発生した場合でも、それらの障害がワークロードにどのように影響するか、およびこれらの障害に対応するためにワークロードをどのように設計するかを考慮する必要があります。最終的には、制御された軽減策を使用して対応できる障害に焦点を当てる必要があります。

このガイドではフレームワークについて概説し、次にワークロードを特定して文書化する方法、そのワークロードにフレームワークを適用する方法、および検出された潜在的な障害に対する軽減戦略を評価する方法について説明します。

目次