継続的な改善
耐障害性は継続的なプロセス
カオスエンジニアリング
また、チームレトロスペクティブを通じて分析をどの程度適切に実行したかを評価する必要もあります。分析中に自分が何に取り組んでいたか、全員が理解していましたか? 耐障害性分析で検出された障害モードの数は、チームが想定していた数と一致していましたか? 検出したすべての障害モードに対する軽減策を特定できますか? チームにとってこのプロセスは役に立ちましたか? 軽減策はワークロードの耐障害性向上につながると思われますか?
ワークロードの可用性に影響を与える実際の障害イベントが発生した場合は、特定の障害モード、障害に含まれるコンポーネント、使用された軽減パターンを記録します。インシデント後分析ツールでこのメタデータを検索可能にすることで、今後どの障害モードとコンポーネントに注力すべきかを判断できます。このプロセスを通じて、AWS アカウントチームとソリューションアーキテクトを関与させることができます。