設計の原則
クラウドでは、いくつかの原則が運用上の優秀性をもたらします。特に HPC ワークロードでは、次のものが強調されます。設計の原則については、AWS Well-Architected フレームワークホワイトペーパー
-
クラスターのオペレーションを自動化する: クラウドでは、ワークロード全体をコードとして定義し、コードを利用して更新できます。これにより、繰り返しのプロセスや手順を自動化できます。一貫したインフラストラクチャーを再作成でき、運用手順を実装できるというメリットがあります。これにはジョブ送信のプロセスと、ジョブの開始や完了、失敗などのイベントへの応答の自動化が含まれます。HPC では、ユーザーがジョブごとにいくつもの手順、たとえば 対象ファイルのアップロードやスケジューラーへのジョブ送信、結果ファイルの移動の繰り返しを当然のこととして期待することがよくあります。こうした繰り返し手順をスクリプトやイベント駆動のコードにより自動化して、ユーザビリティを最大化し、コストと失敗を最小化します。
-
適用可能な場合はラウドネイティブなアーキテクチャを使用する: HPC アーキテクチャは、一般的には 2 つのうち 1 つの形式をとります。1 つ目の形式は、ログインインスタンスとコンピューティングノード、そしてジョブスケジューラからなる従来のクラスター設定です。2 つめの形式は、自動化されたデプロイとマネージドサービスによるクラウドネイティブなアーキテクチャです。それぞれの (一時的な) クラスターのために単一のワークロードを実行するか、サーバーレスの能力を使用します。クラウドネイティブなアーキテクチャは、公開された先進技術により運用を最適化できます。しかしながら、HPC ユーザーが望む環境に合っているものが、最良の技術的アプローチです。