PCS AWS でのクラスターの作成 - AWS PCS

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

PCS AWS でのクラスターの作成

このトピックでは、使用可能なオプションの概要と、 AWS Parallel Computing Service (AWS PCS) でクラスターを作成するときに考慮すべき点について説明します。 AWS PCS クラスターを初めて作成する場合は、 に従うことをお勧めしますAWS Parallel Computing Service の使用を開始する。このチュートリアルは、使用可能なすべてのオプションとシステムアーキテクチャを拡張することなく、動作する HPC システムを作成するのに役立ちます。

注記

クラスターを作成したら、インフラストラクチャを再構築することなく、多くの構成設定を変更できます。詳細については、「PCS AWS でのクラスターの更新」を参照してください。

注記

カスタム Slurm 設定を設定して、高度なスケジューリングポリシーとリソース管理を実装できます。詳細については、「PCS でのカスタム Slurm AWS 設定の設定」を参照してください。

前提条件

PCS AWS クラスターを作成する

AWS Management Console または を使用してクラスター AWS CLI を作成できます。

AWS Management Console
クラスターを作成するには
  1. https://console.aws.amazon.com/pcs/home#/clusters で AWS PCS コンソールを開き、クラスターの作成を選択します。

  2. クラスター設定セクションで、次のフィールドに入力します。

    • クラスター名 – クラスターの名前。この名前には英数字 (大文字と小文字が区別されます) とハイフンのみを使用できます。アルファベット文字で始まり、40 文字を超えることはできません。名前は、クラスター AWS アカウント を作成する AWS リージョン および 内で一意である必要があります。

    • スケジューラ – スケジューラとバージョンを選択します。詳細については、「PCS の Slurm AWS バージョン」を参照してください。

    • コントローラーサイズ – コントローラーのサイズを選択します。これにより、 AWS PCS クラスターで管理できる同時ジョブとコンピューティングノードの数を決定します。コントローラーのサイズは、クラスターの作成時にのみ設定できます。サイズの詳細については、「」を参照してくださいPCS AWS のクラスターサイズ

  3. ネットワークセクションで、次のフィールドの値を選択します。

    • ネットワークタイプ – クラスターの IP アドレスタイプを選択します。クラスターは IPv4 または IPv6 のいずれかを使用できますが、両方を使用することはできません。VPC とサブネットは同じネットワークアドレスタイプを使用する必要があります。各サブネットに使用する IP アドレスブロックには、少なくとも 1 つの使用可能なアドレスが必要です。 は、各サブネットの一部のアドレス AWS を予約します。詳細については、「Amazon VPC ユーザーガイド」の「サブネット CIDR ブロック」を参照してください。

    • VPC – PCS 要件を満たす既存の VPC AWS を選択します。詳細については、「AWS PCS VPC とサブネットの要件と考慮事項」を参照してください。クラスターを作成した後は、その VPC を変更することはできません。VPCs がリストされていない場合は、最初に VPC を作成する必要があります。

    • サブネット – 選択した VPC で使用可能なすべてのサブネットが一覧表示されます。 AWS PCS サブネット要件を満たすサブネットを選択します。詳細については、「AWS PCS VPC とサブネットの要件と考慮事項」を参照してください。スケジューラエンドポイントがパブリックインターネットに公開されないように、プライベートサブネットを選択することをお勧めします。

    • セキュリティグループ – PCS AWS がクラスター用に作成するネットワークインターフェイスに関連付けるセキュリティグループ (複数可) を指定します。クラスターとそのコンピューティングノード間の通信を許可するセキュリティグループを少なくとも 1 つ選択する必要があります。セキュリティグループをすばやく作成して、選択した VPC AWS で必要な設定で PCS に作成させるか、既存のセキュリティグループを選択できます。詳細については、「セキュリティグループの要件と考慮事項」を参照してください。

  4. (オプション) Slurm アカウンティング設定セクションで、Slurm アカウンティングを有効にし、アカウンティングパラメータを設定できます。詳細については、「PCS での Slurm AWS アカウンティング」を参照してください。

  5. (オプション) Slurm 設定セクションで、パラメータ名と値のペアを追加して、追加の Slurm 設定を設定できます。サポートされているパラメータの完全なリストについては、「」を参照してくださいPCS クラスターのカスタム Slurm AWS 設定

  6. (オプション) タグ で、PCS AWS クラスターにタグを追加します。

  7. [クラスターを作成] を選択します。Status フィールドは、PCS AWS がクラスターを作成するCreating間に表示されます。この処理には数分かかることもあります。

重要

ごとに AWS リージョン 1 つのCreating状態のクラスターは 1 つだけです AWS アカウント。 AWS PCS は、クラスターを作成しようとしたときに Creating状態のクラスターが既に存在する場合にエラーを返します。

AWS CLI
クラスターを作成するには
  1. 下記のコマンドを使用して、クラスターを作成します。コマンドを実行する前に、次の置き換えを行います:

    • region を、 など、クラスター AWS リージョン を作成する の ID に置き換えますus-east-1

    • マイクラスター の部分は自分のクラスター名に置き換えます。この名前には英数字 (大文字と小文字が区別されます) とハイフンのみを使用できます。アルファベット文字で始まり、40 文字を超えることはできません。名前は、クラスターを作成する AWS リージョン および AWS アカウント 内で一意である必要があります。

    • 24.11 をサポートされているバージョンの Slurm に置き換えます。

      注記

      AWS PCS は現在、Slurm 24.11 および 24.05 をサポートしています。

    • SMALL をサポートされているクラスターサイズに置き換えます。これにより、PCS AWS クラスターで管理できる同時ジョブとコンピューティングノードの数を決定します。これは、クラスターが作成された場合にのみ設定できます。サイズの詳細については、「」を参照してくださいPCS AWS のクラスターサイズ

    • の値を独自の値subnetIdsに置き換えます。スケジューラエンドポイントがパブリックインターネットに公開されないように、プライベートサブネットを選択することをお勧めします。

    • PCS AWS securityGroupIdsがクラスター用に作成するネットワークインターフェイスに関連付ける を指定します。セキュリティグループは、クラスターと同じ VPC に存在する必要があります。クラスターとそのコンピューティングノード間の通信を許可するセキュリティグループを少なくとも 1 つ選択する必要があります。詳細については、「セキュリティグループの要件と考慮事項」を参照してください。

    aws pcs create-cluster --region region \ --cluster-name my-cluster \ --scheduler type=SLURM,version=24.11 \ --size SMALL \ --networking subnetIds=subnet-ExampleId1,securityGroupIds=sg-ExampleId1
    • IPv6 を使用するには、 を --networking設定networkType=IPV6に追加します。

      --networking networkType=IPV6,subnetIds=subnet-ExampleId1,securityGroupIds=sg-ExampleId1
    • 必要に応じて、オプションを追加して Slurm の動作--slurm-configrationをカスタマイズし、Slurm 設定オプションを指定できます。次の例では、スケールダウンアイドル時間を 60 分 (3600 秒) に設定し、Slurm アカウンティングを有効にして、 の値としてslurm.conf設定を指定しますslurmCustomSettings。詳細については、「PCS での Slurm AWS アカウンティング」を参照してください。

      注記

      アカウンティングは Slurm 24.11 以降でサポートされています。

      aws pcs create-cluster --region region \ --cluster-name my-cluster \ --scheduler type=SLURM,version=24.11 \ --size SMALL \ --networking subnetIds=subnet-ExampleId1,securityGroupIds=sg-ExampleId1 --slurm-configuration scaleDownIdleTimeInSeconds=3600,accounting='{mode=STANDARD}',slurmCustomSettings='[{parameterName=SelectTypeParameters,parameterValue=CR_CPU_Memory}]'
  2. クラスターのプロビジョニングには数分かかる場合があります。クラスターのステータスのクエリを実行するには次のコマンドを使用します。クラスターのステータスフィールドが になるまで、キューまたはコンピューティングノードグループの作成に進まないでくださいACTIVE

    aws pcs get-cluster --region region --cluster-identifier my-cluster
重要

ごとに AWS リージョン 1 つのCreating状態のクラスターは 1 つだけです AWS アカウント。 AWS PCS は、クラスターを作成しようとしたときに Creating状態のクラスターが既に存在する場合にエラーを返します。

クラスターに推奨される次のステップ
  • コンピューティングノードグループを追加します。

  • キューを追加します。

  • ログ作成を有効化します。