CloudFormationテンプレートを使用した SageMaker HyperPod クラスターの作成 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CloudFormationテンプレートを使用した SageMaker HyperPod クラスターの作成

HyperPod の CloudFormation テンプレートを使用して SageMaker HyperPod クラスターを作成できます。続行するAWS CLIには、 をインストールする必要があります。

コンソールでリソースを設定し、CloudFormation を使用してデプロイする

を使用してリソースを設定しAWS マネジメントコンソール、CloudFormation テンプレートを使用してデプロイできます。

以下の手順に従ってください。

  1. [送信]をクリックする代わりにSageMaker AI コンソールを使用した SageMaker HyperPod の開始方法 のチュートリアルの最後に [CloudFormation テンプレートパラメータをダウンロード] をクリックします。このチュートリアルには、クラスターを正常に作成するために必要な重要な設定情報が含まれています。

    重要

    [送信] をクリックすると、クラスターを削除するまで、同じ名前のクラスターをデプロイできなくなります。

    [CloudFormation テンプレートパラメータをダウンロード] をクリックすると、ページの右側に [AWS CLI を使用して構成ファイルでクラスターを作成] ウィンドウが表示されます。

  2. [AWS CLI を使用して構成ファイルでクラスターを作成] ウィンドウで、[設定パラメータファイルをダウンロード] をクリックします。ファイルはローカルマシンにダウンロードされます。必要に応じて設定 JSON ファイルを編集するか、変更が必要ない場合はそのままにしておいてかまいません。

  3. ターミナルで、file://params.json ファイルの場所に移動します。

  4. create-stackAWS CLI コマンドを実行して、設定されたリソースをプロビジョニングし、HyperPod クラスターを作成する CloudFormation スタックをデプロイします。

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. リソースプロビジョニングのステータスを表示するには、CloudFormation コンソールに移動します。

    クラスターの作成が完了したら、SageMaker HyperPod コンソールのメインペインのクラスターの下に新しい [クラスター] が表示されます。ステータスは、[ステータス] 列で確認できます。

  6. クラスターのステータスが InService になったら、クラスターノードへのログインを開始できます。クラスターノードにアクセスして ML ワークロードの実行を開始するには、「SageMaker HyperPod クラスター上のジョブ」を参照してください。

CloudFormation を使用してリソースを設定してデプロイする

SageMaker HyperPod の CloudFormation テンプレートを使用して、リソースを設定してデプロイできます。

以下の手順に従ってください。

  1. SageMaker HyperPod 用の CloudFormation テンプレートを sagemaker-hyperpod-cluster-setup GitHub リポジトリからダウンロードします。

  2. create-stackAWS CLI コマンドを実行して、設定されたリソースをプロビジョニングし、HyperPod クラスターを作成する CloudFormation スタックをデプロイします。

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. リソースプロビジョニングのステータスを表示するには、CloudFormation コンソールに移動します。

    クラスターの作成が完了したら、SageMaker HyperPod コンソールのメインペインのクラスターの下に新しい [クラスター] が表示されます。ステータスは、[ステータス] 列で確認できます。

  4. クラスターのステータスが InService になったら、クラスターノードへのログインを開始できます。