

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon EKS によってオーケストレーションされた SageMaker HyperPod クラスターでジョブを実行する
<a name="sagemaker-hyperpod-eks-run-jobs"></a>

以下のトピックでは、Amazon EKS とオーケストレーションされたプロビジョニング済みの SageMaker HyperPod クラスターでコンピューティングノードにアクセスし、ML ワークロードを実行する手順と例を示します。HyperPod クラスターで環境を設定する方法に応じて、HyperPod クラスターで ML ワークロードを実行する方法は多数あります。

**注記**  
SageMaker HyperPod CLI または kubectl を介してジョブを実行する場合、HyperPod は名前空間 (チーム) 全体にわたってコンピューティング使用率 (GPU/CPU 時間) を追跡できます。これらのメトリクスの電力使用状況レポートは、以下を提供します。  
割り当てられたリソースの消費状況と借用されたリソースの消費状況の可視性
監査のためのチームのリソース使用状況 (最大 180 日）
タスクガバナンスポリシーに沿ったコスト属性
使用状況レポートを使用するには、使用状況レポートインフラストラクチャをインストールする必要があります。コンピューティングクォータを適用し、きめ細かいコスト属性を有効にするように「[タスクガバナンス](sagemaker-hyperpod-eks-operate-console-ui-governance.md)」を設定することを強くお勧めします。  
使用状況レポートの設定と生成の詳細については、「[HyperPod でのコンピューティング使用状況レポート](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-usage-reporting.html)」を参照してください。

**ヒント**  
Amazon EKS とオーケストレーションされた SageMaker HyperPod クラスターをセットアップして使用する方法に関する実践的な経験とガイダンスについては、[SageMaker HyperPod ワークショップでこの Amazon EKS サポート](https://catalog.us-east-1.prod.workshops.aws/workshops/2433d39e-ccfe-4c00-9d3d-9917b729258e)を受けることをお勧めします。

データサイエンティストユーザーは、SageMaker HyperPod クラスターのオーケストレーターとして EKS クラスターセットを使用して基礎モデルをトレーニングできます。サイエンティストは、[SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli) とネイティブ `kubectl` コマンドを活用して、利用可能な SageMaker HyperPod クラスターを検索し、トレーニングジョブ (ポッド) を送信して、ワークロードを管理します。SageMaker HyperPod CLI では、トレーニングジョブスキーマファイルを使用してジョブを送信でき、ジョブの一覧表示、説明、キャンセル、実行の機能が備わっています。サイエンティストは、HyperPod が管理するコンピューティングクォータに従って、[Kubeflow トレーニングオペレーター](https://www.kubeflow.org/docs/components/training/overview/)を使用し、[SageMaker AI マネージド MLflow](https://docs.aws.amazon.com/sagemaker/latest/dg/mlflow.html) を使用して ML 実験とトレーニング実行を管理できます。

**Topics**
+ [SageMaker HyperPod CLI のインストール](sagemaker-hyperpod-eks-run-jobs-access-nodes.md)
+ [SageMaker HyperPod CLI コマンド](sagemaker-hyperpod-eks-hyperpod-cli-reference.md)
+ [SageMaker HyperPod CLI を使用してジョブを実行する](sagemaker-hyperpod-eks-run-jobs-hyperpod-cli.md)
+ [`kubectl` を使用したジョブの実行](sagemaker-hyperpod-eks-run-jobs-kubectl.md)