

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# SageMaker HyperPod で Amazon EKS サポートを開始する
<a name="sagemaker-hyperpod-eks-prerequisites"></a>

SageMaker HyperPod の一般的な [SageMaker HyperPod を使用するための前提条件](sagemaker-hyperpod-prerequisites.md) に加えて、Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションするための以下の要件と考慮事項を確認してください。

**重要**  
 AWS マネジメントコンソール および CloudFormationを使用して、SageMaker HyperPod クラスターを作成するためのリソース設定をセットアップできます。詳細については、「[Amazon EKS オーケストレーションを使用した SageMaker HyperPod クラスターの作成](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md)」および「[CloudFormation テンプレートを使用した SageMaker HyperPod クラスターの作成](smcluster-getting-started-eks-console-create-cluster-cfn.md)」を参照してください。

**要件**

**注記**  
HyperPod クラスターを作成する前に、VPC で設定され、Helm を使用してインストールされている実行中の Amazon EKS クラスターが必要です。
+ SageMaker AI コンソールを使用している場合は、HyperPod クラスターコンソールページ内に Amazon EKS クラスターを作成できます。詳細については、「[Amazon EKS オーケストレーションを使用した SageMaker HyperPod クラスターの作成](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md)」を参照してください。
+  AWS CLI を使用する場合は、関連付ける HyperPod クラスターを作成する前に Amazon EKS クラスターを作成する必要があります。詳細については、「Amazon EKS ユーザーガイド」の「[Amazon EKS クラスターを作成します](https://docs.aws.amazon.com/eks/latest/userguide/create-cluster.html)」を参照してください。

Amazon EKS クラスターをプロビジョニングするときは、次の点を考慮してください。

1. **Kubernetes バージョンのサポート**
   + SageMaker HyperPod は、Kubernetes バージョン 1.28、1.29、1.30、1.31、1.32、1.33、および 1.34 をサポートしています。

1. **Amazon EKS クラスター認証モード**
   + SageMaker HyperPod でサポートされている Amazon EKS クラスターの認証モードは `API` および `API_AND_CONFIG_MAP` です。

1. **ネットワーク**
   + SageMaker HyperPod には、Amazon VPC Container Network Interface (CNI) プラグインバージョン 1.18.3 以降が必要です。
**注記**  
[AWS VPC CNI plugin for Kubernetes](https://github.com/aws/amazon-vpc-cni-k8s) は、SageMaker HyperPod でサポートされている唯一の CNI です。
   + VPC 内の[サブネットのタイプ](https://docs.aws.amazon.com/vpc/latest/userguide/configure-subnets.html#subnet-types)は、HyperPod クラスターではプライベートにする必要があります。

1. **IAM ロール**
   + HyperPod に必要な IAM ロールが、「[AWS Identity and Access Management SageMaker HyperPod 用](sagemaker-hyperpod-prerequisites-iam.md)」セクションのガイドに従って設定されていることを確認します。

1. **Amazon EKS クラスターアドオン**
   + [Kube-proxy](https://docs.aws.amazon.com/eks/latest/userguide/add-ons-kube-proxy.html)、[CoreDNS](https://docs.aws.amazon.com/eks/latest/userguide/add-ons-coredns.html)、Amazon [VPC Container Network Interface (CNI)](https://docs.aws.amazon.com/eks/latest/userguide/add-ons-vpc-cni.html) プラグイン、Amazon EKS ポッドアイデンティティ、GuardDuty エージェント、Amazon FSx Container Storage Interface (CSI) ドライバー、Mountpoint for Amazon S3 CSI ドライバー、Distro for OpenTelemetry、CloudWatch Observability エージェントなど、Amazon EKS が提供するさまざまなアドオンを引き続き使用できます。 AWS OpenTelemetry CloudWatch 

**Amazon EKS で SageMaker HyperPod クラスターを設定する際の考慮事項**
+ ノードのタイプに基づいて異なる IAM ロールを使用する必要があります。HyperPod ノードの場合は、「[SageMaker HyperPod の IAM ロール](sagemaker-hyperpod-prerequisites-iam.md#sagemaker-hyperpod-prerequisites-iam-role-for-hyperpod)」に基づくロールを使用します。Amazon EKS ノードについては、「[Amazon EKS ノードの IAM ロール](https://docs.aws.amazon.com/eks/latest/userguide/create-node-role.html)」を参照してください。
+ SageMaker HyperPod ノードに追加の Amazon EBS ボリュームをプロビジョンしてマウントするには、クラスターレベルのボリュームプロビジョニングに [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs) を使用するか (インスタンスグループの作成または更新時に使用可能)、動的ポッドレベルのボリューム管理に Amazon Elastic Block Store (Amazon EBS) Container Storage Interface (CSI) ドライバーを使用します。[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs) では、[ローカルパス](https://kubernetes.io/docs/concepts/storage/volumes/#local)を `/opt/sagemaker` に設定して、ボリュームを Amazon EKS ポッドに適切にマウントします。[Amazon EBS CSI](https://docs.aws.amazon.com/eks/latest/userguide/ebs-csi.html) コントローラーを HyperPod ノードにデプロイする方法については、「[SageMaker HyperPod EKS クラスターで Amazon EBS CSI ドライバーを使用する](sagemaker-hyperpod-eks-ebs.md)」を参照してください。
+ インスタンスタイプのラベルを使用してスケジューリングの制約を定義する場合は、プレフィックスが `ml.` の SageMaker AI ML インスタンスタイプを使用します。例えば、P5 インスタンスの場合は、`p5.48xlarge` の代わりに `ml.p5.48xlarge` を使用します。

**Amazon EKS で SageMaker HyperPod クラスターのネットワークを設定する際の考慮事項**
+ 各 HyperPod クラスターインスタンスでは、1 つの Elastic Network Interface (ENI) がサポートされます。インスタンスタイプあたりのポッドの最大数については、次の表を参照してください。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/sagemaker-hyperpod-eks-prerequisites.html)
+ デフォルトでは、Amazon EC2 インスタンスメタデータサービス (IMDS) にアクセスできるのは、`hostNetwork = true` のポッドのみです。Amazon EKS Pod ID または[サービスアカウント (IRSA) の IAM ロール](https://docs.aws.amazon.com/eks/latest/userguide/iam-roles-for-service-accounts.html)を使用して、Pod の AWS 認証情報へのアクセスを管理します。
+ EKS オーケストレーション HyperPod クラスターはデュアル IP アドレス指定モードをサポートしており、IPv6 対応の VPC およびサブネット環境の IPv6 Amazon EKS クラスターに対して IPv4 または IPv6 による構成が可能です。詳細については、「[カスタム Amazon VPC で SageMaker HyperPod を設定する](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc)」を参照してください。

**HyperPod クラスターの回復機能を使用する際の考慮事項**
+ ノードの自動置き換えは、CPU インスタンスではサポートされていません。
+ ノードの自動復旧が機能するには、HyperPod ヘルスモニタリングエージェントをインストールする必要があります。エージェントは Helm を使用してインストールできます。詳細については、「[Helm を使用して Amazon EKS クラスターにパッケージをインストールする](sagemaker-hyperpod-eks-install-packages-using-helm-chart.md)」を参照してください。
+ HyperPod のディープヘルスチェックとヘルスモニタリングエージェントは、GPU インスタンスと Trn インスタンスをサポートしています。
+ SageMaker AI は、ノードがディープヘルスチェックを受けている際に、次のテイントを適用します。

  ```
  effect: NoSchedule
  key: sagemaker.amazonaws.com/node-health-status
  value: Unschedulable
  ```
**注記**  
`DeepHealthChecks` がオンになっているインスタンスグループのノードにカスタムテイントを追加することはできません。

 Amazon EKS クラスターが実行されたら、HyperPod クラスターを作成する前に、「[Helm を使用して Amazon EKS クラスターにパッケージをインストールする](sagemaker-hyperpod-eks-install-packages-using-helm-chart.md)」の手順に従い、Helm パッケージマネージャーを使用してクラスターを設定します。