ワークロードをデプロイします。 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ワークロードをデプロイします。

次の例は、Karpenter による HyperPod オートスケーリングがワークロードの需要に応じてノードを自動的にプロビジョンする方法を説明しています。これらの例は、基本的なスケーリング動作とマルチアベイラビリティーゾーンの分散パターンを示しています。

シンプルなワークロードをデプロイする
  1. 次の Kubernetes デプロイには、レプリカまたはポッドごとに 1 つの CPU と 256Mのメモリをリクエストするポッドが含まれています。このシナリオでは、ポッドはまだスピンアップされていません。

    kubectl apply -f https://raw.githubusercontent.com/aws/karpenter-provider-aws/refs/heads/main/examples/workloads/inflate.yaml
  2. スケールアッププロセスをテストするには、次のコマンドを実行します。Karpenter はクラスターに新しいノードを追加します。

    kubectl scale deployment inflate --replicas 10
  3. スケールダウンプロセスをテストするには、次のコマンドを実行します。Karpenter はクラスターからノードを削除します。

    kubectl scale deployment inflate --replicas 0
ワークロードを複数の AZ にわたってデプロイする
  1. 次のコマンドを実行して、Kubernetes デプロイを実行するワークロードをデプロイします。デプロイのポッドは、最大スキューが 1 の異なるアベイラビリティーゾーンに均等に分散する必要があります。

    kubectl apply -f https://raw.githubusercontent.com/aws/karpenter-provider-aws/refs/heads/main/examples/workloads/spread-zone.yaml
  2. 次のコマンドを実行して、ポッドの数を調整します。

    kubectl scale deployment zone-spread --replicas 15

    Karpenter は、少なくとも 1 つのノードが異なるアベイラビリティーゾーンを持つクラスターに新しいノードを追加します。

その他の例については、GitHub の「Karpenter サンプルワークロード」を参照してください。