HyperPod CLI と SDK を使用したモデルのトレーニングとデプロイ - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

HyperPod CLI と SDK を使用したモデルのトレーニングとデプロイ

Amazon SageMaker HyperPod は、機械学習モデルを大規模にトレーニングおよびデプロイするのに役立ちます。AWSHyperPod CLI は、機械学習 (ML) ワークフローを簡素化する統合コマンドラインインターフェイスですAWS。インフラストラクチャの複雑さを抽象化し、ML トレーニングジョブを送信、モニタリング、管理するための効率的なエクスペリエンスを提供します。CLI は、インフラストラクチャ管理ではなくモデル開発に集中したいデータサイエンティストや ML エンジニア向けの特別設計になっています。このトピックでは、PyTorch モデルのトレーニング、トレーニングされたアーティファクトを使用したカスタムモデルのデプロイ、JumpStart モデルのデプロイの 3 つの主要なシナリオでのウォークスルーを提供します。この簡潔なチュートリアルは、初めてのユーザー向けに設計されており、HyperPod CLI または SDK を使用してモデルを簡単にセットアップ、トレーニング、デプロイできます。トレーニングと推論の間のハンドシェイクプロセスは、モデルアーティファクトを効果的に管理するのに役立ちます。

前提条件

Amazon SageMaker HyperPod の使用を開始する前に、以下を確認する必要があります。

  • Amazon SageMaker HyperPod にアクセスできるAWSアカウント

  • Python 3.9、3.10、3.11 がインストール済み

  • AWS CLI適切な認証情報で設定されている。

HyperPod CLI と SDK をインストールする

次のとおり、CLI と SDK にアクセスするために必要なパッケージをインストールします。

pip install sagemaker-hyperpod

このコマンドは、HyperPod クラスターを操作するために必要なツールを設定します。

クラスターコンテキストを設定する

HyperPod は、機械学習用に最適化されたクラスターで動作します。まず、使用可能なクラスターを一覧表示して、タスク用のクラスターを選択します。

  1. 次のとおり、利用可能なすべてのビルダーを一覧表示します。

    hyp list-cluster
  2. アクティブなクラスターを選択して設定します。

    hyp set-cluster-context your-eks-cluster-name
  3. 設定の検証:

    hyp get-cluster-context
注記

以降のすべてのコマンドは、コンテキストとして設定したクラスターをターゲットにします。

シナリオを選択する

各シナリオの詳細な手順については、以下のトピックをクリックしてください。