翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
HyperPod CLI と SDK を使用したモデルのトレーニングとデプロイ
Amazon SageMaker HyperPod は、機械学習モデルを大規模にトレーニングおよびデプロイするのに役立ちます。 AWS HyperPod CLI は、機械学習 (ML) ワークフローを簡素化する統合コマンドラインインターフェイスです AWS。インフラストラクチャの複雑さを抽象化し、ML トレーニングジョブを送信、モニタリング、管理するための効率的なエクスペリエンスを提供します。CLI は、インフラストラクチャ管理ではなくモデル開発に集中したいデータサイエンティストや ML エンジニア向けに特別に設計されています。このトピックでは、PyTorch モデルのトレーニング、トレーニングされたアーティファクトを使用したカスタムモデルのデプロイ、JumpStart モデルのデプロイの 3 つの主要なシナリオについて説明します。この簡潔なチュートリアルは、初めてのユーザー向けに設計されており、HyperPod CLI または SDK を使用してモデルを簡単にセットアップ、トレーニング、デプロイできます。トレーニングと推論の間のハンドシェイクプロセスは、モデルアーティファクトを効果的に管理するのに役立ちます。
前提条件
Amazon SageMaker HyperPod の使用を開始する前に、以下を確認してください。
Amazon SageMaker HyperPod にアクセスできる AWS アカウント
Python 3.9、3.10、または 3.11 がインストールされている
AWS CLI 適切な認証情報で設定されている。
HyperPod CLI と SDK をインストールする
CLI と SDK にアクセスするために必要なパッケージをインストールします。
pip install sagemaker-hyperpod
このコマンドは、HyperPod クラスターを操作するために必要なツールを設定します。
クラスターコンテキストを設定する
HyperPod は、機械学習用に最適化されたクラスターで動作します。まず、使用可能なクラスターを一覧表示して、タスク用にクラスターを選択します。
-
使用可能なすべてのクラスターを一覧表示します。
hyp list-cluster
-
アクティブなクラスターを選択して設定します。
hyp set-cluster-context your-eks-cluster-name
-
設定を確認します。
hyp get-cluster-context
注記
後続のすべてのコマンドは、コンテキストとして設定したクラスターをターゲットにします。
シナリオを選択する
各シナリオの詳細な手順については、以下のトピックをクリックします。