翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
HyperPod CLI と SDK を使用したモデルのトレーニングとデプロイ
Amazon SageMaker HyperPod は、機械学習モデルを大規模にトレーニングおよびデプロイするのに役立ちます。AWSHyperPod CLI は、機械学習 (ML) ワークフローを簡素化する統合コマンドラインインターフェイスですAWS。インフラストラクチャの複雑さを抽象化し、ML トレーニングジョブを送信、モニタリング、管理するための効率的なエクスペリエンスを提供します。CLI は、インフラストラクチャ管理ではなくモデル開発に集中したいデータサイエンティストや ML エンジニア向けの特別設計になっています。このトピックでは、PyTorch モデルのトレーニング、トレーニングされたアーティファクトを使用したカスタムモデルのデプロイ、JumpStart モデルのデプロイの 3 つの主要なシナリオでのウォークスルーを提供します。この簡潔なチュートリアルは、初めてのユーザー向けに設計されており、HyperPod CLI または SDK を使用してモデルを簡単にセットアップ、トレーニング、デプロイできます。トレーニングと推論の間のハンドシェイクプロセスは、モデルアーティファクトを効果的に管理するのに役立ちます。
前提条件
Amazon SageMaker HyperPod の使用を開始する前に、以下を確認する必要があります。
Amazon SageMaker HyperPod にアクセスできるAWSアカウント
Python 3.9、3.10、3.11 がインストール済み
AWS CLI適切な認証情報で設定されている。
HyperPod CLI と SDK をインストールする
次のとおり、CLI と SDK にアクセスするために必要なパッケージをインストールします。
pip install sagemaker-hyperpod
このコマンドは、HyperPod クラスターを操作するために必要なツールを設定します。
クラスターコンテキストを設定する
HyperPod は、機械学習用に最適化されたクラスターで動作します。まず、使用可能なクラスターを一覧表示して、タスク用のクラスターを選択します。
-
次のとおり、利用可能なすべてのビルダーを一覧表示します。
hyp list-cluster -
アクティブなクラスターを選択して設定します。
hyp set-cluster-context your-eks-cluster-name -
設定の検証:
hyp get-cluster-context
注記
以降のすべてのコマンドは、コンテキストとして設定したクラスターをターゲットにします。
シナリオを選択する
各シナリオの詳細な手順については、以下のトピックをクリックしてください。