HyperPod CLI と SDK を使用したモデルのトレーニングとデプロイ - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

HyperPod CLI と SDK を使用したモデルのトレーニングとデプロイ

Amazon SageMaker HyperPod は、機械学習モデルを大規模にトレーニングおよびデプロイするのに役立ちます。 AWS HyperPod CLI は、機械学習 (ML) ワークフローを簡素化する統合コマンドラインインターフェイスです AWS。インフラストラクチャの複雑さを抽象化し、ML トレーニングジョブを送信、モニタリング、管理するための効率的なエクスペリエンスを提供します。CLI は、インフラストラクチャ管理ではなくモデル開発に集中したいデータサイエンティストや ML エンジニア向けに特別に設計されています。このトピックでは、PyTorch モデルのトレーニング、トレーニングされたアーティファクトを使用したカスタムモデルのデプロイ、JumpStart モデルのデプロイの 3 つの主要なシナリオについて説明します。この簡潔なチュートリアルは、初めてのユーザー向けに設計されており、HyperPod CLI または SDK を使用してモデルを簡単にセットアップ、トレーニング、デプロイできます。トレーニングと推論の間のハンドシェイクプロセスは、モデルアーティファクトを効果的に管理するのに役立ちます。

前提条件

Amazon SageMaker HyperPod の使用を開始する前に、以下を確認してください。

  • Amazon SageMaker HyperPod にアクセスできる AWS アカウント

  • Python 3.9、3.10、または 3.11 がインストールされている

  • AWS CLI 適切な認証情報で設定されている。

HyperPod CLI と SDK をインストールする

CLI と SDK にアクセスするために必要なパッケージをインストールします。

pip install sagemaker-hyperpod

このコマンドは、HyperPod クラスターを操作するために必要なツールを設定します。

クラスターコンテキストを設定する

HyperPod は、機械学習用に最適化されたクラスターで動作します。まず、使用可能なクラスターを一覧表示して、タスク用にクラスターを選択します。

  1. 使用可能なすべてのクラスターを一覧表示します。

    hyp list-cluster
  2. アクティブなクラスターを選択して設定します。

    hyp set-cluster-context your-eks-cluster-name
  3. 設定を確認します。

    hyp get-cluster-context
注記

後続のすべてのコマンドは、コンテキストとして設定したクラスターをターゲットにします。

シナリオを選択する

各シナリオの詳細な手順については、以下のトピックをクリックします。