Amazon SageMaker Studio で JumpStart 基盤モデルをデプロイします。
次の手順は、Amazon SageMaker Studio を使用して JumpStart モデルおよびソリューションにアクセスする方法を説明しています。
前提条件
Amazon SageMaker HyperPod クラスターで推論機能が設定済みであることを確認します。詳細については、「モデルデプロイ用の HyperPod クラスターの設定」を参照してください。
HyperPod デプロイを作成する
-
Amazon SageMaker Studio で、左側のナビゲーションペインから [JumpStart] ランディングページを開きます。
-
[すべてのパブリックモデル] で、デプロイするモデルを選択します。
注記
ゲートモデルを選択した場合は、エンドユーザー使用許諾契約 (EULA) に同意する必要があります。
-
SageMaker HyperPod を選択します。
-
[デプロイ設定] で、JumpStart はデプロイするインスタンスのレコメンデーションを提供します。このフィールドは、必要に応じて変更できます。
-
インスタンスタイプを変更する場合は、選択した HyperPod クラスターと互換性があることを確認してください。互換性のあるインスタンスがない場合は、新しい HyperPod クラスターを選択するか、管理者に連絡して互換性のあるインスタンスをクラスターに追加してもらう必要があります。
-
モデルのデプロイに優先順位を付けるには、タスクガバナンスアドオンをインストールし、コンピューティング割り当てを作成して、クラスターポリシーのタスクの順位付けを設定します。これが完了すると、クラスター上の他のデプロイやタスクのプリエンプションに使用できるモデルデプロイの優先度を選択するオプションが表示されます。
-
管理者がアクセスを許可した名前空間を入力します。正確な名前空間を取得するには、管理者に直接連絡する必要がある場合があります。有効な名前空間が提供されたら、モデルをデプロイするための[デプロイ] ボタンが有効になるはずです。
-
-
[デプロイ] をクリックして、[エンドポイント] が作成されるまで待ちます。
-
エンドポイントが作成されたら、[推論をテスト] を選択します。
HyperPod デプロイを編集する
-
Amazon SageMaker Studio で、左側のナビゲーションペインから [コンピューティング] を選択し、[HyperPod クラスター] を選択します。
-
[デプロイ] で、変更する HyperPod クラスターデプロイを選択します。
-
縦の省略記号アイコン (⋮) から [編集] を選択します。
-
[デプロイ設定] では、[オートスケーリング] を有効または無効にし、[最大レプリカ数] の値を変更できます。
-
[保存] を選択します。
-
[ステータス] が [更新中] に変わります。[サービス中] に戻ったら、変更は完了し、確認メッセージが表示されます。
HyperPod デプロイを削除する
-
Amazon SageMaker Studio で、左側のナビゲーションペインから [コンピューティング] を選択し、[HyperPod クラスター] を選択します。
-
[デプロイ] で、変更する HyperPod クラスターデプロイを選択します。
-
縦の省略記号アイコン (⋮) から [削除] を選択します。
-
[HyperPod デプロイの削除ウィンドウ] で、チェックボックスをオンにします。
-
[削除] を選択します。
-
[ステータス] が [削除中] に変わります。HyperPod デプロイが削除されると、確認メッセージが表示されます。