

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 想定インスタンスを即時に入手する
<a name="inference-recommender-prospective"></a>

Inference Recommender では、SageMaker AI モデルの詳細ページに、想定インスタンス**のリスト、またはモデルに適していると考えられるインスタンスタイプが表示されます。Inference Recommender はモデルに対して自動的に予備的なベンチマークを行い、上位 5 つの想定インスタンスを提供します。これらは予備的なレコメンデーションであるため、より正確な結果を得るには、さらにインスタンスレコメンデーションジョブを実行することをお勧めします。

モデルの想定インスタンスのリストは、[DescribeModel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeModel.html) API、SageMaker Python SDK、または SageMaker AI コンソールを使用してプログラムで表示できます。

**注記**  
この機能が利用可能になるまで、SageMaker AI で作成したモデルの想定インスタンスを取得できません。

コンソールを使用してモデルの想定インスタンスを表示するには、以下の操作を行います。

1. [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/) で、SageMaker コンソールに移動します。

1. 左側のナビゲーションペインで **[推論]** を選択し、次に **[モデル]** を選択します。

1. モデルのリストから、目的のモデルを選択します。

モデルの詳細ページで、**[モデルをデプロイする想定インスタンス]** セクションに移動します。次のスクリーンショットは、このセクションを示しています。

![モデル詳細ページの想定インスタンスのリストのスクリーンショット。](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/inf-rec-prospective.png)


このセクションには、モデルデプロイのコスト、スループット、レイテンシーが最適化される想定インスタンスが、メモリサイズ、CPU と GPU の数、時間あたりのコストなどのインスタンスタイプごとの追加情報とともに表示されます。

サンプルペイロードをベンチマークしてモデルの推論の完全レコメンデーションジョブを実行する場合は、このページからデフォルトの推論レコメンデーションジョブを開始できます。コンソールからデフォルトジョブを開始するには、以下の操作を行います。

1. モデルの詳細ページの **[モデルをデプロイする想定インスタンス] セクション**で **[推論レコメンダージョブを実行]** を選択します。

1. 表示されるダイアログボックスの **[ペイロードのベンチマーク用 S3 バケット]** に、モデルのサンプルペイロードを保存した Amazon S3 の場所を入力します。

1. **[ペイロードコンテンツタイプ]** には、ペイロードデータの MIME タイプを入力します。

1. (オプション) **[SageMaker Neo を使用したモデルコンパイル]** セクションの **[データ入力設定]** にデータ形状をディクショナリ形式で入力します。

1. **[ジョブの実行]** を選択します。

Inference Recommender によってジョブが開始され、SageMaker AI コンソールの **[推論レコメンダー]** リストページにジョブとその結果が表示されます。

高度なジョブを実行してカスタムのロードテストを実行する場合や、ジョブに追加の設定とパラメータを設定する場合は、「[カスタムロードテストを実行する](inference-recommender-load-test.md)」を参照してください。