翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 非同期推論
<a name="async-inference"></a>

Amazon SageMaker 非同期推論は、受信リクエストをキューに入れて非同期で処理する SageMaker AI の機能です。このオプションは、ペイロードサイズが大きく (最大 1 GB)、処理時間が長い (最大 1 時間)、ほぼリアルタイムのレイテンシー要件があるリクエストに最適です。非同期推論では、処理するリクエストがない場合、インスタンスカウントをゼロにオートスケーリングすることによりコストを節約できるため、エンドポイントがリクエストを処理している場合にのみ料金が発生します。

## 仕組み
<a name="async-inference-how-it-works"></a>

非同期推論エンドポイントの作成は、リアルタイムの推論エンドポイントの作成に似ています。既存の SageMaker AI モデルを使用でき、必要なのは、エンドポイントの設定を作成する際に、`CreateEndpointConfig` API の `EndpointConfig` フィールドで `AsyncInferenceConfig` オブジェクトを指定することだけです。次の図は、非同期推論のアーキテクチャとワークフローを示しています。

![\[ユーザーがどのようにエンドポイントを呼び出すかを示す非同期推論のアーキテクチャ図。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/async-architecture.png)


エンドポイントを呼び出すには、リクエストペイロードを Amazon S3 に配置する必要があります。また、このペイロードへのポインタを `InvokeEndpointAsync` リクエストの一部として指定する必要があります。呼び出しとともに、SageMaker AI は処理のリクエストをキューに入れ、識別子と出力場所をレスポンスとして返します。処理時に、SageMaker AI は所定の Amazon S3 ロケーションに結果を配置します。成功またはエラー通知を Amazon SNS で受け取るようにオプションで選択することもできます。非同期通知の設定方法の詳細については、「[予測結果をチェックする](async-inference-check-predictions.md)」を参照してください。

**注記**  
エンドポイント設定に非同期推論の設定 (`AsyncInferenceConfig`) オブジェクトが含まれているということは、エンドポイントで受け取ることができるのは非同期呼び出しのみということを意味します。

## 使用を開始する方法をお知りになりたいですか?
<a name="async-inference-how-to-get-started"></a>

Amazon SageMaker 非同期推論を初めて使用する場合は、次のことを行うことをお勧めします。
+ 非同期エンドポイントを作成、呼び出し、更新、削除する方法の詳細については、「[非同期エンドポイントオペレーション](async-inference-create-invoke-update-delete.md)」を参照してください。
+ [aws/amazon-sagemaker-examples](https://github.com/aws/amazon-sagemaker-examples) GitHub リポジトリで、[非同期推論のサンプルノートブック](https://github.com/aws/amazon-sagemaker-examples/blob/main/async-inference/Async-Inference-Walkthrough.ipynb)を詳しく見てください。

この [Exclusions](deployment-guardrails-exclusions.md) ページにリストされているいずれかの機能をエンドポイントで使用する場合は、非同期推論を使用できないことにご注意ください。