

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# サーバーレスエンドポイントを呼び出す
<a name="serverless-endpoints-invoke"></a>

サーバーレスエンドポイントを使用して推論を実行するには、エンドポイントに HTTP リクエストを送信する必要があります。[InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html) API または を使用して AWS CLI、エンドポイントを呼び出す`POST`リクエストを行うことができます。サーバーレス呼び出しのリクエストとレスポンスペイロードの最大サイズは 4 MB です。サーバーレスエンドポイントの場合:
+ モデルのダウンロードと `/ping` へのサーバーの応答は、3 分以内に行われる必要があります。
+ コンテナが `/invocations` への推論リクエストに応答するためのタイムアウトは 1 分です。

## エンドポイントを呼び出すには
<a name="serverless-endpoints-invoke-api"></a>

次の例では、[AWS SDK for Python (Boto3)](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html) を使用して [InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html) API を呼び出します。このガイドの他の API コールとは異なり、`InvokeEndpoint` の場合は、SageMaker ランタイムをクライアントとして使用する必要があります。次の値を指定します。
+ `endpoint_name` では、呼び出すインサービスサーバーレスエンドポイントの名前を使用します。
+ `content_type` では、リクエストボディの入力データの MIME タイプを指定します (`application/json` など)。
+ `payload` では、推論のリクエストペイロードを使用します。ペイロードはバイト単位またはファイルのようなオブジェクトでなければなりません。

```
runtime = boto3.client("sagemaker-runtime")

endpoint_name = "<your-endpoint-name>"
content_type = "<request-mime-type>"
payload = <your-request-body>

response = runtime.invoke_endpoint(
    EndpointName=endpoint_name,
    ContentType=content_type,
    Body=payload
)
```