非同期推論エンドポイントを作成する方法 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

非同期推論エンドポイントを作成する方法

SageMaker AI ホスティングサービスを使用してエンドポイントを作成するのと同じ方法で、非同期エンドポイントを作成します。

  • を使用して SageMaker AI でモデルを作成しますCreateModel

  • CreateEndpointConfig を使用してエンドポイント設定を作成する。

  • CreateEndpoint を使用して HTTPS エンドポイントを作成する。

エンドポイントを作成するには、まず、CreateModel を使用してモデルアーティファクトと Docker レジストリパス (イメージ) をポイントする、モデルを作成します。次に、 を使用して設定を作成し、CreateModelAPI を使用して作成された 1 つ以上のモデルを指定してデプロイし、SageMaker AI でプロビジョニングするリソースCreateEndpointConfigを指定します。リクエストで指定したエンドポイント設定を使用して CreateEndpoint でエンドポイントを作成します。非同期エンドポイントは、UpdateEndpoint API を使用して更新できます。InvokeEndpointAsync を使って、エンドポイント ホストされているモデルとの間で推論リクエストを送受信します。エンドポイントは DeleteEndpoint API を使用して削除できます。

使用可能な SageMaker イメージの完全なリストについては、「使用可能な Deep Learning Containers イメージ」を参照してください。Docker イメージの作成方法の詳細については、「カスタム推論コードを持つコンテナ」を参照してください。