

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# リアルタイム推論
<a name="realtime-endpoints"></a>

 リアルタイム推論は、リアルタイム、インタラクティブ、低レイテンシーの要件がある推論ワークロードに最適です。SageMaker AI ホスティングサービスにモデルをデプロイし、推論に使用できるエンドポイントを取得できます。これらのエンドポイントはフルマネージドで、オートスケーリングをサポートします (「[Amazon SageMaker AI モデルの自動スケーリング](endpoint-auto-scaling.md)」を参照)。拡張メトリクスを使用して、エンドポイント上の個々のインスタンスとコンテナをモニタリングできます (「」を参照[推論エンドポイントの Amazon SageMaker AI 拡張メトリクス](monitoring-cloudwatch-enhanced-metrics.md))。

**Topics**
+ [リアルタイム推論用のモデルをデプロイする](realtime-endpoints-deploy-models.md)
+ [リアルタイム推論用のモデルを呼び出す](realtime-endpoints-test-endpoints.md)
+ [OpenAI 互換 APIs呼び出す](realtime-endpoints-openai-compatible.md)
+ [エンドポイント](realtime-endpoints-manage.md)
+ [ホスティングオプション](realtime-endpoints-options.md)
+ [Amazon SageMaker AI モデルの自動スケーリング](endpoint-auto-scaling.md)
+ [インスタンスストレージボリューム](host-instance-storage.md)
+ [本番環境でのモデルの検証](model-validation.md)
+ [SageMaker Clarify によるオンライン説明可能性](clarify-online-explainability.md)
+ [インスタンスプールを使用して複数のインスタンスタイプにデプロイする](realtime-endpoints-heterogeneous.md)
+ [アダプター推論コンポーネントを使用してモデルをファインチューニングする](realtime-endpoints-adapt.md)