实时推理非常适合有实时、交互式、低延迟要求的推理工作负载。您可以将模型部署到 SageMaker AI 托管服务,并获得可用于推理的端点。这些端点是完全托管的,并支持自动扩缩(请参阅自动扩缩 Amazon SageMaker AI 模型)。
为实时推理部署模型
调用模型进行实时推理
端点
托管选项
自动扩缩 Amazon SageMaker AI 模型
实例存储卷
验证生产中的模型
借助 SageMaker Clarify 提供在线解释能力
使用适配器推理组件微调模型
Javascript 在您的浏览器中被禁用或不可用。
要使用 Amazon Web Services 文档,必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。
感谢您对我们工作的肯定!
如果不耽误您的时间,请告诉我们做得好的地方,让我们做得更好。
感谢您告诉我们本页内容还需要完善。很抱歉让您失望了。
如果不耽误您的时间,请告诉我们如何改进文档。