

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon SageMaker 推理推荐器
<a name="inference-recommender"></a>

Amazon SageMaker 推理推荐器是 Ama SageMaker zon AI 的一项功能。它通过在 SageMaker AI ML 实例之间自动执行负载测试和模型调整，缩短了将机器学习 (ML) 模型投入生产所需的时间。您可以使用 Inference Recommender 将模型部署到以最低成本提供最佳性能的实时推理端点。Inference Recommender 可帮助您为机器学习模型和工作负载选择最佳实例类型和配置。它考虑的因素包括实例数量、容器参数、模型优化、最大并发量和内存大小等。

Amazon SageMaker Inference Reverence Recommerder 仅向您收取任务执行期间使用的实例费用。

## 工作方式
<a name="inference-recommender-how-it-works"></a>

要使用 Amazon SageMaker Inference Recommerder，您可以[创建 A SageMaker I 模型](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateModel.html)，也可以使用模型工件将 SageMaker 模型注册到模型注册表中。使用 适用于 Python (Boto3) 的 AWS SDK 或 SageMaker AI 控制台针对不同的 A SageMaker I 端点配置运行基准测试作业。Inference Recommender 作业有助于您收集和可视化性能和资源利用率方面的指标，以便您决定选择哪种端点类型和配置。

## 如何开始
<a name="inference-recommender-get-started"></a>

如果您是首次使用 Amazon SageMaker Inference 推荐器，我们建议您执行以下操作：

1. 通读[使用 Amazon SageMaker 推理推荐器的先决条件](inference-recommender-prerequisites.md)本节，确保您满足使用 Amazon SageMaker Inference Recommerder 的要求。

1. 阅读[使用 Amazon SageMaker 推理推荐器推荐作业](inference-recommender-recommendation-jobs.md)部分，启动您的第一个 Inference Recommender 推荐作业。

1. 探索 Amazon SageMaker Inference 推荐器 [Jupyter 笔记本](https://github.com/aws/amazon-sagemaker-examples/blob/master/sagemaker-inference-recommender/inference-recommender.ipynb)入门示例，或者查看下一节中的示例笔记本。

## 示例笔记本
<a name="inference-recommender-notebooks"></a>

以下示例 Jupyter 笔记本有助于您完成 Inference Recommender 中多个使用案例的工作流：
+ 如果你想要一款对 TensorFlow 模型进行基准测试的入门笔记本，请参阅 [SageMaker Inference Recommerder 笔记 TensorFlow](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/inference-recommender.ipynb)本。
+ 如果要对 HuggingFace 模型进行基准测试，请参阅笔记本[SageMaker 推理推荐器。 HuggingFace](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/huggingface-inference-recommender/huggingface-inference-recommender.ipynb)
+ 如果你想对 XGBoost 模型进行基准测试，请参阅 [SageMaker Inference Recommerder 笔记 XGBoost](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/xgboost/xgboost-inference-recommender.ipynb)本。
+ 如果您想查看推理推荐器作业的 CloudWatch 指标，请参阅推理推荐器指标[SageMaker 笔记本](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/tensorflow-cloudwatch/tf-cloudwatch-inference-recommender.ipynb)。 CloudWatch 