

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Recomendador de SageMaker inferência da Amazon
<a name="inference-recommender"></a>

O Amazon SageMaker Inference Recommender é um recurso do Amazon SageMaker AI. Ele reduz o tempo necessário para colocar modelos de aprendizado de máquina (ML) em produção ao automatizar os testes de carga e o ajuste de modelos em todas as instâncias de SageMaker AI ML. Você pode usar o recomendador de inferência para implantar seu modelo em um endpoint de inferência em tempo real ou sem servidor que ofereça melhor desempenho com custo mais baixo. O Inference Recommender ajuda você a selecionar o melhor tipo de instância e configuração para seus modelos e workloads de ML. Ele considera fatores como contagem de instâncias, parâmetros de contêiner, otimizações de modelo, simultaneidade máxima e tamanho da memória.

O Amazon SageMaker Inference Recommender cobra apenas pelas instâncias usadas durante a execução dos trabalhos.

## Como funciona
<a name="inference-recommender-how-it-works"></a>

Para usar o Amazon SageMaker Inference Recommender, você pode [criar um modelo de SageMaker IA ou registrar um modelo](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateModel.html) no SageMaker Registro de modelos com seus artefatos de modelo. Use o console de SageMaker IA AWS SDK para Python (Boto3) ou o console para executar trabalhos de benchmarking para diferentes configurações de endpoints de SageMaker IA. Os trabalhos do recomendador de inferência ajudam você a coletar e visualizar métricas de desempenho e utilização de recursos para ajudá-lo a decidir qual tipo de endpoint e configuração escolher.

## Como começar
<a name="inference-recommender-get-started"></a>

Se você for um usuário iniciante do Amazon SageMaker Inference Recommender, recomendamos que você faça o seguinte:

1. Leia a [Pré-requisitos para usar o Amazon Inference Recommender SageMaker](inference-recommender-prerequisites.md) seção para se certificar de que você atendeu aos requisitos para usar o Amazon SageMaker Inference Recommender.

1. Leia a seção [Empregos de recomendação com o Amazon SageMaker Inference Recommender](inference-recommender-recommendation-jobs.md) para iniciar seus primeiros trabalhos de recomendação do recomendador de inferência.

1. Explore o exemplo introdutório do caderno [Jupyter do Amazon SageMaker Inference Recommender ou analise os exemplos de cadernos](https://github.com/aws/amazon-sagemaker-examples/blob/master/sagemaker-inference-recommender/inference-recommender.ipynb) na seção a seguir.

## Cadernos de exemplo
<a name="inference-recommender-notebooks"></a>

O seguinte exemplo de cadernos Jupyter pode ajudá-lo com os fluxos de trabalho para vários casos de uso no recomendador de inferência:
+ Se você quiser um caderno introdutório que compare um TensorFlow modelo, consulte o caderno [SageMaker Inference](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/inference-recommender.ipynb) Recommender. TensorFlow
+ Se você quiser comparar um HuggingFace modelo, consulte o [SageMaker Inference Recommender](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/huggingface-inference-recommender/huggingface-inference-recommender.ipynb) para notebook. HuggingFace
+ Se você quiser comparar um XGBoost modelo, consulte o caderno [SageMaker Inference XGBoost Recommender](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/xgboost/xgboost-inference-recommender.ipynb).
+ Se você quiser revisar CloudWatch as métricas de seus trabalhos do Inference Recommender, consulte o caderno de métricas do [SageMaker Inference CloudWatch Recommender](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/tensorflow-cloudwatch/tf-cloudwatch-inference-recommender.ipynb).