As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Recomendações de inferência
Os trabalhos de recomendação de inferência executam um conjunto de testes de carga em tipos de instância recomendados ou em um endpoint com tecnologia sem servidor. Os trabalhos de recomendação de inferência usam métricas de desempenho baseadas em testes de carga usando os dados de amostra fornecidos durante o registro da versão do modelo.
nota
Antes de criar um trabalho de recomendação de inferência, verifique se você satisfez o Amazon SageMaker Inference Recommender.
A seguir demonstramos como usar o Amazon SageMaker Inference Recommender para criar uma recomendação de inferência com base no tipo de modelo usando o AWS SDK para Python (Boto3), a AWS CLI, o Amazon SageMaker Studio Classic e o console do SageMaker AI.