As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Amazon SageMaker Inference Recommender
O Amazon SageMaker Inference Recommender é um recurso do Amazon SageMaker AI. Ele reduz o tempo necessário para colocar modelos de machine learning (ML) em produção ao automatizar o teste de carga e o ajuste de modelos em todas as instâncias de ML do SageMaker AI. Você pode usar o recomendador de inferência para implantar seu modelo em um endpoint de inferência em tempo real ou sem servidor que ofereça melhor desempenho com custo mais baixo. O Inference Recommender ajuda você a selecionar o melhor tipo de instância e configuração para seus modelos e workloads de ML. Ele considera fatores como contagem de instâncias, parâmetros de contêiner, otimizações de modelo, simultaneidade máxima e tamanho da memória.
O Amazon SageMaker Inference Recommender cobra apenas pelas instâncias usadas durante a execução dos trabalhos.
Como funciona
Para usar o Amazon SageMaker Inference Recommender, você pode criar um modelo do SageMaker AI ou registrar um modelo no Registro de Modelos do SageMaker AI com os artefatos do modelo. Use o AWS SDK para Python (Boto3) ou o console do SageMaker AI para executar trabalhos de análise comparativa para diferentes configurações de endpoint do SageMaker AI. Os trabalhos do recomendador de inferência ajudam você a coletar e visualizar métricas de desempenho e utilização de recursos para ajudá-lo a decidir qual tipo de endpoint e configuração escolher.
Como começar
Se você é um usuário pela primeira vez do Amazon SageMaker Inference Recommender, recomendamos que você faça o seguinte:
-
Leia a seção Amazon SageMaker Inference Recommender para garantir que você atendeu aos requisitos para usar o Amazon SageMaker Inference Recommender.
-
Leia a seção Tarefas de recomendação com o Amazon SageMaker Inference Recommender para iniciar seus primeiros trabalhos de recomendação do recomendador de inferência.
-
Explore o exemplo introdutório do caderno Jupyter
do Amazon SageMaker Inference Recommender ou analise os exemplos de cadernos na seção a seguir.
Cadernos de exemplo
O seguinte exemplo de cadernos Jupyter pode ajudá-lo com os fluxos de trabalho para vários casos de uso no recomendador de inferência:
-
Se você quiser comparar um modelo HuggingFace, consulte o SageMaker Inference Recommender
para o caderno HuggingFace. -
Se você quiser comparar um modelo XGBoost, consulte o caderno do SageMaker Inference Recommender XGBoost
. -
Se você quiser analisar as métricas do CloudWatch para seus trabalhos de recomendação de inferência, consulte o Caderno de métricas do CloudWatch do SageMaker Inference Recommender
.