Amazon SageMaker Inference Recommender - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Amazon SageMaker Inference Recommender

O Amazon SageMaker Inference Recommender é um recurso do Amazon SageMaker AI. Ele reduz o tempo necessário para colocar modelos de machine learning (ML) em produção ao automatizar o teste de carga e o ajuste de modelos em todas as instâncias de ML do SageMaker AI. Você pode usar o recomendador de inferência para implantar seu modelo em um endpoint de inferência em tempo real ou sem servidor que ofereça melhor desempenho com custo mais baixo. O Inference Recommender ajuda você a selecionar o melhor tipo de instância e configuração para seus modelos e workloads de ML. Ele considera fatores como contagem de instâncias, parâmetros de contêiner, otimizações de modelo, simultaneidade máxima e tamanho da memória.

O Amazon SageMaker Inference Recommender cobra apenas pelas instâncias usadas durante a execução dos trabalhos.

Como funciona

Para usar o Amazon SageMaker Inference Recommender, você pode criar um modelo do SageMaker AI ou registrar um modelo no Registro de Modelos do SageMaker AI com os artefatos do modelo. Use o AWS SDK para Python (Boto3) ou o console do SageMaker AI para executar trabalhos de análise comparativa para diferentes configurações de endpoint do SageMaker AI. Os trabalhos do recomendador de inferência ajudam você a coletar e visualizar métricas de desempenho e utilização de recursos para ajudá-lo a decidir qual tipo de endpoint e configuração escolher.

Como começar

Se você é um usuário pela primeira vez do Amazon SageMaker Inference Recommender, recomendamos que você faça o seguinte:

  1. Leia a seção Amazon SageMaker Inference Recommender para garantir que você atendeu aos requisitos para usar o Amazon SageMaker Inference Recommender.

  2. Leia a seção Tarefas de recomendação com o Amazon SageMaker Inference Recommender para iniciar seus primeiros trabalhos de recomendação do recomendador de inferência.

  3. Explore o exemplo introdutório do caderno Jupyter do Amazon SageMaker Inference Recommender ou analise os exemplos de cadernos na seção a seguir.

Cadernos de exemplo

O seguinte exemplo de cadernos Jupyter pode ajudá-lo com os fluxos de trabalho para vários casos de uso no recomendador de inferência: