As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Implantar o modelo em grande escala
Configure o escalonamento CloudWatch e o monitoramento automáticos para SageMaker seu endpoint de IA para prepará-lo para a produção.
Por que o monitoramento da produção é importante para a classificação de texto
As workloads de classificação de texto exigem monitoramento porque elas:
Experimentam padrões de tráfego variáveis com picos de processamento.
Exigem tempos de resposta inferiores a um segundo.
Necessitam de ajuste de escala automático para otimizar os custos.
Pré-requisitos
Antes de começar, garanta que você tenha:
Seu endpoint de SageMaker IA implantado na seção anterior.
O nome do seu endpoint (por exemplo, jumpstart-dft-hf-tc).
Seu Região da AWS (por exemplo, us-east-2).
Para criar ou solucionar problemas de endpoint, consulte Inferência em tempo real.
Configurar o monitoramento da produção
Configure o CloudWatch monitoramento para monitorar o desempenho do seu modelo na produção.
-
No seu JupyterLab espaço, abra o
sagemaker_production_monitoring.ipynbcaderno do pacote de avaliação que você carregou anteriormente. -
Atualize o nome e a região do endpoint na seção de configuração.
-
Para configurar, siga as instruções do caderno:
Ajuste de escala automático (de uma a dez instâncias com base no tráfego).
CloudWatch alarmes para limites de latência e invocação.
Painel de métricas para monitoramento visual.
Verificar sua configuração
Depois de concluir as etapas do caderno, verifique se você tem:
tatus do endpoint:
InService.Ajuste de escala automático: de uma a dez instâncias configuradas.
CloudWatch Alarmes: monitoramento de 2 alarmes.
Métricas: mais de 15 métricas registradas.
nota
Os alarmes podem mostrar INSUFFICIENT_DATA inicialmente. Isso é normal e mudará para OK com o uso.
Monitorar um endpoint
Acesse o monitoramento visual por meio do AWS Management Console:
Para obter mais informações, consulte Monitor SageMaker AI.
Gerenciar custos e limpar recursos
Sua configuração de monitoramento fornece informações valiosas sobre a produção, mas também gera AWS cobranças contínuas por meio de CloudWatch métricas, alarmes e políticas de auto-escalonamento. Saber como gerenciar esses custos é essencial para ter operações econômicas. Limpe os recursos quando eles não forem mais necessários.
Atenção
Seu endpoint continua incorrendo em cobranças mesmo quando não está processando solicitações. Para interromper todas as cobranças, exclua o endpoint. Para obter instruções, consulte Excluir endpoints e recursos.
Para configurações avançadas de monitoramento, consulte CloudWatch Métricas para SageMaker IA.