Implantar o modelo em grande escala - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Implantar o modelo em grande escala

Configure o escalonamento CloudWatch e o monitoramento automáticos para SageMaker seu endpoint de IA para prepará-lo para a produção.

Por que o monitoramento da produção é importante para a classificação de texto

As workloads de classificação de texto exigem monitoramento porque elas:

  • Experimentam padrões de tráfego variáveis com picos de processamento.

  • Exigem tempos de resposta inferiores a um segundo.

  • Necessitam de ajuste de escala automático para otimizar os custos.

Pré-requisitos

Antes de começar, garanta que você tenha:

  • Seu endpoint de SageMaker IA implantado na seção anterior.

  • O nome do seu endpoint (por exemplo, jumpstart-dft-hf-tc).

  • Seu Região da AWS (por exemplo, us-east-2).

Para criar ou solucionar problemas de endpoint, consulte Inferência em tempo real.

Configurar o monitoramento da produção

Configure o CloudWatch monitoramento para monitorar o desempenho do seu modelo na produção.

  1. No seu JupyterLab espaço, abra o sagemaker_production_monitoring.ipynb caderno do pacote de avaliação que você carregou anteriormente.

  2. Atualize o nome e a região do endpoint na seção de configuração.

  3. Para configurar, siga as instruções do caderno:

    • Ajuste de escala automático (de uma a dez instâncias com base no tráfego).

    • CloudWatch alarmes para limites de latência e invocação.

    • Painel de métricas para monitoramento visual.

Verificar sua configuração

Depois de concluir as etapas do caderno, verifique se você tem:

  • tatus do endpoint: InService.

  • Ajuste de escala automático: de uma a dez instâncias configuradas.

  • CloudWatch Alarmes: monitoramento de 2 alarmes.

  • Métricas: mais de 15 métricas registradas.

nota

Os alarmes podem mostrar INSUFFICIENT_DATA inicialmente. Isso é normal e mudará para OK com o uso.

Monitorar um endpoint

Acesse o monitoramento visual por meio do AWS Management Console:

Para obter mais informações, consulte Monitor SageMaker AI.

Gerenciar custos e limpar recursos

Sua configuração de monitoramento fornece informações valiosas sobre a produção, mas também gera AWS cobranças contínuas por meio de CloudWatch métricas, alarmes e políticas de auto-escalonamento. Saber como gerenciar esses custos é essencial para ter operações econômicas. Limpe os recursos quando eles não forem mais necessários.

Atenção

Seu endpoint continua incorrendo em cobranças mesmo quando não está processando solicitações. Para interromper todas as cobranças, exclua o endpoint. Para obter instruções, consulte Excluir endpoints e recursos.

Para configurações avançadas de monitoramento, consulte CloudWatch Métricas para SageMaker IA.