

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Implantar o modelo em grande escala
<a name="jumpstart-text-classification-scale"></a>

Configure o escalonamento CloudWatch e o monitoramento automáticos para SageMaker seu endpoint de IA para prepará-lo para a produção.

## Por que o monitoramento da produção é importante para a classificação de texto
<a name="w2aac37c15c27b5"></a>

As workloads de classificação de texto exigem monitoramento porque elas:
+ Experimentam padrões de tráfego variáveis com picos de processamento.
+ Exigem tempos de resposta inferiores a um segundo.
+ Necessitam de ajuste de escala automático para otimizar os custos.

## Pré-requisitos
<a name="w2aac37c15c27b7"></a>

Antes de começar, garanta que você tenha:
+ Seu endpoint de SageMaker IA implantado na seção anterior.
+ O nome do seu endpoint (por exemplo, jumpstart-dft-hf-tc).
+ Seu Região da AWS (por exemplo, us-east-2).

Para criar ou solucionar problemas de endpoint, consulte [Inferência em tempo real](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html).

## Configurar o monitoramento da produção
<a name="w2aac37c15c27b9"></a>

Configure o CloudWatch monitoramento para monitorar o desempenho do seu modelo na produção.

1. No seu JupyterLab espaço, abra o `sagemaker_production_monitoring.ipynb` caderno do pacote de avaliação que você carregou anteriormente.

1. Atualize o nome e a região do endpoint na seção de configuração.

1. Para configurar, siga as instruções do caderno:
   + Ajuste de escala automático (de uma a dez instâncias com base no tráfego).
   + CloudWatch alarmes para limites de latência e invocação.
   + Painel de métricas para monitoramento visual.

## Verificar sua configuração
<a name="w2aac37c15c27c11"></a>

Depois de concluir as etapas do caderno, verifique se você tem:
+ **tatus do endpoint**: `InService`.
+ **Ajuste de escala automático**: de uma a dez instâncias configuradas.
+ **CloudWatch Alarmes**: monitoramento de 2 alarmes.
+ **Métricas**: mais de 15 métricas registradas.

**nota**  
Os alarmes podem mostrar `INSUFFICIENT_DATA` inicialmente. Isso é normal e mudará para `OK` com o uso.

## Monitorar um endpoint
<a name="w2aac37c15c27c13"></a>

Acesse o monitoramento visual por meio do AWS Management Console:
+ [CloudWatch Métricas](https://console.aws.amazon.com/cloudwatch/home#metricsV2:graph=~();query=AWS/SageMaker)
+ [CloudWatch Alarmes](https://console.aws.amazon.com/cloudwatch/home#alarmsV2:)

Para obter mais informações, consulte [Monitor SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-overview.html).

## Gerenciar custos e limpar recursos
<a name="w2aac37c15c27c15"></a>

Sua configuração de monitoramento fornece informações valiosas sobre a produção, mas também gera AWS cobranças contínuas por meio de CloudWatch métricas, alarmes e políticas de auto-escalonamento. Saber como gerenciar esses custos é essencial para ter operações econômicas. Limpe os recursos quando eles não forem mais necessários.

**Atenção**  
Seu endpoint continua incorrendo em cobranças mesmo quando não está processando solicitações. Para interromper todas as cobranças, exclua o endpoint. Para obter instruções, consulte [Excluir endpoints e recursos](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints-delete-resources.html).

Para configurações avançadas de monitoramento, consulte [CloudWatch Métricas para SageMaker IA](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).