

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Métricas de SageMaker IA da Amazon na Amazon CloudWatch
<a name="monitoring-cloudwatch"></a>

Você pode monitorar a Amazon SageMaker AI usando a Amazon CloudWatch, que coleta dados brutos e os processa em métricas legíveis, quase em tempo real. Essas estatísticas são mantidas por 15 meses. Você pode acessar as informações históricas e ter uma perspectiva melhor sobre o desempenho da aplicação Web ou do serviço. No entanto, o CloudWatch console da Amazon limita a pesquisa às métricas que foram atualizadas nas últimas duas semanas. Essa limitação garante que os trabalhos mais atuais sejam mostrados em seu namespace. 

Para representar graficamente as métricas sem usar uma pesquisa, especifique seu nome exato na exibição de origem. Você também pode definir alarmes que observam determinados limites e enviam notificações ou realizam ações quando esses limites são atingidos. Para obter mais informações, consulte o [Guia CloudWatch do usuário da Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/).



**Topics**
+ [SageMaker Métricas de endpoint de IA](#cloudwatch-metrics-endpoints)
+ [SageMaker Métricas de invocação de endpoints de IA](#cloudwatch-metrics-endpoint-invocation)
+ [SageMaker Métricas do componente de inferência de IA](#cloudwatch-metrics-inference-component)
+ [SageMaker Métricas de endpoint multimodelo de IA](#cloudwatch-metrics-multimodel-endpoints)
+ [SageMaker Métricas de trabalho de IA](#cloudwatch-metrics-jobs)
+ [SageMaker Métricas de empregos do Inference Recommender](#cloudwatch-metrics-inference-recommender)
+ [SageMaker Métricas do Ground Truth](#cloudwatch-metrics-ground-truth)
+ [Métricas da Amazon SageMaker Feature Store](#cloudwatch-metrics-feature-store)
+ [SageMaker métricas de pipelines](#cloudwatch-metrics-pipelines)

## SageMaker Métricas de endpoint de IA
<a name="cloudwatch-metrics-endpoints"></a>

O `/aws/sagemaker/Endpoints` namespace inclui as seguintes métricas para instâncias de endpoint.

As métricas estão disponíveis a uma frequência de 1 minuto.

**nota**  
A Amazon CloudWatch oferece suporte a [métricas personalizadas de alta resolução](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) e sua melhor resolução é de 1 segundo. No entanto, quanto melhor for a resolução, menor será a vida útil das métricas. CloudWatch Para a resolução de frequência de 1 segundo, as CloudWatch métricas ficam disponíveis por 3 horas. Para obter mais informações sobre a resolução e a vida útil das CloudWatch métricas, consulte [GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)a *Amazon CloudWatch API* Reference. 


**Métricas de endpoint**  

| Métrica | Description | 
| --- | --- | 
| CPUReservation |  A soma das CPUs reservas por contêineres em uma instância. Essa métrica é fornecida somente para endpoints que hospedam componentes de inferência ativos. O valor varia de 0% a 100%. Nas configurações de um componente de inferência, você define a reserva de CPU com o parâmetro `NumberOfCpuCoresRequired`. Por exemplo, se 4 CPUs e 2 estiverem reservados, a `CPUReservation` métrica será 50%.  | 
| CPUUtilization |  A soma da utilização de cada núcleo de CPU individual. A utilização da CPU de cada faixa de núcleo é de 0 a 100. Por exemplo, se houver quatro CPUs, o `CPUUtilization` intervalo é de 0% a 400%. Para variantes de endpoint, o valor é a soma da utilização de CPU dos contêineres principais e complementares na instância. Unidades: percentual  | 
| CPUUtilizationNormalized |  A soma normalizada da utilização de cada núcleo de CPU individual. Essa métrica é fornecida somente para endpoints que hospedam componentes de inferência ativos. O valor varia de 0% a 100%. Por exemplo, se houver quatro CPUs e a `CPUUtilization` métrica for 200%, a `CPUUtilizationNormalized` métrica será 50%.  | 
| DiskUtilization | A porcentagem de espaço em disco usada pelos contêineres em uma instância. Esse intervalo de valores é de 0% a 100%.Para variantes de endpoint, o valor é a soma da utilização do espaço em disco dos contêineres primário e complementar na instância.Unidades: percentual | 
| GPUMemoryUtilization |  O percentual de memória de GPU usada pelos contêineres em uma instância. O intervalo de valores é de 0 a 100 e é multiplicado pelo número de. GPUs Por exemplo, se houver quatro GPUs, o `GPUMemoryUtilization` intervalo é de 0% a 400%. Para variantes de endpoint, o valor é a soma da utilização de memória de GPU dos contêineres principais e complementares na instância. Unidades: percentual  | 
| GPUMemoryUtilizationNormalized |  O percentual normalizado de memória de GPU usada pelos contêineres em uma instância. Essa métrica é fornecida somente para endpoints que hospedam componentes de inferência ativos. O valor varia de 0% a 100%. Por exemplo, se houver quatro GPUs e a `GPUMemoryUtilization` métrica for 200%, a `GPUMemoryUtilizationNormalized` métrica será 50%.  | 
| GPUReservation |  A soma das GPUs reservas por contêineres em uma instância. Essa métrica é fornecida somente para endpoints que hospedam componentes de inferência ativos. O valor varia de 0% a 100%. Nas configurações de um componente de inferência, você define a reserva da GPU por `NumberOfAcceleratorDevicesRequired`. Por exemplo, se houver 4 GPUs e 2 forem reservados, a `GPUReservation` métrica será 50%.   | 
| GPUUtilization |  O percentual de unidades de GPU usadas pelos contêineres em uma instância. O valor pode variar entre 0 e 100 e é multiplicado pelo número de. GPUs Por exemplo, se houver quatro GPUs, o `GPUUtilization` intervalo é de 0% a 400%. Para variantes de endpoint, o valor é a soma da utilização de GPU dos contêineres principais e complementares na instância. Unidades: percentual  | 
| GPUUtilizationNormalized |  O percentual normalizado de unidades de GPU usadas pelos contêineres em uma instância. Essa métrica é fornecida somente para endpoints que hospedam componentes de inferência ativos. O valor varia de 0% a 100%. Por exemplo, se houver quatro GPUs e a `GPUUtilization` métrica for 200%, a `GPUUtilizationNormalized` métrica será 50%.   | 
| MemoryReservation |  A soma da memória reservada pelos contêineres em uma instância. Essa métrica é fornecida somente para endpoints que hospedam componentes de inferência ativos. O valor varia de 0% a 100%. Nas configurações de um componente de inferência, você define a reserva de memória com o parâmetro `MinMemoryRequiredInMb`. Por exemplo, se uma instância de 32 GiB reservasse 1.024 MB, a métrica `MemoryReservation` seria 3,125%.  | 
| MemoryUtilization |  O percentual de memória usada pelos contêineres em uma instância. Esse intervalo de valores é de 0% a 100%. Para variantes de endpoint, o valor é a soma da utilização de memória dos contêineres principais e complementares na instância. Unidades: percentual  | 


**Dimensões para métricas de endpoint**  

| Dimensão | Description | 
| --- | --- | 
| EndpointName, VariantName |  Filtra métricas de endpoint para um `ProductionVariant` dos endpoints e variantes especificados.  | 

## SageMaker Métricas de invocação de endpoints de IA
<a name="cloudwatch-metrics-endpoint-invocation"></a>

O namespace `AWS/SageMaker` inclui as seguintes métricas de solicitação de chamadas para [ InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html).

As métricas estão disponíveis a uma frequência de 1 minuto.

A ilustração a seguir mostra como um endpoint de SageMaker IA interage com a API Amazon SageMaker Runtime. O tempo total entre o envio de uma solicitação para um endpoint e o recebimento de uma resposta depende dos três componentes a seguir.
+ Latência de rede — o tempo que leva entre fazer uma solicitação e receber uma resposta da API SageMaker Runtime Runtime.
+ Latência de sobrecarga — o tempo necessário para transportar uma solicitação para o contêiner do modelo e transportar a resposta de volta para a API SageMaker Runtime Runtime.
+ Latência do modelo: o tempo que o contêiner do modelo leva para processar a solicitação e retornar uma resposta.

![\[\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/cloudwatch-latency-types.png)


Para obter mais informações sobre a latência total, consulte [Melhores práticas para testar a carga dos endpoints de inferência em tempo real da Amazon SageMaker AI](https://aws.amazon.com/blogs/machine-learning/best-practices-for-load-testing-amazon-sagemaker-real-time-inference-endpoints/). Para obter informações sobre por quanto tempo as CloudWatch métricas são retidas, consulte [GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)a *Amazon CloudWatch API Reference*.


**Métricas de invocação de endpoint**  

| Métrica | Description | 
| --- | --- | 
| ConcurrentRequestsPerCopy |  O número de solicitações simultâneas sendo recebidas pelo componente de inferência, normalizado por cada cópia de um componente de inferência. Estatísticas válidas: Min, Max  | 
| ConcurrentRequestsPerModel |  O número de solicitações simultâneas sendo recebidas pelo modelo. Estatísticas válidas: Min, Max  | 
| Invocation4XXErrors |  O número de solicitações `InvokeEndpoint` em que o modelo retornou um código de resposta HTTP 4xx. Para cada resposta 4xx, 1 é enviado; caso contrário, 0 é enviado. Unidades: nenhuma Estatísticas válidas: média e soma  | 
| Invocation5XXErrors |  O número de solicitações `InvokeEndpoint` em que o modelo retornou um código de resposta HTTP 5xx. Para cada resposta 5xx, 1 é enviado; caso contrário, 0 é enviado. Unidades: nenhuma Estatísticas válidas: média e soma  | 
| InvocationModelErrors |  O número de solicitações de invocação do modelo que não resultaram em uma resposta HTTP 2XX. Isso inclui códigos de status 4XX/5XX, erros de soquete de baixo nível, respostas HTTP malformadas e tempos limite de solicitação. Para cada resposta de erro, 1 é enviado; caso contrário, 0 é enviado. Unidades: nenhuma Estatísticas válidas: média e soma  | 
| Invocations |  O número de solicitações `InvokeEndpoint` enviadas para um endpoint de modelo.  Para obter o número total de solicitações enviadas a um endpoint de modelo, use a estatística Sum. Unidades: nenhuma Estatísticas válidas: soma  | 
| InvocationsPerCopy |  O número de invocações normalizadas por cada cópia de um componente de inferência. Estatísticas válidas: soma  | 
| InvocationsPerInstance |  O número de invocações enviadas para um modelo, normalizado por `InstanceCount` in each ProductionVariant. 1/ `numberOfInstances` é enviado como o valor em cada solicitação. `numberOfInstances`é o número de instâncias ativas ProductionVariant por trás do endpoint no momento da solicitação. Unidades: nenhuma Estatísticas válidas: soma  | 
| ModelLatency |  O intervalo de tempo gasto por um modelo para responder a uma solicitação da API SageMaker Runtime. Esse intervalo inclui os tempos de comunicação locais necessários para enviar a solicitação e buscar a resposta de um contêiner modelo. Inclui também o tempo necessário para concluir a inferência no contêiner. Unidade: microssegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras, porcentagens  | 
| ModelSetupTime |  O tempo necessário para lançar novos recursos computacionais para um endpoint com tecnologia sem servidor. O tempo pode variar dependendo do tamanho do modelo, do tempo necessário para baixar o modelo e do tempo de inicialização do contêiner. Unidade: microssegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras, porcentagens  | 
| OverheadLatency |  O intervalo de tempo adicionado ao tempo necessário para responder a uma solicitação do cliente pelas despesas gerais de SageMaker IA. Esse intervalo é medido a partir do momento em que a SageMaker IA recebe a solicitação até retornar uma resposta ao cliente, menos o. `ModelLatency` A latência de sobrecarga pode variar dependendo de vários fatores, incluindo tamanhos de carga útil de solicitação e resposta, frequência da solicitação e authentication/authorization da solicitação. Unidade: microssegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras  | 
|  MidStreamErrors  |  O número de erros que ocorrem durante o streaming de respostas após o envio da resposta inicial ao cliente.  Unidades: nenhuma Estatísticas válidas: média e soma  | 
|  FirstChunkLatency  |  O tempo decorrido desde a chegada da solicitação ao endpoint de SageMaker IA até o envio da primeira parte da resposta ao cliente. Essa métrica se aplica às solicitações de inferência de streaming bidirecional. Unidade: microssegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras, porcentagens  | 
|  FirstChunkModelLatency  |  O tempo gasto pelo contêiner do modelo para processar a solicitação e retornar a primeira parte da resposta. Isso é medido desde o momento em que a solicitação é enviada ao contêiner do modelo até o primeiro byte ser recebido do modelo. Essa métrica se aplica às solicitações de inferência de streaming bidirecional. Unidade: microssegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras, porcentagens  | 
|  FirstChunkOverheadLatency  |  A latência de sobrecarga do primeiro bloco, excluindo o tempo de processamento do modelo. Isso é calculado como `FirstChunkLatency` menos`FirstChunkModelLatency`, representando o tempo gasto em operações de roteamento, pré-processamento e pós-processamento na plataforma de IA. SageMaker A latência de sobrecarga pode variar dependendo de vários fatores, incluindo frequência da solicitação, carga e authentication/authorization da solicitação. Essa métrica se aplica às solicitações de inferência de streaming bidirecional. Unidade: microssegundos Estatísticas válidas: média, soma, mínimo, máximo, contagem de amostras, percentil  | 


**Dimensões para métricas de invocação de endpoints**  

| Dimensão | Description | 
| --- | --- | 
| EndpointName, VariantName |  Filtra as métricas de invocação de endpoint para uma `ProductionVariant` do endpoint e da variante especificados.  | 
| InferenceComponentName |  Filtra métricas de invocação do componente de inferência.  | 

## SageMaker Métricas do componente de inferência de IA
<a name="cloudwatch-metrics-inference-component"></a>

O `/aws/sagemaker/InferenceComponents` namespace inclui as seguintes métricas de chamadas [ InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html)para endpoints que hospedam componentes de inferência.

As métricas estão disponíveis a uma frequência de 1 minuto.


**Métricas do componente de inferência**  

| Métrica | Description | 
| --- | --- | 
| CPUUtilizationNormalized |  O valor da métrica `CPUUtilizationNormalized` relatada por cada cópia do componente de inferência. O valor varia de 0% a 100%. Se você definir o parâmetro `NumberOfCpuCoresRequired` nas configurações em cópia do componente de inferência, a métrica apresentará a utilização da reserva. Caso contrário, a métrica apresenta a utilização acima do limite.  | 
| GPUMemoryUtilizationNormalized |  O valor da métrica `GPUMemoryUtilizationNormalized` relatada por cada cópia do componente de inferência.  | 
| GPUUtilizationNormalized |  O valor da métrica `GPUUtilizationNormalized` relatada por cada cópia do componente de inferência. Se você definir o parâmetro `NumberOfAcceleratorDevicesRequired` nas configurações em cópia do componente de inferência, a métrica apresentará a utilização da reserva. Caso contrário, a métrica apresenta a utilização acima do limite.  | 
| MemoryUtilizationNormalized |  O valor de `MemoryUtilizationNormalized` relatado por cada cópia do componente de inferência. Se você definir o parâmetro `MinMemoryRequiredInMb` nas configurações para a cópia do componente de inferência, as métricas apresentarão a utilização da reserva. Caso contrário, as métricas apresentam a utilização acima do limite.  | 


**Dimensões para métricas de componentes de inferência**  

| Dimensão | Description | 
| --- | --- | 
| InferenceComponentName |  Filtra as métricas dos componentes de inferência.  | 

## SageMaker Métricas de endpoint multimodelo de IA
<a name="cloudwatch-metrics-multimodel-endpoints"></a>

O `AWS/SageMaker` namespace inclui as seguintes métricas de carregamento do modelo a partir de chamadas para. [ InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html)

As métricas estão disponíveis a uma frequência de 1 minuto.

Para obter informações sobre por quanto tempo as CloudWatch métricas são retidas, consulte [GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)a *Amazon CloudWatch API Reference*.


**Métricas de carregamento de modelos de endpoints multimodelo**  

| Métrica | Description | 
| --- | --- | 
| ModelLoadingWaitTime  |  O intervalo de tempo em que uma solicitação de invocação esperou o modelo de destino ser baixado, carregado, ou ambos para realizar a inferência.  Unidade: microssegundos  Estatísticas válidas: média, soma, mín., máx., contagem de amostras   | 
| ModelUnloadingTime  |  O intervalo de tempo necessário para descarregar o modelo por meio da chamada de API `UnloadModel` do contêiner.  Unidade: microssegundos  Estatísticas válidas: média, soma, mín., máx., contagem de amostras   | 
| ModelDownloadingTime |  O intervalo de tempo necessário para baixar o modelo do Amazon Simple Storage Service (Amazon S3). Unidade: microssegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras   | 
| ModelLoadingTime  |  O intervalo de tempo necessário para carregar o modelo com a chamada de API `LoadModel` do contêiner. Unidade: microssegundos  Estatísticas válidas: média, soma, mín., máx., contagem de amostras   | 
| ModelCacheHit  |  O número de solicitações `InvokeEndpoint` enviadas para o endpoint multimodelo para o qual o modelo já foi carregado. A estatística Média mostra a proporção de solicitações para as quais o modelo já foi carregado. Unidades: nenhuma Estatísticas válidas: média, soma, contagem de amostras  | 


**Dimensões para métricas de carregamento de modelos de endpoints multimodelo**  

| Dimensão | Description | 
| --- | --- | 
| EndpointName, VariantName |  Filtra as métricas de invocação de endpoint para uma `ProductionVariant` do endpoint e da variante especificados.  | 

Os namespaces `/aws/sagemaker/Endpoints` incluem as seguintes métricas de instância em chamadas para [ InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html).

As métricas estão disponíveis a uma frequência de 1 minuto.

Para obter informações sobre por quanto tempo as CloudWatch métricas são retidas, consulte [GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)a *Amazon CloudWatch API Reference*.


**Métricas de instância de modelo de endpoint multimodelo**  

| Métrica | Description | 
| --- | --- | 
| LoadedModelCount  |  O número de modelos carregados nos contêineres do endpoint multimodelo. Esta métrica é emitida para cada instância. A estatística Média com um período de 1 minuto informa o número médio de modelos carregados por instância. A estatística Soma informa o número total de modelos carregados em todas as instâncias no endpoint. Os modelos que essa métrica rastreia não são necessariamente exclusivos, porque um modelo pode ser carregado em vários contêineres no endpoint. Unidades: nenhuma Estatísticas válidas: média, soma, mín., máx., contagem de amostras  | 


**Dimensões para métricas de carregamento de modelos de endpoints multimodelo**  

| Dimensão | Description | 
| --- | --- | 
| EndpointName, VariantName |  Filtra as métricas de invocação de endpoint para uma `ProductionVariant` do endpoint e da variante especificados.  | 

## SageMaker Métricas de trabalho de IA
<a name="cloudwatch-metrics-jobs"></a>

Os `/aws/sagemaker/TransformJobs` namespaces `/aws/sagemaker/ProcessingJobs``/aws/sagemaker/TrainingJobs`, e incluem as seguintes métricas para trabalhos de processamento, trabalhos de treinamento e trabalhos de transformação em lote.

As métricas estão disponíveis a uma frequência de 1 minuto.

**nota**  
A Amazon CloudWatch oferece suporte a [métricas personalizadas de alta resolução](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) e sua melhor resolução é de 1 segundo. No entanto, quanto melhor for a resolução, menor será a vida útil das métricas. CloudWatch Para a resolução de frequência de 1 segundo, as CloudWatch métricas ficam disponíveis por 3 horas. Para obter mais informações sobre a resolução e a vida útil das CloudWatch métricas, consulte [GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)a *Amazon CloudWatch API* Reference. 

**dica**  
[Para criar um perfil do seu trabalho de treinamento com uma resolução mais precisa de até 100 milissegundos (0,1 segundo) de granularidade e armazenar as métricas de treinamento indefinidamente no Amazon S3 para análise personalizada a qualquer momento, considere usar o Amazon Debugger. SageMaker ](https://docs.aws.amazon.com/sagemaker/latest/dg/train-debugger.html) SageMaker O Debugger fornece regras integradas para detectar automaticamente problemas comuns de treinamento. Ele detecta problemas de utilização de recursos de hardware (como CPU, GPU e I/O gargalos). Detecta também problemas de modelo não convergentes (como sobreajuste, gradientes que desaparecem e tensores explosivos). SageMaker O Debugger também fornece visualizações por meio do Studio Classic e seu relatório de criação de perfil. [Para explorar as visualizações do Debugger, consulte Passo a passo do [painel do SageMaker Debugger Insights, Passo a passo do relatório de criação de perfil do [Debugger](https://docs.aws.amazon.com/sagemaker/latest/dg/debugger-report.html) e Análise de dados usando](https://docs.aws.amazon.com/sagemaker/latest/dg/debugger-on-studio-insights.html) a biblioteca cliente. SMDebug](https://docs.aws.amazon.com/sagemaker/latest/dg/debugger-analyze-data.html)


**Métricas de trabalho de processamento, trabalho de treinamento e trabalho de transformação em lote**  

| Métrica | Description | 
| --- | --- | 
| CPUUtilization | A soma da utilização de cada núcleo de CPU individual. A utilização da CPU de cada faixa de núcleo é de 0 a 100. Por exemplo, se houver quatro CPUs, o CPUUtilization intervalo é de 0% a 400%. Para trabalhos de processamento, o valor é a utilização da CPU do contêiner de processamento na instância.Para trabalhos de treinamento, o valor é a utilização de CPU do contêiner de algoritmo na instância.Para trabalhos de transformação em lote, o valor é a utilização da CPU do contêiner de transformação na instância. Para trabalhos de múltiplas instâncias, cada instância relata métricas de utilização da CPU. No entanto, a visualização padrão CloudWatch mostra a utilização média da CPU em todas as instâncias. Unidades: percentual | 
| DiskUtilization | A porcentagem de espaço em disco usada pelos contêineres em uma instância. Esse intervalo de valores é de 0% a 100%. Essa métrica não oferece apoio para trabalhos de transformação em lote.Para trabalhos de processamento, o valor é a utilização do espaço em disco do contêiner de processamento na instância.Para trabalhos de treinamento, o valor é a utilização do espaço em disco do contêiner de algoritmo na instância.Unidades: percentual Para trabalhos de múltiplas instâncias, cada instância relata métricas de utilização do disco. No entanto, a visualização padrão CloudWatch mostra a utilização média do disco em todas as instâncias.  | 
| GPUMemoryUtilization | O percentual de memória de GPU usada pelos contêineres em uma instância. O intervalo de valores é de 0 a 100 e é multiplicado pelo número de. GPUs Por exemplo, se houver quatro GPUs, o `GPUMemoryUtilization` intervalo é de 0% a 400%.Para trabalhos de processamento, o valor é a utilização da memória de GPU do contêiner de processamento na instância.Para trabalhos de treinamento, o valor é a utilização de memória de GPU do contêiner de algoritmo na instância.Para trabalhos de transformação em lote, o valor é a utilização de memória da GPU do contêiner de transformação na instância. Para trabalhos de múltiplas instâncias, cada instância relata métricas de utilização de memória da GPU. No entanto, a visualização padrão CloudWatch mostra a utilização média da memória da GPU em todas as instâncias. Unidades: percentual | 
| GPUUtilization | O percentual de unidades de GPU usadas pelos contêineres em uma instância. O valor pode variar entre 0 e 100 e é multiplicado pelo número de. GPUs Por exemplo, se houver quatro GPUs, o `GPUUtilization` intervalo é de 0% a 400%.Para trabalhos de processamento, o valor é a utilização da GPU do contêiner de processamento na instância.Para trabalhos de treinamento, o valor é a soma da utilização de GPU do contêiner de algoritmo na instância.Para trabalhos de transformação em lote, o valor é a utilização da GPU do contêiner de transformação na instância. Para trabalhos de múltiplas instâncias, cada instância relata métricas de utilização da GPU. No entanto, a visualização padrão CloudWatch mostra a utilização média da GPU em todas as instâncias. Unidades: percentual | 
| MemoryUtilization | O percentual de memória usada pelos contêineres em uma instância. Esse intervalo de valores é de 0% a 100%.Para trabalhos de processamento, o valor é a utilização de memória do contêiner de processamento na instância.Para trabalhos de treinamento, o valor é a utilização de memória do contêiner de algoritmo na instância.Para trabalhos de transformação em lote, o valor é a utilização de memória do contêiner de transformação na instância.Unidades: percentual Para várias instâncias, cada instância relata métricas de utilização de memória. No entanto, a visualização padrão CloudWatch mostra a utilização média da memória em todas as instâncias.  | 


**Dimensões para métricas de trabalho**  

| Dimensão | Description | 
| --- | --- | 
| Host |  Para trabalhos de processamento, o valor dessa dimensão tem o formato `[processing-job-name]/algo-[instance-number-in-cluster]`. Use essa dimensão para filtrar as métricas de instância para o trabalho de processamento e a instância especificados. Esse formato de dimensão está presente somente no namespace `/aws/sagemaker/ProcessingJobs`. Para trabalhos de treinamento, o valor dessa dimensão tem o formato `[training-job-name]/algo-[instance-number-in-cluster]`. Use essa dimensão para filtrar as métricas de instância para o trabalho de treinamento e a instância especificados. Esse formato de dimensão está presente somente no namespace `/aws/sagemaker/TrainingJobs`. Para trabalhos de transformação em lote, o valor dessa dimensão tem o formato `[transform-job-name]/[instance-id]`. Use essa dimensão para filtrar métricas de instância para o trabalho de transformação em lote e a instância especificados. Esse formato de dimensão está presente somente no namespace `/aws/sagemaker/TransformJobs`.  | 

## SageMaker Métricas de empregos do Inference Recommender
<a name="cloudwatch-metrics-inference-recommender"></a>

O namespace `/aws/sagemaker/InferenceRecommendationsJobs` inclui as seguintes métricas para trabalhos de recomendação de inferência:


**Métricas do Inference Recommender**  

| Métrica | Description | 
| --- | --- | 
| ClientInvocations |  O número de solicitações `InvokeEndpoint` enviadas para um endpoint do modelo, conforme observado pelo Inference Recommender. Unidades: nenhuma Estatísticas válidas: soma  | 
| ClientInvocationErrors |  O número de `InvokeEndpoint` solicitações que falharam, conforme observado pelo Inference Recommender. Unidades: nenhuma Estatísticas válidas: soma  | 
| ClientLatency |  O intervalo de tempo gasto entre o envio de uma chamada `InvokeEndpoint` e o recebimento de uma resposta, conforme observado pelo Inference Recommender. Observe que o tempo está em milissegundos, enquanto a métrica de invocação do endpoint `ModelLatency` está em microssegundos. Unidade: milissegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras, porcentagens  | 
| NumberOfUsers |  O número de usuários simultâneos enviando solicitações `InvokeEndpoint` para o endpoint do modelo. Unidades: nenhuma Estatísticas válidas: mínimo, máximo e média  | 


**Dimensões para métricas de trabalho do Inference Recommender**  

| Dimensão | Description | 
| --- | --- | 
| JobName |  Filtra as métricas do trabalho do Inference Recommender para o trabalho especificado do Inference Recommender.  | 
| EndpointName |  Filtra as métricas de trabalho do Inference Recommender para o endpoint especificado.  | 

## SageMaker Métricas do Ground Truth
<a name="cloudwatch-metrics-ground-truth"></a>


**Métricas do Ground Truth**  

| Métrica | Description | 
| --- | --- | 
| ActiveWorkers |  Um único operador ativo em uma equipe de trabalho privada enviou, liberou ou recusou uma tarefa. Para obter o número total de operadores ativos, use a estatística Soma. Ground Truth procura entregar cada evento `ActiveWorkers` individual uma vez. Se essa entrega não for bem-sucedida, essa métrica pode não conseguir relatar o número total de operadores ativos. Unidades: nenhuma Estatísticas válidas: Soma e Contagem de amostras  | 
| DatasetObjectsAutoAnnotated |  O número de objetos de conjunto de dados anotados automaticamente em um trabalho de rotulagem. Essa métrica é emitida apenas quando a rotulagem automatizada está habilitada. Para exibir o progresso do trabalho de rotulagem, use a métrica Max. Unidades: nenhuma Estatísticas válidas: número máximo  | 
| DatasetObjectsHumanAnnotated |  O número de objetos de conjunto de dados anotados por um ser humano em um trabalho de rotulagem. Para exibir o progresso do trabalho de rotulagem, use a métrica Max. Unidades: nenhuma Estatísticas válidas: número máximo  | 
| DatasetObjectsLabelingFailed |  O número de objetos de conjunto de dados que falharam na rotulagem de um trabalho de rotulagem. Para exibir o progresso do trabalho de rotulagem, use a métrica Max. Unidades: nenhuma Estatísticas válidas: número máximo  | 
| JobsFailed |  Um único trabalho de etiquetagem falhou. Para obter o número total de trabalhos de rotulagem que falharam, use a estatística Sum. Unidades: nenhuma Estatísticas válidas: Soma e Contagem de amostras  | 
| JobsSucceeded |  Um único trabalho de etiquetagem foi bem-sucedido. Para obter o número total de trabalhos de rotulagem que foram bem-sucedidos, use a estatística Sum. Unidades: nenhuma Estatísticas válidas: Soma e Contagem de amostras  | 
| JobsStopped |  Um único trabalho de etiquetagem foi interrompido. Para obter o número total de trabalhos de rotulagem que foram interrompidos, use a estatística Sum. Unidades: nenhuma Estatísticas válidas: Soma e Contagem de amostras  | 
| TasksAccepted |  Uma única tarefa foi aceita por um operador. Para obter o número total de tarefas aceitas pelos operadores, use a estatística Sum. Ground Truth tenta entregar cada evento `TaskAccepted` individual uma vez. Se essa entrega não for bem-sucedida, essa métrica pode não relatar o número total de tarefas aceitas. Unidades: nenhuma  Estatísticas válidas: Soma e Contagem de amostras  | 
| TasksDeclined |  Uma única tarefa foi recusada por um funcionário. Para obter o número total de tarefas recusadas pelos operadores, use a estatística Sum. Ground Truth tenta entregar cada evento `TasksDeclined` individual uma vez. Se essa entrega não for bem-sucedida, essa métrica pode não relatar o número total de tarefas recusadas. Unidades: nenhuma Estatísticas válidas: Soma e contagem de amostras  | 
| TasksReturned |  Uma única tarefa foi retornada. Para obter o número total de tarefas retornadas, use a estatística Sum. Ground Truth tenta entregar cada evento `TasksReturned` individual uma vez. Se essa entrega não for bem-sucedida, essa métrica pode não relatar o número total de tarefas retornadas. Unidades: nenhuma  Estatísticas válidas: Soma e Contagem de amostras  | 
| TasksSubmitted |  Uma única tarefa foi submitted/completed feita por um funcionário particular. Para obter o número total de tarefas enviadas pelos operadores, use a estatística Sum. Ground Truth tenta entregar cada evento `TasksSubmitted` individual uma vez. Se essa entrega não for bem-sucedida, essa métrica pode não relatar o número total de tarefas enviadas. Unidades: nenhuma Estatísticas válidas: Soma e Contagem de amostras  | 
| TimeSpent |  Tempo gasto em uma tarefa concluída por um operador privada. Essa métrica não inclui o momento em que um operador fez uma pausa ou fez uma pausa. Ground Truth tenta realizar cada evento `TimeSpent` uma vez. Se essa entrega não for bem-sucedida, essa métrica pode não relatar o tempo total gasto. Unidades: segundos Estatísticas válidas: Soma e Contagem de amostras  | 
| TotalDatasetObjectsLabeled |  O número de objetos de conjunto de dados rotulados com êxito em um trabalho de rotulagem. Para exibir o progresso do trabalho de rotulagem, use a métrica Max. Unidades: nenhuma Estatísticas válidas: número máximo  | 


**Dimensões para métricas de objetos do conjunto de dados**  

| Dimensão | Description | 
| --- | --- | 
| LabelingJobName |  Filtra métricas de contagem de objetos de conjunto de dados para um trabalho de rotulagem.  | 

## Métricas da Amazon SageMaker Feature Store
<a name="cloudwatch-metrics-feature-store"></a>


**Métricas de consumo da Feature Store**  

| Métrica | Description | 
| --- | --- | 
| ConsumedReadRequestsUnits |  O número de unidades de leitura consumidas durante o período especificado. Você pode recuperar as unidades de leitura consumidas para uma operação de runtime da feature store e seu arquivo de atributos correspondente. Unidades: nenhuma Estatística válida: Todas  | 
| ConsumedWriteRequestsUnits |  O número de unidades de gravação consumidas durante o período especificado. Você pode recuperar as unidades de gravação consumidas para uma operação de runtime da feature store e seu arquivo de atributos correspondente. Unidades: nenhuma Estatística válida: Todas  | 
| ConsumedReadCapacityUnits |  O número de unidades de capacidade de leitura provisionadas consumidas ao longo do período especificado. Você pode recuperar as unidades de capacidade de leitura consumidas para uma operação de runtime do arquivo de atributos e grupo de atributos correspondente. Unidades: nenhuma Estatística válida: Todas  | 
| ConsumedWriteCapacityUnits |  O número de unidades de capacidade de gravação provisionadas consumidas ao longo do período especificado. Você pode recuperar as unidades de capacidade de gravação consumidas para uma operação de runtime do arquivo de atributos e seu grupo de atributos correspondente. Unidades: nenhuma Estatística válida: Todas  | 


**Dimensões das métricas de consumo da Feature Store**  

| Dimensão | Description | 
| --- | --- | 
| FeatureGroupName, OperationName |  Filtra as métricas de consumo de runtime do feature store e da operação que você especificou.  | 


**Métricas operacionais da Feature Store**  

| Métrica | Description | 
| --- | --- | 
| Invocations |  O número de solicitações feitas às operações de runtime da feature store durante o período especificado. Unidades: nenhuma Estatísticas válidas: soma  | 
| Operation4XXErrors |  O número de solicitações feitas às operações de runtime do Feature Store em que a operação retornou um código de resposta HTTP 4xx. Para cada resposta 4xx, 1 é enviado; caso contrário, 0 é enviado. Unidades: nenhuma Estatísticas válidas: média e soma  | 
| Operation5XXErrors |  O número de solicitações feitas às operações de runtime da feature store em que a operação retornou um código de resposta HTTP 5xx. Para cada resposta 5xx, 1 é enviado; caso contrário, 0 é enviado. Unidades: nenhuma Estatísticas válidas: média e soma  | 
| ThrottledRequests |  O número de solicitações feitas às operações de runtime da feature store em que a solicitação foi limitada. Para cada solicitação controlada, 1 é enviado; caso contrário, 0 é enviado. Unidades: nenhuma Estatísticas válidas: média e soma  | 
| Latency |  O intervalo de tempo para processar as solicitações feitas às operações de runtime do Feature Store. Esse intervalo é medido a partir do momento em que a SageMaker IA recebe a solicitação até retornar uma resposta ao cliente. Unidade: microssegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras, porcentagens  | 


**Dimensões das métricas operacionais da Feature Store**  

| Dimensão | Description | 
| --- | --- | 
|  `FeatureGroupName`, `OperationName`  | Filtra as métricas operacionais de runtime da feature store do arquivo de atributos e da operação que você especificou. Você pode usar essas dimensões para operações que não sejam em lote GetRecord PutRecord, como, DeleteRecord e. | 
| OperationName |  Filtra as métricas operacionais de runtime da feature store para a operação que você especificou. Você pode usar essa dimensão para operações em lote, como BatchGetRecord.  | 

## SageMaker métricas de pipelines
<a name="cloudwatch-metrics-pipelines"></a>

O namespace `AWS/Sagemaker/ModelBuildingPipeline` inclui as métricas a seguir para execuções do pipeline.

Duas categorias de métricas de execução do pipeline estão disponíveis:
+  **Métricas de execução em todos os pipelines**: métricas de execução do pipeline no nível da conta (para todos os pipelines na conta atual)
+  **Métricas de execução de pipelines**: métricas de execução de pipeline por pipeline

As métricas estão disponíveis a uma frequência de 1 minuto.


**Métricas de execução do pipeline**  

| Métrica | Description | 
| --- | --- | 
| ExecutionStarted |  O número de execuções de pipeline iniciadas. Unidades: contagem Estatísticas válidas: média e soma  | 
| ExecutionFailed |  O número de execuções de pipeline que falharam. Unidades: contagem Estatísticas válidas: média e soma  | 
| ExecutionSucceeded |  O número de execuções de pipeline que foram bem-sucedidas. Unidades: contagem Estatísticas válidas: média e soma  | 
| ExecutionStopped |  O número de execuções do pipeline que pararam. Unidades: contagem Estatísticas válidas: média e soma  | 
| ExecutionDuration |  A duração em milissegundos em que a execução do pipeline foi executada. Unidade: milissegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras  | 


**Dimensões das métricas de execução do pipeline**  

| Dimensão | Description | 
| --- | --- | 
| PipelineName |  Filtra as métricas de execução do pipeline para um pipeline especificado.  | 

O namespace `AWS/Sagemaker/ModelBuildingPipeline` inclui as métricas a seguir para as etapas de execuções do pipeline.

As métricas estão disponíveis a uma frequência de 1 minuto.


**Métricas da etapa do pipeline**  

| Métrica | Description | 
| --- | --- | 
| StepStarted |  O número de etapas iniciadas. Unidades: contagem Estatísticas válidas: média e soma  | 
| StepFailed |  O número de chamadas que falharam. Unidades: contagem Estatísticas válidas: média e soma  | 
| StepSucceeded |  O número de etapas que foram bem-sucedidas. Unidades: contagem Estatísticas válidas: média e soma  | 
| StepStopped |  O número de etapas que pararam. Unidades: contagem Estatísticas válidas: média e soma  | 
| StepDuration |  A duração da execução da etapa em milissegundos. Unidade: milissegundos Estatísticas válidas: média, soma, mín., máx., contagem de amostras  | 


**Dimensões das métricas de etapas do pipeline**  

| Dimensão | Description | 
| --- | --- | 
| PipelineName, StepName |  Filtra métricas de etapas para um pipeline e uma etapa especificados.  | 