Métricas recomendadas - Amazon CloudWatch

Métricas recomendadas

A tabela a seguir lista as métricas recomendadas para cada tipo de componente.

Tipo de componente Tipo de workload Métrica recomendada

Instância do EC2 (servidores Windows)

Padrão/personalizada

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

% de espaço livre de disco lógico

Mbytes de memória disponíveis

Active Directory

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

Mbytes de memória disponíveis

Banco de dados ==> % de acertos de cache do banco de dados de instâncias

Operações de replicação pendentes do DRA do DirectoryServices

Sincronizações de replicação pendentes do DRA do DirectoryServices

Falhas de consultas recursivas do DNS/s

Média de LogicalDisk Comprimento da fila de discos

Aplicação Java

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

Mbytes de memória disponíveis

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Microsoft IIS/.NET Web Front-End

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

Mbytes de memória disponíveis

Nº de exceções do CLR .NET de exceções ocorridas por segundo

Nº total de bytes confirmados de memória do CLR .NET

% de tempo de memória do CLR .NET em GC

Solicitações de aplicações ASP.NET na fila de aplicações

Solicitações do ASP.NET em fila

A aplicação ASP.NET é reiniciada

Camada do banco de dados do Microsoft SQL Server

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

Mbytes de memória disponíveis

% de uso de arquivo de paginação

Tamanho da fila do processador do sistema

Total/s de bytes de interface de rede

% de tempo de disco de disco físico

SQLServer: proporção de acertos do cache do buffer do gerenciador de buffer

SQLServer: expectativa de vida da página do gerenciador de buffer

SQLServer: processos de estatísticas gerais bloqueados

SQLServer: conexões de usuário de estatísticas gerais

SQLServer: bloqueia o número de bloqueios/s

SQLServer: solicitações em lote/s de estatísticas do SQL

MySQL

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

% de espaço livre de disco lógico

Mbytes de memória disponíveis

Workerpool .NET /nível intermediário

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

Mbytes de memória disponíveis

Nº de exceções do CLR .NET de exceções ocorridas por segundo

Nº total de bytes confirmados de memória do CLR .NET

% de tempo de memória do CLR .NET em GC

Nível do núcleo do .NET

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

Mbytes de memória disponíveis

Oracle

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

% de espaço livre de disco lógico

Mbytes de memória disponíveis

Postgres

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

% de espaço livre de disco lógico

Mbytes de memória disponíveis

SharePoint

CPUUtilization

StatusCheckFailed

% de tempo de processador do processador

% de bytes confirmados em uso na memória

Mbytes de memória disponíveis

Recortes de API do cache de aplicações ASP.NET

Solicitações de ASP.NET rejeitadas

Processo de operador de ASP.NET é reiniciado

Páginas de memória/s

Cache de publicação do SharePoint Liberações de cache de publicações/segundo

Solicitação de tempo de execução/página do SharePoint Foundation

Número total de compactações de cache do cache baseado em disco do SharePoint

Taxa de acertos de cache de blob do cache baseado em disco do SharePoint

Taxa de enchimento do cache de blob do cache baseado em disco do SharePoint

Liberações de cache de blob do cache baseado em disco do SharePoint/segundo

Solicitações do ASP.NET em fila

Solicitações de aplicações ASP.NET na fila de aplicações

A aplicação ASP.NET é reiniciada

Média de LogicalDisk S/gravação de disco

Média de LogicalDisk S/leitura de disco

% de tempo de interrupção do processador

Instância do EC2 (servidores Linux)

Padrão/personalizada

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Aplicação Java

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Nível de núcleo do .NET ou nível de banco de dados do SQL Server

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Oracle

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Postgres

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Grupo de instâncias do EC2

Nó único ou com vários nós do SAP HANA
  • hanadb_server_startup_time_variations_seconds

  • hanadb_level_5_alerts_count

  • hanadb_level_4_alerts_count

  • hanadb_out_of_memory_events_count

  • hanadb_max_trigger_read_ratio_percent

  • hanadb_max_trigger_write_ratio_percent

  • hanadb_log_switch_race_ratio_percent

  • hanadb_time_since_last_savepoint_seconds

  • hanadb_disk_usage_highlevel_percent

  • hanadb_current_allocation_limit_used_percent

  • hanadb_table_allocation_limit_used_percent

  • hanadb_cpu_usage_percent

  • hanadb_plan_cache_hit_ratio_percent

  • hanadb_last_data_backup_age_days

Volume do EBS Any

VolumeReadBytes

VolumeWriteBytes

VolumeReadOps

VolumeWriteOps

VolumeQueueLength

VolumeThroughputPercentage

VolumeConsumedReadWriteOps

BurstBalance

Classic ELB

Any

HTTPCode_Backend_4XX

HTTPCode_Backend_5XX

Latência

SurgeQueueLength

UnHealthyHostCount

Aplicativo ELB

Any

HTTPCode_Target_4XX_Count

HTTPCode_Target_5XX_Count

TargetResponseTime

UnHealthyHostCount

Instância de banco de dados do RDS

Any

CPUUtilization

ReadLatency

WriteLatency

BurstBalance

FailedSQLServerAgentJobsCount

Cluster de banco de dados do RDS Any

CPUUtilization

CommitLatency

DatabaseConnections

Deadlocks

FreeableMemory

NetworkThroughput

VolumeBytesUsed

Função do Lambda

Any

Duração

Erros

IteratorAge

ProvisionedConcurrencySpilloverInvocations

Controles de utilização

Fila do SQS

Any

ApproximateAgeOfOldestMessage

ApproximateNumberOfMessagesVisible

NumberOfMessagesSent

Tabela do Amazon DynamoDB Any

SystemErrors

UserErrors

ConsumedReadCapacityUnits

ConsumedWriteCapacityUnits

ReadThrottleEvents

WriteThrottleEvents

ConditionalCheckFailedRequests

TransactionConflict

Bucket do Amazon S3

Any

Se a configuração de replicação com o Replication Time Control (RTC) estiver habilitada:

ReplicationLatency

BytesPendingReplication

OperationsPendingReplication

Se as métricas de solicitação estiverem ativadas:

5xxErrors

4xxErrors

BytesDownloaded

BytesUploaded

AWS Step Functions

Any
Geral
  • ExecutionThrottled

  • ExecutionsAborted

  • ProvisionedBucketSize

  • ProvisionedRefillRate

  • ConsumedCapacity

Se o tipo de máquina de estado for EXPRESS ou nível do grupo de log for OFF
  • ExecutionsFailed

  • ExecutionsTimedOut

Se a máquina de estado tiver funções do Lambda
  • LambdaFunctionsFailed

  • LambdaFunctionsTimedOut

Se a máquina de estado tiver atividades
  • ActivitiesFailed

  • ActivitiesTimedOut

  • ActivitiesHeartbeatTimedOut

Se a máquina de estado tiver integrações de serviço
  • ServiceIntegrationsFailed

  • ServiceIntegrationsTimedOut

Etapa da API REST do API Gateway

Any
  • 4XXErrors

  • 5XXErrors

  • Latência

Cluster do ECS

Any

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

CPUReservation (somente tipo de inicialização do EC2)

CPUUtilization (somente tipo de inicialização do EC2)

MemoryReservation (somente tipo de inicialização do EC2)

MemoryUtilization (somente tipo de inicialização do EC2)

GPUReservation (somente tipo de inicialização do EC2)

instance_cpu_utilization (somente tipo de inicialização do EC2)

instance_filesystem_utilization (somente tipo de inicialização do EC2)

instance_memory_utilization (somente tipo de inicialização do EC2)

instance_network_total_bytes (somente tipo de inicialização do EC2)

Aplicação Java

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

CPUReservation (somente tipo de inicialização do EC2)

CPUUtilization (somente tipo de inicialização do EC2)

MemoryReservation (somente tipo de inicialização do EC2)

MemoryUtilization (somente tipo de inicialização do EC2)

GPUReservation (somente tipo de inicialização do EC2)

instance_cpu_utilization (somente tipo de inicialização do EC2)

instance_filesystem_utilization (somente tipo de inicialização do EC2)

instance_memory_utilization (somente tipo de inicialização do EC2)

instance_network_total_bytes (somente tipo de inicialização do EC2)

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Serviço do ECS

Any

CPUUtilization

MemoryUtilization

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

Aplicação Java

CPUUtilization

MemoryUtilization

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Cluster do EKS

Any

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

Aplicação Java

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Cluster do Kubernetes no EC2

Any

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

Aplicação Java

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

A tabela a seguir lista os processos e as métricas de processo recomendados para cada tipo de componente. O CloudWatch Application Insights não recomenda o monitoramento de processos que não são executados em uma instância.

Tipo de componente Tipo de workload Processo recomendado Métrica recomendada

Instância do EC2 (servidores Windows)

Microsoft IIS/.NET Web Front-End

w3wp

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

Camada do banco de dados do Microsoft SQL Server

SQLAgent

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

sqlservr

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

sqlwriter

procstat cpu_usage,

procstat memory_rss

ReportingServicesService

procstat cpu_usage,

procstat memory_rss

MsDtsServr

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

Msmdsrv

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

Workerpool .NET /nível intermediário

w3wp

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

Nível do núcleo do .NET

w3wp

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes