CloudWatch를 사용한 Express 브로커 모니터링에 대한 Amazon MSK 지표 - Amazon Managed Streaming for Apache Kafka

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

CloudWatch를 사용한 Express 브로커 모니터링에 대한 Amazon MSK 지표

Amazon MSK는 CloudWatch와 통합되므로 MSK Express 브로커에 대한 CloudWatch 지표를 수집, 확인, 분석할 수 있습니다. MSK 프로비저닝된 클러스터에 대해 구성한 지표는 1분 간격으로 자동으로 수집되어 CloudWatch로 푸시됩니다. MSK 프로비저닝된 클러스터의 모니터링 수준을 DEFAULT, PER_BROKER, PER_TOPIC_PER_BROKER 또는 PER_TOPIC_PER_PARTITION 중 하나로 설정할 수 있습니다. 다음 섹션의 표에는 각 모니터링 수준부터 사용할 수 있는 지표가 나와 있습니다.

DEFAULT 수준 지표는 무료입니다. 다른 지표에 대한 요금은 Amazon CloudWatch 요금 페이지에 설명되어 있습니다.

Express 브로커에 대한 DEFAULT 레벨 모니터링

다음 표에 설명된 지표는 DEFAULT 모니터링 수준에서 무료로 사용할 수 있습니다.

이름 표시되는 경우 측정 기준 설명

ActiveControllerCount

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름

클러스터당 오직 하나의 컨트롤러만 지정된 시간에 활성화되어야 합니다.

BytesInPerSec

주제를 생성한 후.

클러스터 이름, 브로커 ID, 주제

클라이언트로부터 받은 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로 제공됩니다.

BytesOutPerSec

주제를 생성한 후.

클러스터 이름, 브로커 ID, 주제

클라이언트에 전송된 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로 제공됩니다.

ClientConnectionCount

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID, 클라이언트 인증

인증된 활성 클라이언트 연결 수입니다.

ConnectionCount

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

활성 인증, 미인증 및 브로커 간 연결 수입니다.

CpuIdle

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

CPU 유휴 시간의 백분율입니다.

CpuSystem

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

커널 공간에 있는 CPU의 백분율입니다.

CpuUser

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

사용자 공간에 있는 CPU의 백분율입니다.

GlobalPartitionCount

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름

클러스터의 모든 주제에서 복제본을 제외한 파티션 수입니다. GlobalPartitionCount에는 복제본이 포함되지 않으므로 주제의 복제 인수가 1보다 큰 경우 PartitionCount 값의 합계가 GlobalPartitionCount보다 클 수 있습니다.

GlobalTopicCount

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름

클러스터의 모든 브로커에 있는 총 주제 수입니다.

EstimatedMaxTimeLag

컨슈머 그룹이 주제에서 컨슘한 후.

소비자 그룹, 주제

MaxOffsetLag를 배출하는 데 걸리는 예상 시간(초)입니다.

LeaderCount

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커당 총 파티션 리더 수(복제본 제외)입니다.

MaxOffsetLag

컨슈머 그룹이 주제에서 컨슘한 후.

소비자 그룹, 주제

주제의 모든 파티션에 대한 최대 오프셋 지연.

MemoryBuffered

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에 대한 버퍼링된 메모리의 크기(바이트)입니다.

MemoryCached

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에 대한 캐시 메모리의 크기(바이트)입니다.

MemoryFree

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에 사용할 수 있는 메모리의 크기(바이트)입니다.

MemoryUsed

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에서 사용 중인 메모리의 크기(바이트)입니다.

MessagesInPerSec

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커의 초당 수신 메시지 수입니다.

NetworkRxDropped

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

삭제된 수신 패키지의 수입니다.

NetworkRxErrors

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에 대한 네트워크 수신 오류 수입니다.

NetworkRxPackets

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에서 수신된 패킷 수입니다.

NetworkTxDropped

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

삭제된 전송 패키지의 수입니다.

NetworkTxErrors

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커의 네트워크 전송 오류 수입니다.

NetworkTxPackets

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커가 전송한 패킷 수입니다.

PartitionCount

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

복제본을 포함하여 브로커당 주제 파티션의 총 수입니다.

ProduceTotalTimeMsMean

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

밀리초 단위의 평균 프로덕션 시간.

RequestBytesMean

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에 대한 요청 바이트의 평균 수입니다.

RequestTime

요청 스로틀링이 적용된 후.

클러스터 이름, 브로커 ID

브로커 네트워크 및 I/O 스레드가 요청을 처리하는 데 걸린 평균 시간(밀리초)입니다.

StorageUsed 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름 클러스터의 모든 파티션에서 복제본을 제외하고 사용한 총 스토리지 수입니다.

SumOffsetLag

컨슈머 그룹이 주제에서 컨슘한 후.

소비자 그룹, 주제

주제의 모든 파티션에 대한 집계된 오프셋 지연

UserPartitionExists

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

브로커에 사용자 소유 파티션이 있음을 나타내는 부울 지표입니다. 값이 1이면 브로커에 파티션이 있음을 나타냅니다.

Express 브로커에 대한 PER_BROKER 레벨 모니터링

모니터링 수준을 PER_BROKER로 설정하면 모든 DEFAULT 수준 지표에 추가로 다음 표에 설명된 지표가 표시됩니다. 다음 표의 지표에 대해서는 해당 비용을 지불하지만 DEFAULT 수준 지표는 계속 무료로 제공됩니다. 이 표에 있는 지표의 측정 기준은 클러스터 이름, 브로커 ID입니다.

이름 표시되는 경우 설명

ConnectionCloseRate

클러스터가 ACTIVE 상태에 도달한 후.

리스너당 초당 닫힌 연결 수입니다. 이 숫자는 리스너별로 집계되며 클라이언트 리스너에 대해 필터링됩니다.

ConnectionCreationRate

클러스터가 ACTIVE 상태에 도달한 후.

리스너당 초당 설정된 새 연결 수입니다. 이 숫자는 리스너별로 집계되며 클라이언트 리스너에 대해 필터링됩니다.

FetchConsumerLocalTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

컨슈머 요청이 리더에서 처리되는 데 걸리는 평균 시간(밀리초)입니다.

FetchConsumerRequestQueueTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

컨슈머 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다.

FetchConsumerResponseQueueTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

컨슈머 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다.

FetchConsumerResponseSendTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

컨슈머가 응답을 보내는 평균 시간(밀리초)입니다.

FetchConsumerTotalTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

컨슈머가 브로커에서 데이터를 가져오는 데 걸리는 평균 총 시간(밀리초)입니다.

FetchFollowerLocalTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

팔로어 요청이 리더에서 처리되는 데 걸리는 평균 시간(밀리초)입니다.

FetchFollowerRequestQueueTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

팔로어 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다.

FetchFollowerResponseQueueTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

팔로어 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다.

FetchFollowerResponseSendTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

팔로어가 응답을 보내는 평균 시간(밀리초)입니다.

FetchFollowerTotalTimeMsMean

프로듀서/컨슈머가 만들어진 이후.

팔로어가 브로커에서 데이터를 가져오는 데 걸리는 평균 총 시간(밀리초)입니다.

FetchThrottleByteRate

대역폭 스로틀링이 적용된 후.

초당 스로틀링된 바이트 수입니다.

FetchThrottleQueueSize

대역폭 스로틀링이 적용된 후.

스로틀 대기열에 있는 메시지 수입니다.

FetchThrottleTime

대역폭 스로틀링이 적용된 후.

평균 가져오기 스로틀링 시간(밀리초)입니다.

IAMNumberOfConnectionRequests

클러스터가 ACTIVE 상태에 도달한 후.

초당 IAM 인증 요청의 수입니다.

IAMTooManyConnections

클러스터가 ACTIVE 상태에 도달한 후.

100을 초과하여 시도된 연결 수입니다. 0은 연결 수가 한도 내에 있음을 의미합니다. >0인 경우 스로틀 한도가 초과되므로 연결 수를 줄여야 합니다.

NetworkProcessorAvgIdlePercent

클러스터가 ACTIVE 상태에 도달한 후.

네트워크 프로세서가 유휴 상태인 시간의 평균 백분율입니다.

ProduceLocalTimeMsMean

클러스터가 ACTIVE 상태에 도달한 후.

리더에서 요청이 처리되는 데 걸리는 평균 시간(밀리초)입니다.

ProduceRequestQueueTimeMsMean

클러스터가 ACTIVE 상태에 도달한 후.

요청 메시지가 대기열에서 소비하는 평균 시간(밀리초)입니다.

ProduceResponseQueueTimeMsMean

클러스터가 ACTIVE 상태에 도달한 후.

응답 메시지가 대기열에서 소비하는 평균 시간(밀리초)입니다.

ProduceResponseSendTimeMsMean

클러스터가 ACTIVE 상태에 도달한 후.

응답 메시지를 보내는 데 걸린 평균 시간(밀리초)입니다.

ProduceThrottleByteRate

대역폭 스로틀링이 적용된 후.

초당 스로틀링된 바이트 수입니다.

ProduceThrottleQueueSize

대역폭 스로틀링이 적용된 후.

스로틀 대기열에 있는 메시지 수입니다.

ProduceThrottleTime

대역폭 스로틀링이 적용된 후.

평균 프로덕션 스로틀링 시간(밀리초)입니다.

ProduceTotalTimeMsMean

클러스터가 ACTIVE 상태에 도달한 후.

밀리초 단위의 평균 프로덕션 시간.

ReplicationBytesInPerSec

주제를 생성한 후.

다른 브로커로부터 수신하는 초당 바이트 수입니다.

ReplicationBytesOutPerSec

주제를 생성한 후.

다른 브로커로 전송되는 초당 바이트 수입니다.

RequestExemptFromThrottleTime

요청 스로틀링이 적용된 후.

브로커 네트워크 및 I/O 스레드가 스로틀링에서 제외된 요청을 처리하는 데 걸린 평균 시간(밀리초)입니다.

RequestHandlerAvgIdlePercent

클러스터가 ACTIVE 상태에 도달한 후.

요청 핸들러 스레드가 유휴 상태인 시간의 평균 백분율입니다.

RequestThrottleQueueSize

요청 스로틀링이 적용된 후.

스로틀 대기열에 있는 메시지 수입니다.

RequestThrottleTime

요청 스로틀링이 적용된 후.

평균 요청 스로틀링 시간(밀리초)입니다.

TcpConnections

클러스터가 ACTIVE 상태에 도달한 후.

SYN 플래그가 설정된 수신 및 발신 TCP 세그먼트 수를 표시합니다.

TrafficBytes

클러스터가 ACTIVE 상태에 도달한 후.

클라이언트(생산자 및 소비자)와 브로커 간의 네트워크 트래픽을 전체 바이트 단위로 표시합니다. 브로커 사이의 트래픽은 보고되지 않습니다.

Express 브로커에 대한 PER_TOPIC_PER_PARTITION 레벨 모니터링

모니터링 수준을 PER_TOPIC_PER_PARTITION으로 설정하면 모든 PER_TOPIC_PER_BROKER, PER_BROKER, DEFAULT 수준 지표에 추가로 다음 표에 설명된 지표가 표시됩니다. DEFAULT 수준 지표만 무료입니다. 이 표에 있는 지표의 측정 기준은 컨슈머 그룹, 주제, 파티션입니다.

이름 표시되는 경우 설명

EstimatedTimeLag

컨슈머 그룹이 주제에서 컨슘한 후.

파티션 오프셋 지연을 배출하는 데 걸리는 예상 시간(초)입니다.

OffsetLag

컨슈머 그룹이 주제에서 컨슘한 후.

파티션 수준 컨슈머 지연의 오프셋 수입니다.

Express 브로커에 대한 PER_TOPIC_PER_BROKER 레벨 모니터링

모니터링 수준을 PER_TOPIC_PER_BROKER로 설정하면 모든 PER_BROKERDEFAULT 기본 수준 지표에 추가로 다음 표에 설명된 지표가 표시됩니다. DEFAULT 수준 지표만 무료입니다. 이 표에 있는 지표의 측정 기준은 클러스터 이름, 브로커 ID, 주제입니다.

중요

다음 표의 지표는 해당 값이 처음으로 0이 아닌 상태가 된 후에만 나타납니다. 예를 들어, BytesInPerSec를 보려면 하나 이상의 프로듀서가 먼저 클러스터로 데이터를 전송해야 합니다.

이름 표시되는 경우 설명

MessagesInPerSec

주제를 생성한 후.

초당 수신된 메시지 수입니다.