이 페이지 개선에 도움 주기
이 사용자 가이드에 기여하려면 모든 페이지의 오른쪽 창에 있는 GitHub에서 이 페이지 편집 링크를 선택합니다.
노드의 상태 보기
이 주제에서는 Amazon EKS 클러스터에서 노드 상태 모니터링에 사용할 수 있는 도구와 방법을 설명합니다. 관련 정보에는 노드 수준 문제를 식별하고 진단하는 데 도움이 되는 노드 조건, 이벤트, 감지 사례가 포함됩니다. 여기에 설명된 명령과 패턴을 사용하여 노드 상태 리소스를 검사하고, 상태 조건을 해석하고, 운영 문제 해결을 위해 노드 이벤트를 분석할 수 있습니다.
모든 노드에 대한 Kubernetes 명령을 사용하여 일부 노드 상태 정보를 가져올 수 있습니다. 또한 Amazon EKS Auto Mode 또는 Amazon EKS 관리형 추가 기능을 통해 노드 모니터링 에이전트를 사용하는 경우 문제 해결에 도움이 되는 더욱 다양한 노드 신호를 얻을 수 있습니다. 노드 모니터링 에이전트에서 감지된 상태 문제에 대한 설명은 관찰성 대시보드에서도 확인할 수 있습니다. 자세한 내용은 EKS 노드 모니터링 에이전트에서 노드 상태 문제 감지 섹션을 참조하세요.
노드 조건
노드 조건은 인스턴스 교체 또는 재부팅과 같은 문제 해결 작업이 필요한 터미널 문제를 나타냅니다.
모든 노드에 대한 조건을 가져오려면:
kubectl get nodes -o 'custom-columns=NAME:.metadata.name,CONDITIONS:.status.conditions[*].type,STATUS:.status.conditions[*].status'
특정 노드에 대한 세부 조건을 가져오려면
kubectl describe nodenode-name
정상 노드의 조건 출력 예제:
- lastHeartbeatTime: "2024-11-21T19:07:40Z" lastTransitionTime: "2024-11-08T03:57:40Z" message: Monitoring for the Networking system is active reason: NetworkingIsReady status: "True" type: NetworkingReady
네트워킹 문제가 있는 비정상 노드의 조건 예제:
- lastHeartbeatTime: "2024-11-21T19:12:29Z" lastTransitionTime: "2024-11-08T17:04:17Z" message: IPAM-D has failed to connect to API Server which could be an issue with IPTable rules or any other network configuration. reason: IPAMDNotReady status: "False" type: NetworkingReady
노드 이벤트
노드 이벤트는 일시적인 문제 또는 최적이 아닌 구성을 나타냅니다.
노드 모니터링 에이전트가 보고한 모든 이벤트를 가져오려면
노드 모니터링 에이전트를 사용할 수 있는 경우 다음 명령을 실행할 수 있습니다.
kubectl get events --field-selector=reportingComponent=eks-node-monitoring-agent
샘플 출력:
LAST SEEN TYPE REASON OBJECT MESSAGE 4s Warning SoftLockup node/ip-192-168-71-251.us-west-2.compute.internal CPU stuck for 23s
모든 노드에 대한 이벤트를 가져오려면
kubectl get events --field-selector involvedObject.kind=Node
특정 노드에 대한 이벤트를 가져오려면
kubectl get events --field-selector involvedObject.kind=Node,involvedObject.name=node-name
이벤트를 실시간으로 보려면
kubectl get events -w --field-selector involvedObject.kind=Node
이벤트 출력 예제:
LAST SEEN TYPE REASON OBJECT MESSAGE 2m Warning MemoryPressure Node/node-1 Node experiencing memory pressure 5m Normal NodeReady Node/node-1 Node became ready
일반적인 문제 해결 명령
# Get comprehensive node status kubectl get nodenode-name-o yaml # Watch node status changes kubectl get nodes -w # Get node metrics kubectl top node