View a markdown version of this page

Amazon EKS의 모니터링 모범 사례 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon EKS의 모니터링 모범 사례

전략적 구현 접근 방식

성공적인 Amazon EKS 모니터링 전략은 잘 계획된 단계별 구현 접근 방식으로 시작됩니다.

  • 먼저 비즈니스 운영 및 애플리케이션 신뢰성에 직접적인 영향을 미치는 중요한 지표를 식별하고 모니터링합니다. 이 기반에는 필수 인프라 지표, 주요 애플리케이션 성능 지표 및 중요 보안 지표가 포함되어야 합니다. 운영 요구 사항과 학습한 교훈에 따라 모니터링 범위를 점진적으로 확장하고 각 추가가 의미 있는 가치를 제공하는지 확인합니다.

  • Terraform 또는와 같은 코드형 인프라(IaC) 도구를 사용하여 자동화된 배포 프로세스를 구현 CloudFormation 하여 일관성과 반복성을 보장합니다.

  • 모니터링 시스템을 테스트하고 검증하여 신뢰성과 정확성을 유지합니다.

  • 변화하는 비즈니스 요구 사항에 따라 모니터링 파라미터를 지속적으로 구체화합니다.

효과적인 데이터 관리

효율적이고 비용 효율적인 모니터링 솔루션을 유지하려면 적절한 데이터 관리가 중요합니다.

  • 과거 분석 요구 사항과 스토리지 비용의 균형을 맞추는 명확한 데이터 보존 정책을 구현합니다.

  • 중요한 지표의 경우 빈도가 높고 덜 중요한 지표의 경우 빈도가 낮은 등 다양한 지표 유형에 적합한 샘플링 속도를 구성합니다.

  • 특히 장기 추세 분석의 경우 지표 집계를 사용하여 데이터 볼륨을 줄이는 동시에 의미 있는 인사이트를 유지할 수 있습니다.

  • 중앙 집중식 로깅 시스템(예: CloudWatch Logs)에 대한 체계적인 로그 보존 및 보관 절차를 구현하여 스토리지 비용을 관리하고 중요한 데이터에 대한 액세스를 계속 액세스할 수 있도록 합니다.

    참고

    컨테이너 수준 로그 교체는 Amazon EKS 버전 1.21 이상의 kubelet에서 자동으로 처리됩니다.

  • 액세스 속도와 비용 효율성을 모두 최적화하려면 로그 스토리지에 hot-warm-cold 아키텍처를 구현하는 것이 좋습니다.

알림 구성 및 관리

알림 구성에는 알림 피로를 유발하지 않고 효과를 유지하기 위한 신중한 고려가 필요합니다.

  • 서비스 수준 목표(SLOs) 및 과거 성능 패턴을 기반으로 명확하고 실행 가능한 임계값을 정의합니다.

  • 즉각적인 주의가 필요한 중요한 문제와 덜 긴급한 문제를 명확하게 구분하는 계층화된 알림 심각도 시스템을 구현합니다.

  • 신속한 문제 해결을 위해 알림이 충분한 컨텍스트와 실행 가능한 정보를 제공하는지 확인합니다.

  • 다양한 알림 심각도에 대해 정의된 소유권 및 응답 시간으로 명확한 에스컬레이션 절차를 수립합니다.

  • 알림 구성을 정기적으로 검토하고 구체화하여 관련성과 효과를 유지할 수 있습니다.

리소스 최적화

비용 효율적인 운영을 유지하려면 리소스 사용률을 지속적으로 모니터링해야 합니다.

  • 노드, 포드 및 영구 볼륨을 포함한 모든 클러스터 구성 요소에 포괄적인 리소스 모니터링을 구현합니다.

  • 실제 사용 패턴 및 성능 요구 사항에 따라 자동 조정을 구성하여 성능을 유지하면서 효율적인 리소스 사용률을 보장합니다.

  • 비용 할당 태그를 사용하여 다양한 팀, 애플리케이션 또는 환경의 리소스 소비를 추적할 수 있습니다.

  • 리소스 효율성 지표를 정기적으로 분석하여 최적화 기회를 식별하고 개선 사항을 구현합니다.

  • 비용 관리 도구를 구현하여 클라우드 지출을 추적하고 최적화하는 것이 좋습니다.

보안

보안 고려 사항은 모니터링 전략에서 반드시 필요합니다.

  • 모든 모니터링 구성 요소에 대해 최소 권한 액세스 원칙을 구현하여 사용자와 서비스가 필요한 권한만 갖도록 합니다.

  • 포괄적인 감사 로깅을 활성화하여 모니터링 시스템에 대한 모든 액세스 및 변경 사항을 추적할 수 있습니다.

  • 모니터링 구성 및 액세스 패턴에 대한 정기적인 보안 검토를 수행하여 잠재적 취약성을 식별합니다.

  • 전송 중 및 저장 중 민감한 모니터링 데이터에 대한 암호화를 구현합니다.

  • 보안 모니터링을 기존 보안 정보 및 이벤트 관리(SIEM) 시스템과 통합하여 포괄적인 보안 가시성을 확보합니다.