콘텐츠 도메인 4: 모니터링 및 로깅 - AWS Certified DevOps Engineer - Professional

콘텐츠 도메인 4: 모니터링 및 로깅

작업 설명 4.1: 로그 및 지표의 수집, 집계 및 저장 구성

관련 지식:

  • 애플리케이션 및 인프라 모니터링 방법

  • Amazon CloudWatch 지표(예: 네임스페이스, 지표, 차원 및 해상도)

  • 실시간 로그 수집

  • 저장 및 전송 중 로그 및 지표에 대한 암호화 옵션(예: 클라이언트 측 및 서버 측, AWS Key Management Service(AWS KMS))

  • 보안 구성(예: 로그 수집을 허용하는 IAM 역할 및 권한)

관련 기술:

  • 안전한 로그 저장 및 관리

  • 지표 필터를 사용하여 로그 이벤트에서 CloudWatch 지표 만들기

  • CloudWatch 지표 스트림 만들기(예: Amazon S3 또는 Amazon Kinesis Data Firehose 옵션)

  • 사용자 지정 지표 수집(예: CloudWatch 에이전트 사용)

  • 로그 스토리지 수명 주기 관리(예: Amazon S3 수명 주기, CloudWatch 로그 그룹 보존)

  • CloudWatch 로그 구독을 사용하여 로그 데이터 처리(예: Amazon Kinesis, AWS Lambda, Amazon OpenSearch Service)

  • 필터 및 패턴 구문 또는 Amazon CloudWatch 로그 인사이트를 사용하여 로그 데이터 검색

  • 로그 데이터의 암호화 구성(예: AWS KMS)

작업 설명 4.2: 로그와 지표를 감사, 모니터링 및 분석하여 문제를 탐지합니다.

관련 지식:

  • 이상 탐지 경보(예: CloudWatch 이상 탐지)

  • 일반적인 CloudWatch 지표 및 로그(예: Amazon EC2의 CPU 사용률, Amazon RDS의 대기열 길이, Application Load Balancer(ALB)의 5xx 오류)

  • Amazon Inspector 및 일반 평가 템플릿

  • AWS Config 규칙

  • AWS CloudTrail 로그 이벤트

관련 기술:

  • CloudWatch 대시보드 및 Amazon QuickSight 시각화 구축

  • CloudWatch 경보를 CloudWatch 지표와 연결(표준 및 사용자 지정)

  • 다양한 서비스(예: 컨테이너, Amazon API Gateway, Lambda)에 대해 AWS X-Ray 구성

  • 실시간 로그 스트림 분석(예: Amazon Kinesis Data Streams 사용)

  • AWS 서비스를 사용한 로그 분석(예: Amazon Athena, CloudWatch 로그 인사이트)

작업 설명 4.3: 복잡한 환경의 모니터링 및 이벤트 관리 자동화

관련 지식:

  • 이벤트 중심의 비동기식 설계 패턴(예: Amazon Simple Notification Service(Amazon SNS) 또는 Lambda에 대한 S3 Event Notifications 또는 Amazon EventBridge 이벤트)

  • 다양한 AWS 서비스를 위한 오토 스케일링 기능(예: EC2 Auto Scaling 그룹, RDS 스토리지 오토 스케일링, Amazon DynamoDB, Amazon Elastic Container Service(Amazon ECS) 용량 공급자, Amazon Elastic Kubernetes Service(Amazon EKS) 오토스케일러)

  • 경고 알림 및 작업 기능(예: Amazon SNS, Lambda, EC2 자동 복구에 대한 CloudWatch 경보)

  • AWS 서비스의 상태 확인 기능(예: ALB 대상 그룹, Amazon Route 53)

관련 기술:

  • 오토 스케일링을 위한 솔루션 구성(예: DynamoDB, EC2 Auto Scaling 그룹, RDS 스토리지 오토 스케일링, ECS 용량 공급자)

  • CloudWatch 사용자 지정 지표 및 지표 필터, 경보 및 알림 만들기(예: Amazon SNS, Lambda)

  • 로그 파일을 처리하고(예: Lambda 사용) 로그 파일을 다른 대상(예: OpenSearch Service, CloudWatch Logs)으로 전송하도록 S3 이벤트 구성

  • 특정 이벤트 패턴을 기반으로 알림을 보내도록 EventBridge 구성

  • EC2 인스턴스에 에이전트 설치 및 구성(예: AWS Systems Manager 에이전트(SSM 에이전트), CloudWatch 에이전트)

  • 문제를 해결하기 위한 AWS Config 규칙 구성

  • 상태 확인 구성(예: Route 53, ALB)