일반 모범 사례 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

일반 모범 사례

다음 모범 사례는 Amazon RDS 워크로드 상태에 대한 충분한 가시성을 확보하고 운영 이벤트 및 데이터 모니터링에 대응하여 적절한 조치를 취하는 데 도움이 됩니다.

  • KPI 식별. 원하는 비즈니스 성과를 기반으로 핵심 성과 지표(KPI)를 식별합니다. KPI를 평가하여 워크로드 성공을 확인합니다. 예를 들어 핵심 비즈니스가 전자 상거래인 경우 원하는 비즈니스 성과 중 하나가 고객이 쇼핑을 할 수 있도록 연중무휴로 온라인 매장을 운영하는 것일 수 있습니다. 이러한 비즈니스 성과를 달성하기 위해 온라인 매장 애플리케이션이 사용하는 백엔드 Amazon RDS 데이터베이스에 대한 가용성 KPI를 정의하고 기준 KPI를 매주 99.99%로 설정합니다. 기준 값을 기반으로 실제 가용성 KPI를 평가하면 99.99%의 원하는 데이터베이스 가용성을 충족하여 연중무휴 서비스 제공이라는 비즈니스 성과를 달성하고 있는지 확인하는 데 도움이 됩니다.

  • 워크로드 지표 정의. 워크로드 지표를 정의하여 Amazon RDS 워크로드의 수량과 품질을 측정합니다. 지표를 평가하여 워크로드가 원하는 결과를 달성하고 있는지 확인하고 워크로드 상태를 파악합니다. 예를 들어 Amazon RDS DB 인스턴스의 가용성 KPI를 평가하려면 DB 인스턴스의 가동 시간 및 가동 중지 시간과 같은 지표를 측정해야 합니다. 그런 다음 이러한 지표를 사용하여 다음과 같이 가용성 KPI를 계산할 수 있습니다.

    availability = uptime / (uptime + downtime)

    지표는 시간순으로 정렬된 데이터 포인트 세트를 나타냅니다. 지표에는 분류 및 분석에 유용한 차원이 포함될 수도 있습니다.

  • 워크로드 지표 수집 및 분석. Amazon RDS는 구성에 따라 여러 지표와 로그를 생성합니다. 이 중 일부는 DB 인스턴스 이벤트, 카운터 또는 db.Cache.innoDB_buffer_pool_hits와 같은 통계를 나타냅니다. 다른 지표는 호스트 Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스의 총 메모리 양을 측정하는 memory.Total와 같은 운영 체제에서 가져옵니다. 모니터링 도구는 수집된 지표를 정기적으로 선제적으로 분석하여 추세를 식별하고 적절한 대응이 필요한지를 확인해야 합니다.

  • 워크로드 지표 기준 설정. 지표의 기준을 설정하여 예상 값을 정의하고 좋은 상태의 임계치 또는 나쁜 상태의 임계치를 식별합니다. 예를 들어 일반 데이터베이스 작업에서 ReadIOPS에 대한 기준을 최대 1,000으로 정의할 수 있습니다. 그런 다음 비교할 때 이 기준을 사용하고 과다한 사용을 식별할 수 있습니다. 새 지표에서 읽기 IOPS가 2,000~3,000 범위에 있는 것으로 일관되게 표시되는 경우 조사, 개입 및 개선을 위한 응답을 트리거할 수 있는 편차를 식별한 것입니다.

  • 워크로드 성과가 위험한 수준일 때 알림 전송. 비즈니스 성과가 위험한 수준이라고 판단되면 알림을 보냅니다. 그런 다음 고객에게 영향을 주기 전에 선제적으로 문제를 해결하거나 적시에 인시던트의 영향을 완화할 수 있습니다.

  • 워크로드에 대해 예상되는 활동 패턴 식별. 지표 기준에 따라 워크로드 활동 패턴을 설정하여 예상치 못한 동작을 식별하고 필요한 경우 적절한 조치를 취합니다. AWS에서는 통계 및 기계 학습 알고리즘을 적용하여 지표를 분석하고 이상을 감지하는 모니터링 도구를 제공합니다.

  • 워크로드 이상이 감지된 경우 알림 생성. Amazon RDS 워크로드 작업에서 이상이 감지되면 필요한 경우 적절한 조치로 대응할 수 있도록 알림을 생성합니다.

  • KPI 및 지표의 검토 및 수정. Amazon RDS 데이터베이스가 정의된 요구 사항을 충족하는지 확인하고 비즈니스 목표를 달성하기 위해 잠재적 개선 영역을 식별합니다. 측정된 지표와 평가된 KPI의 효과를 검증하고 필요한 경우 수정합니다. 예를 들어 최적의 동시 데이터베이스 연결 수에 대한 KPI를 설정하고 시도된 연결 수와 실패한 연결 수 및 생성된 스레드 수와 실행 중인 스레드 수에 대한 지표를 모니터링한다고 가정합니다. KPI 기준에서 정의한 것보다 데이터베이스 연결이 더 많을 수 있습니다. 현재 지표를 분석하여 성과를 감지할 수 있지만 근본 원인은 파악하지 못할 수 있습니다. 이 경우 지표를 수정하고 테이블 잠금 카운터와 같은 추가 모니터링 조치를 포함해야 합니다. 새 지표는 예상치 못한 테이블 잠금으로 인해 데이터 연결 수가 증가했는지 확인하는 데 도움이 됩니다.