환경의 운영 문제 조사 - Amazon CloudWatch

환경의 운영 문제 조사

조사 생성

AWS 콘솔 페이지에서 조사 생성

CloudWatch 경보 페이지, CloudWatch 지표 페이지, Lambda 모니터링 페이지를 비롯한(이에 국한되지 않음) 여러 AWS 콘솔에서 조사를 시작할 수 있습니다.

AWS 콘솔 페이지에서 조사를 시작하려면 다음을 수행합니다.
  1. 계정 수준에서 조사하려는 지표 또는 경보의 그래프를 선택합니다.

  2. 페이지 상단에 조사 버튼이 있을 경우 해당 버튼을 선택한 다음, 새 조사 시작을 선택합니다.

    해당 버튼이 없다면 지표의 세로 줄임표 메뉴 아이콘 Depicts the appearance of the vertical ellipsis icon on the console 을 선택한 후 조사, 새 조사 시작을 선택합니다.

  3. 조사 창에서 New investigation title 이름을 입력하고, 원하는 경우 선택한 지표 또는 경보에 대한 메모를 입력합니다.

  4. 그런 다음, Start investigation을 선택합니다.

    조사가 시작됩니다. CloudWatch 조사는 원격 측정 데이터를 스캔하여 이 상황과 관련이 있을 수 있는 데이터를 찾습니다.

  5. 조사 데이터를 더 큰 창으로 옮기려면 Open in full page를 선택합니다.

  6. 조사를 계속하는 동안 수행할 수 있는 단계에 대한 자세한 지침은 미해결 조사 보기 및 계속 진행하기 섹션을 참조하세요.

Amazon Q 채팅에서 조사 생성

CloudWatch 조사 채팅에서 배포 문제에 대해 질문할 수 있습니다. 예를 들어 “오늘 Lambda 함수가 느린 이유는 무엇인가요?” 같은 질문을 할 수 있습니다.

이렇게 하면 CloudWatch 조사가 후속 질문을 하고 문제에 대한 상태 확인을 실행할 수 있습니다. 상태 확인이 완료되면 채팅에서 조사를 시작할지 묻는 메시지가 표시됩니다.

자세한 내용 및 추가 샘플 질문을 보려면 Amazon Q와 AWS에 대해 채팅 섹션을 참조하세요.

조사가 시작된 후 조사를 계속하는 동안 수행할 수 있는 단계에 대한 자세한 지침은 미해결 조사 보기 및 계속 진행하기 섹션을 참조하세요.

CloudWatch 경보 작업에서 조사 생성

CloudWatch 경보를 생성할 경우, ALARM 상태가 될 때 조사를 자동으로 시작하도록 지정할 수 있습니다. 지표 경보 및 복합 경보를 둘 다 지정할 수 있습니다. 경보를 만드는 방법에 대한 자세한 내용은 지표에 대한 경보복합 경보 생성 섹션을 참조하세요.

미해결 조사 보기 및 계속 진행하기

이 섹션의 단계를 사용하여 기존 조사를 보고 계속 진행합니다.

조사를 보고 계속 진행하려면 다음을 수행합니다.
  1. 아직 조사 페이지에 있지 않은 경우 다음을 수행합니다.

    1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

    2. 왼쪽 탐색 창에서 AI Operations, 조사를 선택합니다.

    3. 조사의 이름을 선택합니다.

  2. 피드 섹션에는 조사 결과에 추가된 항목(예: 조사를 시작하기 위해 원래 선택한 지표 또는 경보)이 표시됩니다.

    오른쪽 창에는 탭이 포함되어 있습니다. 제안 탭을 선택합니다.

  3. 제안 탭에는 CloudWatch 조사가 찾아낸 다른 원격 측정에 대한 관찰이 표시되며, 이러한 관찰은 조사와 연관성이 있을 수 있습니다. 또한 CloudWatch 조사가 상황에 대해 발견한 가능성 있는 이유 또는 근본 원인인 가설이 포함될 수 있습니다.

    CloudWatch 조사는 관찰과 가설을 모두 자연어로 작성합니다.

    여러 가지 옵션이 있습니다.

    • 각 제안에 대해 수락 또는 삭제를 선택할 수 있습니다.

      수락을 선택하면 제안이 피드 섹션에 추가되며, CloudWatch 조사는 이 정보를 사용하여 추가 스캔 및 제안을 지시합니다.

      삭제를 선택하면 제안이 삭제됨 탭으로 이동합니다.

    • 각 관찰 유형 제안의 경우, 제안 탭에서 그래프를 확장하거나 CloudWatch 콘솔에서 그래프를 열어 자세한 내용을 볼 수 있습니다.

    • 일부 관찰은 CloudWatch 조사가 조사의 일환으로 실행한 CloudWatch Logs Insights 쿼리의 결과일 수 있습니다. 관찰이 CloudWatch Logs Insights 쿼리 결과인 경우, 쿼리 자체가 관찰의 일부로 표시됩니다. 쿼리를 편집한 후 다시 실행할 수 있습니다. 이렇게 하려면 결과 An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page. 옆에 있는 세로 줄임표 메뉴 아이콘을 선택한 다음, Open in Logs Insights를 선택합니다. 자세한 내용은 CloudWatch Logs Insights를 사용한 로그 분석을 참조하세요.

    • 이 조사에 적용될 수 있는 AWS 서비스의 원격 측정에 대해 알고 있는 경우, 해당 서비스의 콘솔로 이동하여 원격 측정을 조사에 추가할 수 있습니다. 예를 들어 Lambda 지표를 조사에 추가하려면 다음 작업을 수행하면 됩니다.

      1. Lambda 콘솔을 엽니다.

      2. 모니터링 섹션에서 지표를 찾습니다.

      3. 지표에 대한 세로 줄임표 컨텍스트 메뉴 An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page. 를 열고 조사, Add to investigation을 선택한 다음, 조사 창에서 조사 이름을 선택합니다.

    • 제안 탭에서 가설을 볼 경우, 추론 표시를 선택하여 CloudWatch 조사가 가설을 생성하는 데 사용한 데이터를 표시할 수 있습니다.

    • 삭제됨 탭을 선택한 후 이전에 삭제된 제안을 볼 수 있습니다. 조사 결과에 이 중 하나를 추가하려면 조사 결과로 복원을 선택합니다.

    • 조사 결과에 메모를 추가하려면 피드 창에서 New note를 선택합니다. 그런 다음, 메모를 입력하고 추가를 선택합니다.

  4. 피드 영역에 가설을 추가하면 제안된 작업 보기가 표시될 수 있습니다. 그럴 경우, 이 옵션을 선택하면 문제에 대한 가설이 정확하다는 가정하에 수행할 수 있는 가능한 작업이 표시됩니다. 가능한 작업은 다음과 같습니다.

    • Documentation suggestions는 작업 중인 문제와 해결 방법을 이해하는 데 도움이 되는 AWS 설명서 링크입니다. 제안된 설명서를 보려면 검토 링크를 선택합니다.

    • Runbook suggestions는 Systems Manager Automation에서 사전 정의된 런북을 활용하는 제안입니다. 각 런북은 AWS 리소스에서 작업을 수행하기 위한 여러 단계를 정의합니다.

      중요

      Automation 런북을 실행할 경우 요금이 부과됩니다. 그러나 CloudWatch 조사를 활용하면 제안된 런북이 수행하는 작업을 미리 볼 수 있으므로, 런북을 실행할지 여부를 더욱 잘 평가할 수 있는 기회가 제공됩니다. Automation 요금에 대한 자세한 내용은 AWS Systems Manager Automation 요금 섹션을 참조하세요.

      런북 작업을 계속하는 방법에 대한 자세한 내용을 보려면 이 절차의 다음 단계를 계속 진행하기 전에 CloudWatch 조사의 제안된 런북 문제 해결 검토 및 실행 섹션을 참조하세요.

  5. 문제의 근본 원인을 찾았다고 생각되면 개요 탭을 선택한 다음 조사 요약 섹션에서 생성을 선택하면 됩니다. 이렇게 하면 CloudWatch 조사는 조사의 중요한 조사 결과 및 가설에 대한 요약을 자연어로 생성합니다.

    요약을 생성한 후에도 조사를 계속할 수 있습니다. 이렇게 하여 조사 결과를 추가 또는 제거하는 경우 언제든지 개요 탭으로 돌아가서 생성을 다시 선택하여 업데이트된 요약을 확인할 수 있습니다.

  6. 조사를 종료하려면 조사 종료를 선택한 다음, 원하는 경우 최종 메모를 추가합니다. 그런 다음 저장을 선택합니다.

    조사 상태가 아카이브됨으로 변경됩니다. 조사 페이지를 열고 조사 재시작을 선택하여 아카이브된 조사를 다시 시작할 수 있습니다.

    조사가 열려 있는 동안에는 조사와 관련된 경보 상태 전환이 조사에 계속 추가되므로, 조사를 무한정 열어 두지 않는 것이 좋습니다.

참고

어느 시점이 되면 Completed the analysis가 표시될 수 있습니다. 피드 영역 위에 Finished with the investigation.이 표시됩니다. 그런 다음, 조사 결과에 원격 측정을 더 추가하면 이 메시지가 변경되며 조사 결과에 추가한 새 데이터를 기반으로 CloudWatch 조사가 원격 측정을 다시 스캔하기 시작합니다.

CloudWatch 조사의 제안된 런북 문제 해결 검토 및 실행

활성 조사의 피드 영역에 가설을 추가하면 CloudWatch 조사는 제안된 작업 보기를 표시할 수 있습니다. 제안된 작업은 문제를 수동으로 해결하는 데 도움이 되는 정보가 포함된 설명서를 보는 것일 수 있습니다.

또 다른 제안은 Automation 런북을 사용하여 문제를 자동으로 해결하는 것입니다. Automation은 또 다른 AWS 서비스인 Systems Manager의 기능입니다. Automation 런북은 선택한 리소스에서 실행할 일련의 단계 또는 작업을 정의합니다. 각 런북은 특정한 문제를 해결하도록 고안되었습니다. 런북은 생성, 복구, 재구성, 설치, 문제 해결, 수정, 복제 등 다양한 운영 요구 사항에 대응할 수 있습니다. Automation 작업에 대한 자세한 내용은 AWS Systems Manager Automation과 통합 섹션을 참조하세요.

시작하기 전 준비 사항

조사에서 Automation 런북을 사용하기 전에 다음과 같은 중요한 고려 사항을 알아두어야 합니다.

  • 런북을 실행하기로 선택하면 요금이 발생합니다. 자세한 내용은 AWS Systems Manager 요금을 참조하십시오.

  • 근본 원인 및 런북 제안은 자동 추론 및 생성형 인공 지능 서비스에 기반합니다.

    중요

    런북 단계를 실행하고 런북 실행 과정에서 입력한 파라미터 값 선택으로 인해 발생하는 작업 결과에 대한 책임은 사용자에게 있습니다. 런북이 예상대로 작동하는지 확인하려면 제안된 런북을 편집해야 할 수도 있습니다. 자세한 내용은 AWS 책임 있는 AI 정책을 참조하세요.

  • 런북에 따라, 런북을 실행하기 전에 런북의 입력 파라미터 값을 입력해야 할 수 있습니다.

  • 런북은 운영자에게 할당된 IAM 권한을 사용하여 실행됩니다. 필요한 경우 다른 IAM 권한으로 로그인하여 런북을 실행합니다. 실행 중인 작업에 대한 권한 외에도, 런북 단계를 실행하려면 추가 Systems Manager 권한이 필요합니다. 자세한 내용은 AWS Systems Manager 사용 설명서에서 자동화 설정을 참조하세요.

CloudWatch 조사의 제안된 런북 작업을 검토 및 실행하려면
  1. 제안된 런북에 대한 정보를 보려면 검토를 선택하여 런북 단계를 실행하는 방법에 대한 정보를 확인합니다.

    조사 세부 정보 페이지에서 제안을 선택합니다.

  2. 제안 창에서 조사 중인 문제에 대한 시스템의 분석을 토대로 가설 목록을 검토합니다.

    각 가설별로 다음 옵션 중에서 선택할 수 있습니다.

    • Show reasoning - 시스템에서 가설을 생성한 이유에 대한 자세한 정보를 봅니다.

    • 작업 보기 - 문제에 대해 제안된 작업을 봅니다. 일부 가설은 제안된 작업이 포함되지 않을 수도 있습니다.

    • 수락 - 가설을 수락하고 이를 조사의 피드 섹션에 추가합니다.

      참고

      가설을 수락한다 해도 연결된 런북 솔루션이 자동으로 실행되는 건 아닙니다. 가설을 수락하기 전에 제안된 런북을 보는 건 가능하지만, 런북을 실행하려면 가설을 수락해야 합니다.

    • 삭제 - 가설을 거부하고 더 이상 관여하지 않습니다.

  3. 작업 보기를 선택한 후 제안된 작업 창에서 문제를 해결하는 데 수행할 수 있는 제안된 작업 목록을 검토합니다. 제안된 작업에는 다음 중 하나 이상이 포함될 수 있습니다.

    • AWS 지식 문서 - 문제를 수동으로 해결하기 위해 취할 수 있는 단계에 대한 정보를 제공하고, 추가 정보에 대한 링크를 제공합니다.

    • AWS 설명서 - 문제와 관련된 사용자 설명서 주제에 대한 링크를 제공합니다.

    • AWS 소유 런북 - AWS에서 관리하는 하나 이상의 Automation 런북이 나열됩니다. 이러한 런북을 실행하여 문제 해결을 시도할 수 있습니다.

    • 사용자가 소유한 런북 - 사용자 또는 계정이나 조직의 다른 사람이 생성한 사용자 지정 Automation 런북이 하나 이상 나열됩니다. 이러한 런북을 실행하여 문제 해결을 시도할 수 있습니다.

      참고

      시스템에서는 사용자 지정 런북의 키워드를 평가한 다음, 조사 중인 문제와 관련된 용어와 비교하여 이 런북 목록을 자동으로 생성합니다.

      키워드 일치 항목이 많을수록 특정 사용자 지정 런북이 사용자가 소유한 런북 목록에서 더 높게 나타납니다.

  4. 가설을 검토한 후 특정한 제안된 작업을 추가로 검토하고, 자세히 알아보기를 선택하여 관련 설명서를 읽을 수 있습니다. 검토 세부 정보를 선택하여 AWS 및 사용자가 소유한 제안된 런북을 검사할 수도 있습니다.

  5. 런북에 대해 검토 세부 정보를 선택할 경우 다음을 수행합니다.

    1. 런북 설명에서 내용을 검토합니다. 이러한 내용은 조사 중인 문제를 해결하기 위해 런북이 수행할 수 있는 작업에 대한 개요를 제공합니다. 단계 보기를 선택하여 런북의 워크플로를 시각화하고 개별 단계의 세부 정보를 자세히 확인합니다.

    2. 입력 파라미터에서 런북에 필요한 파라미터 값을 지정합니다. 이러한 파라미터는 런북마다 다릅니다.

    3. 실행 미리 보기에서 정보를 주의 깊게 검토합니다. 이 정보는 런북을 실행하기로 선택하는 경우 그 범위와 영향에 대해 설명합니다.

      실행 미리 보기 콘텐츠는 다음 정보를 제공합니다.

      • 런북 작업이 발생할 계정 및 리전의 수.

      • 수행할 작업의 유형과 각 작업의 수.

        작업 유형에는 다음이 포함됩니다.

        • Mutating: 런북 단계에서는 리소스를 생성, 수정 또는 삭제하는 작업을 통해 대상을 변경합니다.

        • Non-Mutating: 런북 단계에서 리소스에 대한 데이터를 검색하지만 이를 변경하지는 않습니다. 이 범주에는 일반적으로 Describe, List, Get 및 유사한 읽기 전용 API 작업이 포함됩니다.

        • Undetermined: 미정 단계는 AWS Lambda, AWS Step Functions 또는 AWS Systems Manager의 기능인 명령 실행 같은 다른 오케스트레이션 서비스에서 수행한 실행을 간접적으로 호출합니다. 미정 단계에서는 타사 API를 호출하거나 Python 또는 PowerShell 스크립트를 실행할 수도 있습니다. Systems Manager Automation은 오케스트레이션 프로세스 또는 타사 API 실행의 결과를 감지할 수 없으므로 이를 평가할 수 없습니다. 이러한 단계의 결과를 수동으로 검토하여 그 영향을 판단해야 합니다.

        지원되는 작업 및 이러한 작업이 미치는 영향 유형에 대한 자세한 내용은 AWS Systems Manager 사용 설명서의 런북 작업의 문제 해결 영향 유형을 참조하세요.

    4. 진행 여부를 결정하기 전에 미리 보기 정보를 주의 깊게 검토하세요.

      이 시점에서 다음 작업 중 한 가지를 수행할 수 있습니다.

      • 런북을 중지하고 실행하지 않습니다.

      • 런북을 실행하기 전에 입력 파라미터를 변경합니다.

      • 이미 선택한 옵션으로 런북을 실행합니다.

    중요

    런북을 실행하기로 선택하면 요금이 발생합니다. 자세한 내용은 AWS Systems Manager 요금을 참조하십시오.

  6. 런북을 실행하려면 실행을 선택합니다.

    이미 가설을 수락한 경우 실행이 수행됩니다.

    아직 가설을 수락하지 않은 경우, 실행을 수행하기 전에 수락하라는 대화 상자가 표시됩니다.

런북에 대해 실행을 선택하면 해당 작업이 조사의 피드 창에 추가됩니다. 조사에서 조사 결과의 지표에 있는 새 데이터를 모니터링하여 런북 작업이 문제를 수정하고 있는지 확인할 수 있습니다.