

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon EKS에서 추적
<a name="tracing"></a>

추적은 Amazon EKS에서 애플리케이션 관찰성의 중요한 구성 요소입니다. 추적은 EKS 클러스터에 배포된 다양한 마이크로서비스를 통해 이동하는 요청의 경로를 수집, 처리 및 시각화하여 요청 흐름 및 서비스 상호 작용에 대한 자세한 가시성을 제공합니다. 이 기능은 Amazon EKS 환경에서 시스템 동작을 이해하고, 병목 현상을 식별하고, 문제를 효과적으로 해결하는 데 도움이 됩니다. 효과적인 추적은 요청 흐름에 end-to-end 가시성을 제공하여 분산 시스템 디버깅의 복잡성을 제거합니다. 이를 통해 서비스 경계 전반의 트랜잭션을 추적하고 Amazon EKS 워크로드 내의 성능 문제 또는 장애를 식별할 수 있습니다.

Amazon EKS의 전체 추적 구현을 통해 시스템 동작을 이해하고, 성능을 최적화하고, 컨테이너화된 애플리케이션의 신뢰성을 유지할 수 있습니다. 궁극적으로 추적 기능은 Amazon EKS 환경에서 운영 가시성과 시스템 유지 관리를 향상시킵니다.

AWS X-Ray 는 애플리케이션에 대한 데이터를 추적하는 데 중요한 역할을 합니다. 추적에는 다음을 포함하여 서비스 상호 작용의 다양한 측면을 모니터링하는 작업이 포함됩니다.
+ **요청 경로 및 종속성** 분산 시스템의 동작에 대한 중요한 인사이트를 제공합니다. 다양한 마이크로서비스 및 구성 요소를 통과하는 요청의 전체 여정을 추적합니다. 서비스 종속성을 매핑하면 통신 패턴을 이해하고 애플리케이션 아키텍처에서 중요한 경로를 식별할 수 있습니다. 구현 세부 정보는 X-Ray 설명서[의 AWS X-Ray 서비스 추적 맵 사용을](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-servicemap.html) 참조하세요.
+ **서비스 지연 시간 및 병목 현상**은 최적의 시스템 성능을 유지하기 위한 필수 지표입니다. 서비스 간 응답 시간을 측정하고 분석하면 성능 문제를 효과적으로 식별할 수 있습니다. 이 데이터를 사용하면 요청 체인에서 지연을 일으키는 특정 서비스 또는 작업을 정확히 찾아서 대상 최적화 작업을 활성화할 수 있습니다. 지연 시간 분석에 대한 자세한 내용은 X-Ray 설명서[의 Analytics 콘솔과 상호 작용을](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) 참조하세요.
+ **오류 전파 패턴을** 사용하면 시스템 신뢰성과 내결함성을 이해하는 데 도움이 됩니다. 서비스 전반의 오류 경로를 추적하여 장애가 시스템을 통해 어떻게 캐스케이드되는지 이해하면 애플리케이션을 더 잘 설계할 수 있습니다. 이러한 가시성을 통해 오류의 근본 원인과 이것이 종속 서비스에 미치는 영향을 식별할 수 있으므로 시스템의 복원력이 향상됩니다. 구현 세부 정보는 X-Ray 설명서의 [추적](https://docs.aws.amazon.com/xray/latest/devguide/xray-concepts.html#xray-concepts-traces)을 참조하세요.
+ **서비스 전반의 리소스 사용률**은 시스템 효율성 및 비용 최적화에 대한 인사이트를 제공합니다. 트레이스 데이터와 상관관계가 있는 CPU, 메모리 및 네트워크 사용량 패턴을 모니터링하여 리소스 수요를 파악할 수 있습니다. 이 데이터는 리소스 소비 추세를 분석하여 EKS 클러스터 전체에서 서비스 성능과 비용을 최적화하는 데 도움이 됩니다. 모니터링 설정은 Amazon EKS 설명서의 [클러스터 성능 모니터링 및 로그 보기를 참조하세요](https://docs.aws.amazon.com/eks/latest/userguide/eks-observe.html).
+ **최종 사용자 트랜잭션 흐름은** 사용자 경험을 이해하고 개선하는 데 매우 중요합니다. 프런트엔드에서 백엔드 서비스까지 완전한 사용자 상호 작용을 추적하여 최적의 애플리케이션 성능을 보장할 수 있습니다. 중요한 사용자 여정의 end-to-end 응답 시간을 측정하고 최적화하여 고객 만족도에 직접적인 영향을 미칠 수 있습니다. 최종 사용자 모니터링을 구현하려면 프로그래밍 언어에[AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-sdk.html) SDK를 사용합니다.
+ **API 게이트웨이 상호 작용**애플리케이션 성능 및 보안의 최전선을 형성합니다. API 진입점에서 요청 패턴 및 성능을 모니터링하여 최적의 서비스 제공을 보장할 수 있습니다. 이러한 가시성을 통해 요청 흐름에 대한 인증, 권한 부여 및 속도 제한 영향을 추적하여 보안 및 성능 요구 사항을 모두 유지할 수 있습니다. [X-Raydocumentation을 사용한 Amazon API Gateway ](https://docs.aws.amazon.com/apigateway/latest/developerguide/apigateway-xray.html)추적에 대해 자세히 알아봅니다.

Amazon EKS의 효과적인 추적은 스팬과 추적을 수집하는 것 이상입니다. 관찰성 요구 사항과 시스템 성능의 균형을 맞추는 체계적인 전략이 필요합니다. 이 전략은 다음에 중점을 두어야 합니다.
+ **적절한 샘플링 속도 구현**: 트래픽 패턴 및 비즈니스 우선 순위에 따라 샘플링 규칙을 구성하여 비용을 최적화하는 동시에 중요한 트랜잭션의 가시성을 유지합니다. 자세한 내용은 X-Ray 설명서의 [샘플링 규칙 구성을](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-sampling.html) 참조하세요.
+ **추적할 중요한 경로 및 서비스 정의**: 최적의 성능 모니터링을 위해 세부 추적이 필요한 필수 서비스 및 사용자 여정을 식별하고 우선순위를 지정합니다. 자세한 내용은 Amazon EKS 설명서의 [ADOT 연산자를 사용하여 지표 및 추적 데이터 전송](https://docs.aws.amazon.com/eks/latest/userguide/opentelemetry.html)을 참조하세요.
+ **적절한 데이터 보존 정책 설정**: 데이터 수명 주기 관리 규칙을 설정하여 관찰성 요구 사항과 스토리지 비용 및 규정 준수 요구 사항의 균형을 맞춥니다. CloudWatch 보존 정책을 보려면 CloudWatch Logs 설명서의 [로그 그룹 및 로그 스트림 작업을](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html) 참조하세요.
+ **효과적인 시각화 및 분석 도구 설정**: 트레이스 데이터를 효과적으로 분석하기 위해 AWS X-Ray 분석 콘솔 또는 Amazon Managed Grafana와 같은 시각화 도구를 배포하고 구성합니다. 자세한 내용은 X-Ray 설명서의 [분석 콘솔과 상호 작용을](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) 참조하세요.

**Topics**
+ [도구](tracing-tools.md)
+ [모범 사례](tracing-best-practices.md)

# Amazon EKS용 추적 도구
<a name="tracing-tools"></a>

Amazon EKS는 분산 추적을 구현하기 위한 여러 AWS 및 타사 옵션을 지원합니다.

## AWS 서비스
<a name="tracing-services"></a>
+ [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html): 고급 분산 추적 플랫폼

  X-Ray는 end-to-end 추적 기능을 AWS 서비스 제공하는 완전 관리형입니다. Amazon EKS에서 실행되는 애플리케이션에 대한 세부 서비스 맵 및 분석을 자동으로 계측 AWS 서비스 하고 제공합니다. X-Ray는 Amazon CloudWatch를 AWS 서비스비롯한 다른와 AWS 서비스 통합되며, 추적과 호출의 자동 상관 관계를 제공합니다. 
+ [AWS Distro for OpenTelemetry](https://aws-otel.github.io/): 통합 관찰성 프레임워크

  Distro for OpenTelemetry는 클라우드 네이티브 애플리케이션을 위한 OpenTelemetry의 안전하고 프로덕션 준비가 되었으며 AWS지원되는 배포입니다. 네이티브 AWS 서비스 통합을 유지하면서 공급업체 중립적 계측 기능을 제공하므로 하이브리드 클라우드 환경에 적합합니다. Distro for OpenTelemetry는 여러 관찰성 백엔드를 지원하고 AWS 모니터링 서비스와의 원활한 통합을 제공합니다. 

## 오픈 소스 솔루션
<a name="tracing-open-source"></a>
+ [OpenTelemetry](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-OpenTelemetry-Sections.html): 오픈 소스 관찰성 프레임워크 

  OpenTelemetry는 여러 프로그래밍 언어를 지원하는 포괄적인 계측 라이브러리와 함께 표준화된 관찰성 프레임워크를 제공합니다. 유연한 백엔드 옵션과 공급업체 중립적인 접근 방식을 통해 다양한 환경에서 일관성이 필요한 워크로드에 이상적입니다. 프레임워크의 광범위한 에코시스템은 다양한 모니터링 솔루션과의 광범위한 호환성을 보장합니다. 
+ [Jaeger](https://www.jaegertracing.io/): 오픈 소스 분산 추적 플랫폼

  Jaeger는 실시간 분산 컨텍스트 전파를 통해 포괄적인 추적 기능을 제공합니다. 자세한 서비스 종속성 시각화를 통해 근본 원인 분석 및 성능 최적화를 제공합니다. Jaeger의 아키텍처는 높은 확장성을 위해 설계되었으며 다양한 스토리지 백엔드를 지원하므로 대규모 Amazon EKS 배포에 적합합니다. [EKS용 ViewJaeger 설정](https://www.jaegertracing.io/docs/latest/operator/) 
+ [Grafana Tempo](https://grafana.com/docs/tempo/latest/): 분산 추적

  Tempo는 대규모 트레이스 스토리지와 Prometheus 지표와의 원활한 통합을 제공하는 Grafana Labs 솔루션입니다. 비용 효율적인 트레이스 보존 모델과 Grafana와의 네이티브 통합을 통해 이미 Grafana를 시각화에 사용하는 조직에 적합합니다. Tempo의 아키텍처는 Amazon EKS와 같은 클라우드 네이티브 환경을 위해 특별히 설계되었습니다.

# Amazon EKS에서의 추적 모범 사례
<a name="tracing-best-practices"></a>

이 섹션에서는 Amazon EKS에서 Kubernetes 기반 애플리케이션의 관찰성과 문제 해결을 개선하는 효과적인 추적 시스템을 생성하기 위한 포괄적인 모범 사례 및 기법 목록을 제공합니다.
+ **전략적 샘플링**: 애플리케이션의 트래픽 패턴과 사용 중인 서비스의 중요도에 따라 다양한 샘플링 속도를 구성합니다. 중요 경로에 대해 더 높은 샘플링 속도를 구현하는 동시에 중요도가 낮은 대용량 경로에 대한 샘플링을 줄여 비용을 최적화합니다. 지침은 AWS X-Ray 설명서의 [샘플링 규칙 구성을](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-sampling.html) 참조하세요.
+ **계측 설정**: X-Ray SDK 또는 AWS Distro for OpenTelemetry 수집기와 같은 자동 계측 도구를 사용하여 수동 계측 작업을 최소화합니다. 추적 상관관계를 높이기 위해 서비스 간에 일관된 이름 지정 규칙과 컨텍스트 전파를 유지합니다. 자세한 내용은 [Distro for OpenTelemetry 수집기 설명서를](https://aws-otel.github.io/docs/getting-started/collector) 참조하세요.
+ **데이터 관리**: 적절한 보존 기간 및 압축 전략을 구현하여 스토리지 비용과 관찰성 요구 사항의 균형을 맞춥니다. 민감한 추적 데이터를 보호하기 위해 명확한 데이터 프라이버시 제어 및 백업 절차를 수립합니다. 자세한 내용은[ CloudWatch Logs 설명서의 CloudWatch Logs에서 로그 데이터 보존 변경을](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SttingLogRetention) 참조하세요. CloudWatch 
+ **성능 최적화**: 추적 오버헤드를 모니터링하고 최적화하여 애플리케이션 성능에 미치는 영향을 최소화합니다. 효율적인 버퍼링과 비동기 처리를 사용하여 지연 시간에 미치는 영향을 줄입니다. 자세한 내용은 X-Ray 설명서[의 AWS X-Ray 데몬 구성을](https://docs.aws.amazon.com/xray/latest/devguide/xray-daemon-configuration.html) 참조하세요.
+ **보안 제어**: IAM 역할 및 정책을 사용하여 적절한 액세스 제어 및 데이터 보호 조치를 구현합니다. 정기적인 보안 감사 및 규정 준수 검토는 추적 데이터를 안전하게 유지하는 데 도움이 됩니다. 자세한 내용은 X-Ray 설명서의의 [보안을 AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/security.html) 참조하세요.
+ **모니터링 및 알림**: 추적 수집 상태에 대한 포괄적인 모니터링을 설정하고 수집 문제에 대한 알림을 구성합니다. 샘플링 속도 및 시스템 성능 지표를 추적하여 최적의 작동을 보장합니다. 자세한 내용은 CloudWatch 설명서의 [Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html)를 참조하세요.
+ **고가용성**: 가용 영역에 중복 수집기를 배포하고 적절한 장애 조치 메커니즘을 구성합니다. 고가용성 설정을 정기적으로 테스트하면 안정적인 추적 수집이 보장됩니다. 자세한 내용은 Amazon Managed Service [for Prometheus 설명서의 Distro for OpenTelemetry를 수집기로 사용을 AWS](https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-ingest-with-adot.html) 참조하세요.

이러한 모범 사례를 따르면 Amazon EKS 환경을 위한 강력하고 효율적이며 효과적인 추적 시스템을 만들 수 있습니다. 이를 통해 Kubernetes 기반 애플리케이션의 포괄적인 관찰성, 효율적인 문제 해결 및 최적의 성능을 보장할 수 있습니다.