

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 簡化 Amazon EKS 可觀測性的最佳實務
<a name="introduction"></a>

*Ishwar Chauthaiwale、Naveen Suthar 和 Pratap Kumar Nanda，Amazon Web Services (AWS)*

*2026 年 3 月* ([文件歷史記錄](doc-history.md))

Amazon Elastic Kubernetes Service (Amazon EKS) 需要全方位的可觀測性解決方案，才能有效地監控容器化工作負載並進行疑難排解。分散式系統和微服務在 Amazon EKS 環境中具有複雜的架構，因此實作適當的可觀測性實務對於維護可靠的操作至關重要。Amazon EKS 環境中的有效可觀測性可讓團隊深入了解應用程式效能、有效率地疑難排解問題，並維持最佳的叢集運作狀態。

挑戰在於導覽適用於 Amazon EKS 可觀測性的工具和技術龐大生態系統，同時遵守符合組織目標和產業標準的最佳實務。有效的可觀測性策略必須平衡全面的資料收集與效能考量、成本效益和可擴展性。

本指南旨在協助組織在下列領域最佳化其 Amazon EKS 可觀測性：
+ 建立有效率**的記錄**機制
+ 實作強大的**監控**解決方案
+ 針對複雜架構使用分散式**追蹤** 
+ 實作**警示**和事件回應策略

透過採用這些最佳實務，您的組織可以增強其深入了解 Amazon EKS 環境的能力，進而提高可靠性、效能和營運效率。這種簡化的可觀測性方法有助於故障診斷和維護，並支援資料驅動型決策，以持續改善以 Kubernetes 為基礎的應用程式和基礎設施。（如需 Amazon EKS 的詳細資訊，請參閱 [服務文件](https://docs.aws.amazon.com/eks/)。)

本指南深入探討 Amazon EKS 可觀測性的各個層面，並探索您可以量身打造的工具和策略，以滿足 Amazon EKS 部署的特定需求，從小型應用程式到大型、複雜的微服務架構。

在本指南中：
+ [在 Amazon EKS 中記錄](logging.md)
+ [在 Amazon EKS 中監控](monitoring.md)
+ [在 Amazon EKS 中追蹤](tracing.md)
+ [Amazon EKS 中的提醒](alerting.md)
+ [後續步驟](next-steps.md)
+ [資源](resources.md)

## 目標
<a name="objectives"></a>

本指南可協助您和組織達成下列業務目標：
+ **增強的營運可見**性 – 透過有效的可觀測性實務，實現對 Amazon EKS 叢集和應用程式的完整洞見。

  此目標強調在 Amazon EKS 環境中維持完整可見性的重要性。[AWS X-Ray](https://aws.amazon.com/xray/features/)、[Amazon CloudWatch Container Insights ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html)和 [AWS Distro for OpenTelemetry](https://aws.amazon.com/blogs/containers/metrics-and-traces-collection-using-amazon-eks-add-ons-for-aws-distro-for-opentelemetry/) 等工具可協助您了解系統行為、快速識別問題，以及維持最佳效能。
+ **改善故障診斷效率** – 透過有效的追蹤和監控策略，減少平均偵測時間 (MTTD) 和平均解決時間 (MTTR)。

  此目標著重於實作可觀測性實務，以快速識別和解決問題。分散式追蹤、有效記錄和全方位指標收集等技術是實現此目標的關鍵。
+ **主動式效能管理** – 可在潛在問題影響最終使用者之前進行早期偵測。

  主動監控對於維持高可用性和效能至關重要。此目標說明實作適當警示、趨勢分析和預測監控以防止服務中斷的重要性。
+ **具成本效益的可觀測性** – 最佳化可觀測性成本，同時維持全面的系統可見性。

  成本最佳化包括實作有效率的抽樣策略、適當的資料保留政策和最佳檢測方法。目標是在可觀測性需求與成本考量之間取得平衡，同時確保有效的系統監控。
+ **可擴展的監控架構** – 確保您的可觀測性解決方案可與您的 Amazon EKS 環境無縫擴展。

  此目標著重於實作可隨應用程式成長的監控解決方案。無論您是執行單一叢集還是多叢集、多區域部署，您的可觀測性策略都應相應地擴展