

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 CloudWatch 指標監控管道
<a name="pipelines-metrics"></a>

CloudWatch 管道會將指標發佈至 `AWS/Observability Admin` 命名空間中的 Amazon CloudWatch。您可以使用這些指標來監控管道的運作狀態、效能和資料流程。

## 可用的指標
<a name="available-metrics"></a>

下表列出 CloudWatch 管道的可用指標。

**注意**  
只有在值為非零時才會發出管道指標。

### 核心指標
<a name="core-metrics"></a>


| 指標 | Description | 維度 | 單位 | 
| --- | --- | --- | --- | 
| `PipelineBytesIn` | 以未壓縮位元組進入管道的日誌記錄量 | PipelineName | 位元組 | 
| `PipelineBytesInByDataSource` | 來源/類型明細的傳入資料量 | PipelineName、DataSource、DataType | 位元組 | 
| `PipelineBytesOut` | 路由至目的地的資料量 | PipelineName | 位元組 | 
| `PipelineBytesOutByDataSource` | 來源/類型明細的傳出資料量 | PipelineName、DataSource、DataType | 位元組 | 
| `PipelineRecordsIn` | 進入管道的記錄數量 | PipelineName | 計數 | 
| `PipelineRecordsInByDataSource` | 來源/類型明細的傳入記錄數目 | PipelineName、DataSource、DataType | 計數 | 
| `PipelineRecordsOut` | 退出管道的記錄數量 | PipelineName | 計數 | 
| `PipelineRecordsOutByDataSource` | 來源/類型明細的傳出記錄數目 | PipelineName、DataSource、DataType | 計數 | 

### 錯誤和警告指標
<a name="error-warning-metrics"></a>


| 指標 | Description | 維度 | 單位 | 
| --- | --- | --- | --- | 
| `PipelineErrors` | 管道中的錯誤彙總計數 | PipelineName | 計數 | 
| `PipelineErrorsByErrorType` | 依類型分類的詳細錯誤計數 | PipelineName、 ErrorSource、 ErrorComponent、 ErrorType | 計數 | 
| `PipelineWarnings` | 遇到的警告數量 | PipelineName | 計數 | 
| `PipelineWarningsByWarningType` | 依類型分類的詳細警告 | PipelineName、 WarningSource、 WarningComponent、 WarningType | 計數 | 
| `PipelineRecordsUnprocessed` | 無法處理的記錄數目 | PipelineName、DataSource、DataType | 計數 | 
| `PipelineRecordsDropped` | 捨棄的記錄數目 （僅限第三方來源） | PipelineName、DataSource、DataType | 計數 | 

## 維度
<a name="dimensions"></a>

CloudWatch 管道指標使用以下維度：

**PipelineName**  
管道的名稱

**資料來源**  
資料來源 (AWS 服務名稱或第三方來源）

**DataType**  
正在處理的資料類型

**ErrorSource**  
錯誤的來源 (s3、aws.secrets、Cloudwatch\$1logs)

**ErrorComponent**  
發生錯誤的元件 （來源、接收器、延伸）

**ErrorType**  
遇到的錯誤類型

## 錯誤類型
<a name="error-types"></a>

下列錯誤類型會在 中追蹤`PipelineErrorsByErrorType`：

**`ACCESS_DENIED`**  
許可相關失敗

**`ALL`**  
管道上所有錯誤的總計數

**`RESOURCE_NOT_FOUND`**  
指定的資源不存在

**`SOURCE_READ_FAILURE`**  
從來源讀取失敗

**`PARSE_FAILURE`**  
資料剖析錯誤

**`PROCESSOR_ERRORS`**  
處理操作失敗

**`PAYLOAD_SIZE_EXCEEDED`**  
超過資料大小限制

## 警告類型
<a name="warning-types"></a>

管道上可能發生下列警告類型：

**`THROTTLED`**  
表示傳送的資料量已超過現有的速率限制，導致某些資料點或事件遭到捨棄或延遲，以保護系統並確保穩定性。

## 檢視 指標
<a name="viewing-metrics"></a>

您可以使用下列方法檢視 CloudWatch 管道指標：

### 使用 CloudWatch 主控台
<a name="using-cloudwatch-console"></a>

1. 透過 [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/) 開啟 CloudWatch 主控台。

1. 在導覽窗格中，選擇**指標**

1. 選擇 **AWS/Observability Admin** 命名空間

1. 選取要檢視的指標維度

### 使用 AWS CLI
<a name="using-aws-cli"></a>

```
aws cloudwatch get-metric-statistics \
  --namespace "AWS/Observability Admin" \
  --metric-name "PipelineBytesIn" \
  --dimensions Name=PipelineName,Value=my-pipeline \
  --start-time "2025-10-29T00:00:00" \
  --end-time "2025-10-29T23:59:59" \
  --period 300 \
  --statistics Sum
```

## 建立警示
<a name="creating-alarms"></a>

您可以根據任何這些指標建立 CloudWatch 警示。以下是為管道錯誤建立警示的範例：

```
aws cloudwatch put-metric-alarm \
  --alarm-name "HighPipelineErrors" \
  --alarm-description "Alert on high error rate" \
  --metric-name "PipelineErrors" \
  --namespace "AWS/Observability Admin" \
  --dimensions Name=PipelineName,Value=my-pipeline \
  --period 300 \
  --evaluation-periods 2 \
  --threshold 10 \
  --comparison-operator GreaterThanThreshold \
  --statistic Sum \
  --alarm-actions arn:aws:sns:region:account-id:topic-name
```

## CloudWatch 管道指標的最佳實務
<a name="best-practices"></a>

### 監控資料流程
<a name="monitor-data-flow"></a>
+ 使用 `PipelineBytesIn`和 `PipelineBytesOut` 追蹤資料磁碟區
+ 監控 `PipelineRecordsIn`和 `PipelineRecordsOut` 以追蹤記錄計數
+ 留意輸送量模式的意外變更

### 追蹤錯誤和警告
<a name="track-errors-warnings"></a>
+ 為 建立警示`PipelineErrors`以快速偵測問題
+ 使用 `PipelineErrorsByErrorType` 來診斷特定問題
+ 監控`PipelineWarnings`以及早識別潛在問題

### 設定適當的閾值
<a name="configure-thresholds"></a>
+ 根據預期資料模式的基本閾值
+ 考慮資料量中的正常變化
+ 設定警示閾值時，請考慮尖峰使用期間