本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用服務詳細資訊頁面檢視詳細的服務活動和運作狀態
當您檢測應用程式時,Amazon CloudWatch Application Signals 會映射應用程式探索的所有服務。使用服務詳細資訊頁面來查看單一服務的服務、操作、相依性、Canary 和用戶端請求的概觀。若要檢視服務詳細資訊頁面,請執行下列動作:
-
開啟 CloudWatch 主控台
。 -
在左側導覽窗格中的 Application Signals 區段下選擇服務。
-
從服務、熱門服務或相依性資料表中選擇任何服務的名稱。
在排程造訪下,您會在服務名稱下看到帳戶標籤和 ID。
服務詳細資訊頁面會組織成下列索引標籤:
-
概觀 — 使用此標籤查看單一服務的概觀,包括操作數量、相依性、合成和用戶端頁面。標籤顯示整個服務、熱門操作和相依性的關鍵指標。這些指標包括該服務所有服務操作的延遲、故障和錯誤的時間序列資料。
-
服務操作 — 使用此標籤可查看服務呼叫的操作清單,以及具有測量每個操作運作狀態之關鍵指標的互動式圖形。您可以在圖形中選取資料點,以取得與該資料點相關聯的追蹤、日誌或指標的相關資訊。
-
相依性 — 使用此標籤可查看服務呼叫的相依性清單,以及這些相依性的指標清單。
-
Synthetics Canary — 使用此標籤可查看模擬使用者呼叫服務的合成 Canary 清單,以及這些 Canary 的主要效能指標。
-
用戶端頁面 — 使用此標籤可查看呼叫您服務的用戶端頁面清單,以及衡量用戶端與應用程式互動品質的指標。
檢視您的服務概觀
使用服務概觀頁面,在單一位置檢視所有服務操作的高階指標摘要。檢查與您應用程式互動的所有操作、相依性、用戶端頁面和合成 Canary 的效能。使用此資訊來協助您判斷要專注於何處,以識別問題、疑難排解錯誤,以及尋找最佳化的機會。
選擇服務詳細資訊中的任何連結,以檢視與特定服務相關的資訊。例如,對於 Amazon EKS 中託管的服務,服務詳細資訊頁面會顯示叢集、命名空間和工作負載資訊。對於 Amazon ECS 或 Amazon EC2 中託管的服務,服務詳細資訊頁面會顯示環境值。
在服務下,概觀索引標籤會顯示下列項目的摘要:
-
操作 – 使用此標籤來查看服務操作的運作狀態。運作狀態由定義為服務水準目標 (SLO) 一部分的服務水準指標 (SLI) 決定。
-
相依性 – 使用此標籤可查看應用程式呼叫之服務的首要相依性,依錯誤率列出,並查看服務相依性的運作狀態。運作狀態由定義為服務水準目標 (SLO) 一部分的服務水準指標 (SLI) 決定。
-
Synthetics Canary – 使用此標籤查看模擬呼叫與您服務相關聯的端點或 APIs 的結果,以及失敗的 Canary 數量。
-
用戶端頁面 – 使用此標籤可查看用戶端呼叫且具有非同步 JavaScript 和 XML (AJAX) 錯誤的熱門頁面。
下圖顯示 服務的概觀:

概觀索引標籤也會顯示所有服務具有最高延遲的相依性圖表。使用 p99、p90 和 p50 延遲指標快速評估哪些相依性導致您的總服務延遲,如下所示:

例如,上圖顯示對客戶服務相依性提出的請求中有 99% 在大約 4,950 毫秒內完成。其他相依性花費的時間較少。
依延遲顯示前四個服務操作的圖表會顯示這些服務的請求量、可用性、故障率和錯誤率,如下圖所示:

服務詳細資訊區段會顯示服務的詳細資訊,包括帳戶 ID 和帳戶標籤。
檢視服務操作
當您檢測應用程式時,Application Signals 會探索應用程式呼叫的所有服務操作。使用服務操作索引標籤來查看包含服務操作的資料表,以及測量所選操作效能的一組指標。這些指標包括 SLI 狀態、相依性數量、延遲、磁碟區、錯誤、錯誤和可用性,如下圖所示:

透過從篩選條件文字方塊中選擇一或多個屬性,篩選資料表以更輕鬆地尋找服務操作。當您選擇每個屬性時,系統會引導您完成篩選條件,並在篩選文字方塊下方看到完整的篩選條件。可隨時選擇清除篩選條件以移除資料表篩選條件。
選擇 操作的 SLI 狀態,以顯示包含任何運作狀態不佳 SLI 連結的快顯視窗,以及查看操作所有 SLOs 的連結,如下表所示:

服務操作資料表會列出 SLI 狀態、運作狀態良好或不良好的 SLIs 數目,以及每個操作SLOs 總數。
使用 SLIs來監控延遲、可用性和其他衡量服務運作狀態的操作指標。使用 SLO 來檢查服務和操作的效能和運作狀態。
若要建立 SLO,請執行下列動作:
-
如果操作沒有 SLO,請在 SLI 狀態欄中選擇建立 SLO 按鈕。
-
如果 操作已有 SLO,請執行下列動作:
-
選取操作名稱旁的選項按鈕。
-
從資料表右上角的動作向下箭頭中選擇建立 SLO。
-
如需詳細資訊,請參閱服務水準目標 (SLO)。
相依性欄會顯示此操作所呼叫的相依性數目。選擇此數字可開啟已根據所選操作篩選的相依性索引標籤。
檢視服務操作指標、相關追蹤和應用程式日誌
Application Signals 會將服務操作指標與 AWS X-Ray 追蹤、CloudWatch Container Insights 和應用程式日誌建立關聯。使用這些指標來疑難排解操作運作狀態問題。若要以圖形資訊檢視指標,請執行下列動作:
-
在服務操作資料表中選取服務操作,以查看資料表上方所選操作的一組圖形,其中包含磁碟區和可用性、延遲、故障和錯誤等指標。
-
將滑鼠游標移至圖形中的某個點,以檢視詳細資訊。
-
選取點以開啟診斷窗格,顯示圖形中所選點的相關追蹤、指標和應用程式日誌。
下圖顯示將滑鼠游標移至圖形中的點之後出現的工具提示,以及按一下點之後出現的診斷窗格。工具提示包含 Faults and Errors 圖形中相關聯資料點的相關資訊。窗格包含與所選點相關聯的關聯追蹤、最佳參與者和應用程式日誌。

相關追蹤
查看相關追蹤以了解追蹤的潛在問題。您可以檢查關聯的追蹤或任何與其相關聯的服務節點的行為是否類似。若要檢查相關追蹤,請從相關追蹤資料表中選擇追蹤 ID,以開啟所選追蹤的 X-Ray 追蹤詳細資訊頁面。追蹤詳細資訊頁面包含與所選追蹤相關聯的服務節點映射,以及追蹤區段的時間軸。
最佳參與者
檢視主要參與者以尋找指標的主要輸入來源。依不同元件分組參與者,以尋找群組中的相似性,並了解追蹤行為之間的差異。
主要參與者索引標籤提供每個群組的通話量、可用性、平均延遲、錯誤和故障的指標。下列範例影像顯示部署在 Amazon EKS 平台上之應用程式指標套件的主要參與者:

主要參與者包含下列指標:
-
通話量 - 使用通話量來了解群組每個時間間隔的請求數量。
-
可用性 - 使用可用性來查看未偵測到群組故障的時間百分比。
-
平均延遲 - 使用延遲來檢查請求在取決於您調查之請求多久前的時間間隔內為群組執行的平均時間。在不到 15 天前提出的請求,會以 1 分鐘的間隔進行評估。包含在 15 到 30 天前提出的請求,會以 5 分鐘的間隔進行評估。例如,如果您正在調查造成故障的請求 15 天前,呼叫量指標等於每 5 分鐘間隔的請求數。
-
錯誤 - 每個群組在時間間隔內測量的錯誤數目。
-
故障 - 在時間間隔內每個群組的故障數量。
使用 Amazon EKS 或 的主要參與者 Kubernetes
使用部署在 Amazon EKS 上應用程式的主要貢獻者的相關資訊Kubernetes,或查看依 Node、Pod 和 PodTemplateHash 分組的操作運作狀態指標。適用下列定義:
-
Pod 是共用儲存和資源的一或多個Docker容器群組。Pod 是可在Kubernetes平台上部署的最小單位。依 Pod 分組,以檢查錯誤是否與 Pod 特定限制相關。
-
節點是執行 Pod 的伺服器。依節點分組,以檢查錯誤是否與節點特定限制相關。
-
Pod 範本雜湊用於尋找特定版本的部署。依 Pod 範本雜湊分組,以檢查錯誤是否與特定部署相關。
使用 Amazon EC2 的主要貢獻者
使用部署在 Amazon EKS 上應用程式的主要貢獻者的相關資訊,來查看依執行個體 ID 和自動擴展群組分組的操作運作狀態指標。適用下列定義:
-
執行個體 ID 是您服務執行之 Amazon EC2 執行個體的唯一識別符。依執行個體 ID 分組,以檢查錯誤是否與特定 Amazon EC2 執行個體相關。
-
自動擴展群組是 Amazon EC2 執行個體的集合,可讓您擴展或縮減處理應用程式請求所需的資源。如果您想要檢查錯誤是否限制在群組內的執行個體範圍內,請依自動擴展群組分組。
使用自訂平台的主要貢獻者
針對使用自訂檢測部署的應用程式,使用主要貢獻者的相關資訊,以查看依主機名稱分組的操作運作狀態指標。適用下列定義:
-
主機名稱可識別連線至網路的裝置,例如端點或 Amazon EC2 執行個體。依主機名稱分組,以檢查您的錯誤是否與特定實體或虛擬裝置相關。
在 Log Insights和 中檢視主要參與者 Container Insights
在 Log Insights 中檢視和修改為主要參與者產生指標的自動查詢。在 Container Insights 中依特定群組檢視基礎設施效能指標,例如 Pod 或節點。您可以依資源消耗排序叢集、節點或工作負載,並在最終使用者體驗受到影響之前快速識別異常或主動降低風險。下圖顯示如何選取這些選項:

在 Container Insights 中,您可以檢視 Amazon EKS 或 Amazon ECS 容器的指標,這些指標專屬於主要參與者的分組。例如,如果您依 EKS 容器的 Pod 分組以產生最佳參與者,容器洞見將顯示針對 Pod 篩選的指標和統計資料。
在 Log Insights 中,您可以使用下列步驟修改在主要參與者下產生指標的查詢:
-
選取 Log Insights 中的檢視。開啟的 Logs Insights 頁面包含自動產生的查詢,並包含下列資訊:
-
日誌叢集群組名稱。
-
您使用 CloudWatch 調查的操作。
-
與圖形上互動的操作運作狀態指標彙總。
在您選取服務圖表上的資料點之前,系統會自動篩選日誌結果以顯示過去五分鐘的資料。
-
-
若要編輯查詢,請將產生的文字取代為您的變更。您也可以使用查詢產生器來協助您產生新的查詢,或更新現有的查詢。
應用程式記錄
使用應用程式日誌索引標籤中的查詢,為您目前的日誌群組、服務產生記錄資訊,並插入時間戳記。日誌群組是一組日誌串流,您可以在設定應用程式時加以定義。
使用日誌群組來組織具有類似特性的日誌,包括下列項目:
-
從特定組織、來源或函數擷取日誌。
-
擷取由特定使用者存取的日誌。
-
擷取特定時段的日誌。
使用這些日誌串流來追蹤特定群組或時間範圍。您也可以設定這些日誌群組的監控規則、警示和通知。如需日誌群組的詳細資訊,請參閱使用日誌群組和日誌串流。
應用程式日誌查詢會傳回日誌、週期性文字模式和日誌群組的圖形視覺化。
若要執行查詢,請在 Logs Insights 中選取執行查詢,以執行自動產生的查詢或修改查詢。若要編輯查詢,請將自動產生的文字取代為您的變更。您也可以使用查詢產生器來協助您產生新的查詢或更新現有的查詢。
下圖顯示根據服務操作圖表中選取的點自動產生的範例查詢:

在上圖中,CloudWatch 會自動偵測與您所選點相關聯的日誌群組,並將其包含在產生的查詢中。
檢視服務相依性
選擇相依性索引標籤,即可顯示相依性資料表,以及所有服務操作或單個操作之相依性的一組指標。資料表包含 Application Signals 發現的相依性清單,包括 SLI 狀態、延遲、呼叫量、錯誤率、錯誤率和可用性的指標。
在頁面頂端,從向下箭頭清單中選擇操作以檢視其相依性,或選擇全部以查看所有操作的相依性。
篩選資料表,可讓您更容易找到要尋找的內容,方法是從篩選文字方塊中選擇一個或多個屬性。當您選擇每個屬性時,系統會引導您完成篩選條件,並在篩選文字方塊下方看到完整的篩選條件。可隨時選擇清除篩選條件以移除資料表篩選條件。選取資料表右上角的按相依性分組,可按服務和操作名稱對相依性分組。開啟分組時,使用相依性名稱旁邊的 + 圖示來展開或摺疊相依性群組。

相依性資料欄會顯示相依性服務名稱,而遠端操作資料欄則顯示服務操作名稱。SLI 狀態欄會顯示運作狀態良好或不良好的 SLIs 數量,以及每個相依性的 SLIs 總數。呼叫 AWS 服務時,目標欄會顯示 AWS 資源,例如 DynamoDB 資料表或 Amazon SNS 佇列。
若要選取相依性,請選取相依性資料表中某個相依性旁邊的選項。這會顯示一組圖表,顯示通話量、可用性、故障和錯誤的詳細指標。將滑鼠暫留在圖形的某個點上,以查看包含更多資訊的快顯視窗。選取圖形中的點以開啟診斷窗格,顯示圖形中所選點的關聯追蹤。從相關追蹤資料表中選擇追蹤 ID,以開啟所選追蹤的 X-Ray 追蹤詳細資訊頁面。

檢視 Synthetics Canaries
選擇 Synthetics Canaries 索引標籤以顯示 Synthetics Canaries 資料表,以及資料表中每個 Canary 的一組指標。此表格包含成功百分比、平均持續時間、執行次數和失敗率的指標。只會顯示已啟用 AWS X-Ray 追蹤的 Canary。
使用合成 Canary 資料表中的篩選條件文字方塊,尋找您感興趣的 Canary。您建立的每個篩選條件會出現在篩選條件文字方塊下方。可隨時選擇清除篩選條件以移除資料表篩選條件。

選取 Canary 名稱旁的選項按鈕,以查看包含圖形詳細指標的一組標籤,包括成功百分比、錯誤和持續時間。將滑鼠暫留在圖形的某個點上,以查看包含更多資訊的快顯視窗。選取圖形中的點以開啟診斷窗格,顯示與所選點相關的 Canary 執行。選取 Canary 執行,然後選擇執行時間以查看所選 Canary 執行的成品,包括日誌、HTTP封存 (HAR) 檔案、螢幕擷取畫面和建議步驟,以協助您疑難排解問題。選擇延遲更多以開啟 Canary 執行旁的 CloudWatch Synthetics Canary 頁面。

檢視您的用戶端頁面
選擇用戶端頁面索引標籤,以顯示呼叫您服務的用戶端網頁清單。使用所選用戶端頁面的一組指標,測量用戶端在與服務或應用程式互動時的體驗品質。這些指標包括頁面載入、Web 關鍵和錯誤。
若要在 資料表中顯示用戶端頁面,您必須設定 CloudWatch RUM Web 用戶端進行 X-Ray 追蹤,並開啟用戶端頁面的 Application Signals 指標。選擇管理頁面,以選取要為 Application Signals 指標啟用哪些頁面。
使用篩選條件文字方塊,在篩選條件文字方塊下方尋找您感興趣的用戶端頁面或應用程式監視器。選擇清除篩選條件以移除資料表篩選條件。選取按用戶端分組,可按用戶端對用戶端頁面進行分組。分組後,選擇用戶端名稱旁邊的 + 圖示以展開該列,並查看該用戶端的所有頁面。

若要選取用戶端頁面,請在用戶端頁面資料表中選取用戶端頁面旁邊的選項。您將看到一組顯示詳細指標的圖表。將滑鼠暫留在圖形的某個點上,以查看包含更多資訊的快顯視窗。選取圖形中的點以開啟診斷窗格,顯示圖形中所選點的相關效能導覽事件。從導覽事件清單中選擇事件 ID,以開啟所選事件的 CloudWatch RUM 頁面檢視。

注意
若要查看用戶端頁面中的 AJAX 錯誤,請使用 CloudWatch RUM Web 用戶端版本 1.15 或更新版本。
目前,每個服務最多可顯示 100 個操作、canary 和用戶端頁面,以及最多 250 個相依性。