代理程式檢視
代理程式檢視為您帳戶的代理程式提供精心設計的儀表板。您可以檢視託管在 AgentCore Runtime、Lambda、Amazon EC2 等 AWS 原生服務上的代理程式資料。檢視同時會顯示向 CloudWatch 發出遙測的代理程式。
概觀
指標和儀表板會顯示來自取樣代理程式範圍的資料。如需代理程式範圍的資訊,請參閱範圍。
系統支援下列代理程式指標:
-
代理程式/別名 – 經檢測並發出範圍的代理程式和別名數目
-
工作階段 – 經檢測並發出範圍的代理程式建立的工作階段數目。工作階段類似於對話,包含廣泛的內容
-
追蹤 – 經檢測並發出範圍的代理程式建立的追蹤數目。追蹤是工作階段內的個別請求回應週期
-
錯誤率 – 代理程式互動中的錯誤百分比
-
限流率 – 限流代理程式互動的百分比
選擇檢視詳細資訊可查看圖形中的代理程式指標。
Runtime 指標
Runtime 指標和儀表板顯示來自 Runtime 原始程式的資料。使用此原始程式,您可以將代理程式託管在 Amazon Bedrock AgentCore Runtime 上。如需詳細資訊,請參閱建立 AgentCore Runtime。
AgentCore Runtime 支援這些指標
-
Runtime 代理程式/別名 – 追蹤託管於 AgentCore Runtime 上的代理程式和別名數目
-
Runtime 工作階段 – 追蹤在 AgentCore Runtime 中執行之代理程式建立的工作階段數目。工作階段類似於對話,包含整個互動流程的廣泛內容。有助於監控整體平台使用情況、進行容量規劃、理解使用者互動模式
-
Runtime 調用 – 向資料平面 API 發出的請求總數。無論請求承載大小或回應狀態為何,每個 API 呼叫計為一次調用
-
Runtime 錯誤 – 系統和使用者錯誤數目。如需系統和使用者錯誤定義,請參閱 AgentCore 提供的執行時期指標
-
Runtime 限流 – 由於超過允許的 TPS (每秒交易數) 而被服務限流的請求數目。這些請求會使用 HTTP 狀態碼 429 傳回 ThrottlingException。監控此指標,以判斷是否需要檢閱服務配額或最佳化請求模式
在預設儀表板中檢視指標隨時間的變化。展開檢視詳細資訊以顯示指標圖表。
客服人員
代理程式指從您的應用程式收集和傳送監控資料的元件。代理程式資料表顯示您帳戶中設定的所有代理程式。這些代理程式可以託管在 AgentCore Runtime、Lambda 或 Amazon EC2 等 AWS 原生服務上。資料表也會顯示經過檢測、向 CloudWatch 發出遙測的其他代理程式。
可以使用篩選代理程式尋找您想要深入探索的特定代理程式,亦可使用欄位名稱對代理程式排序,以尋找所需的代理程式。選取齒輪圖示可顯示或隱藏其他欄位。
可以展開代理程式名稱來檢視代理程式的詳細資訊。
代理程式詳細資訊 – 概觀
「概觀」索引標籤顯示代理程式指標的自動儀表板。這些指標來自取樣的範圍和 Runtime 指標 (當代理程式使用 AgentCore Runtime 時)。
代理程式指標儀表板中包含衍生自取樣範圍的指標:
-
工作階段和追蹤 – 此代理程式的工作階段和追蹤計數
-
FM 字符用量 – 基礎模型的字符消耗總量。可以篩選圖表,形成特定基礎模型
-
系統和用戶端錯誤 – 處理請求期間的系統錯誤計數。高階伺服器端錯誤可能表示需要調查的潛在基礎結構或服務問題。用戶端錯誤是無效請求導致的錯誤。高階用戶端錯誤可能表示請求格式或許可存在問題
-
依範圍分類的錯誤和延遲 – 依特定範圍分類的錯誤率和延遲。請注意,一個範圍可能出現在多個代理程式中
-
限流 – 由於超過允許的 TPS (每秒交易數) 而被服務限流的請求數目
Runtime 指標儀表板中包含 AgentCore Runtime 自動產生的指標:
-
執行時期工作階段和調用 – 在託管於 Runtime 上時,此特定代理程式產生的工作階段和調用計數
-
Runtime 延遲 – 託管於 Runtime 上之代理程式的請求延遲
-
Runtime 限流 – 由於超過允許的 TPS (每秒交易數) 而被服務限流的請求數目
代理程式詳細資訊 – 工作階段
代理程式可以有數個工作階段。在工作階段索引標籤中檢視工作階段。使用篩選工作階段或是對欄位排序,以尋找所需的工作階段。
選擇工作階段 ID 可檢視工作階段摘要指標,以及屬於該工作階段的追蹤清單。工作階段指標包括:
-
追蹤 – 屬於工作階段的追蹤數目
-
伺服器錯誤 – 處理請求期間的系統錯誤計數。高階伺服器端錯誤可能表示需要調查的潛在基礎結構或服務問題
-
用戶端錯誤 – 用戶端錯誤是無效請求導致的錯誤。高階用戶端錯誤可能表示請求格式或許可存在問題
-
限流 – 由於超過允許的 TPS (每秒交易數) 而被限流之與此工作階段相關的請求數目
-
工作階段詳細資訊 – 工作階段的中繼資料,例如開始時間、結束時間、工作階段 ID
若要分析工作階段中的追蹤清單,請選擇篩選追蹤縮小資料表欄位範圍或對其排序,以調出您要調查的特定追蹤。
選取追蹤之後,右側窗格會顯示追蹤的詳細資訊。對於每個追蹤,您可以檢視追蹤摘要、範圍和追蹤內容詳細資訊。
在追蹤摘要下,可以檢視下列指標:
注意
摘要頁面欄位在代理程式檢視、工作階段檢視和追蹤檢視中保持一致。
-
範圍 – 追蹤內的範圍數目
-
伺服器錯誤 – 處理請求期間的系統錯誤計數。高階伺服器端錯誤可能表示需要調查的潛在基礎結構或服務問題
-
用戶端錯誤 – 用戶端錯誤是無效請求導致的錯誤。高階用戶端錯誤可能表示請求格式或許可存在問題
-
限流 – 由於超過允許的 TPS (每秒交易數) 而被限流之與此工作階段相關的請求數目
-
P95 範圍延遲 – 此特定範圍內所有調用的 95 百分位延遲。請注意,一個範圍可用於多個代理程式
-
追蹤詳細資訊 – 追蹤的中繼資料,例如開始時間、結束時間、追蹤 ID
選擇時間軸可檢視每個範圍的持續時間,了解時間最長並導致回應緩慢的範圍。
若要分析範圍關係和後續呼叫,請選擇軌跡以了解這些範圍及來自這些範圍的後續呼叫之間的互連關係。
在範圍下,選取個別範圍事件,以檢閱原始格式的範圍資料。檢閱原始格式的範圍資料。如需進行細緻的疑難排解,請選取事件索引標籤並檢查模型輸入和輸出。
代理程式詳細資訊 – 追蹤
每個代理程式可能有多個追蹤。在追蹤索引標籤中檢視追蹤詳細資訊。選擇篩選追蹤或是對欄位排序,以尋找所需的追蹤。