

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 什麼是適用於 Amazon EMR 的 Apache Spark 故障診斷代理程式
<a name="spark-troubleshoot"></a>

## 簡介
<a name="spark-troubleshooting-agent-intro"></a>

Amazon EMR 專用 Apache Spark 故障診斷代理程式是一種對話式 AI 功能，可簡化 Amazon EMR、 AWS Glue 和 Amazon SageMaker 筆記本上 Apache Spark 應用程式的故障診斷。傳統 Spark 疑難排解需要對日誌、效能指標和錯誤模式進行廣泛的手動分析，以識別根本原因和程式碼修正。代理程式透過自然語言提示、自動化工作負載分析和智慧型程式碼建議來簡化此程序。

您可以使用代理程式對 PySpark 和 Scala 應用程式失敗進行故障診斷。代理程式會分析失敗的任務、識別效能瓶頸，並提供可行的建議和程式碼修正，同時讓您完全掌控實作決策。

**注意**  
Apache Spark 故障診斷代理程式在 Amazon EMR 中可免費使用。代理程式僅提供分析和建議。您只需為執行應用程式時用來驗證任何建議修正的 Amazon EMR 資源付費。

## 架構概觀
<a name="spark-troubleshooting-agent-architecture"></a>

故障診斷代理程式有三個主要元件：開發環境中與 MCP 相容的互動 AI 助理、處理用戶端 AWS 和服務之間安全通訊和身分驗證[的 MCP Proxy AWS](https://github.com/aws/mcp-proxy-for-aws)，以及為 Amazon EMR、Glue 和 Amazon SageMaker Notebooks 提供專用 Spark 故障診斷工具的 Amazon SageMaker Unified Studio Remote MCP Server。 `(preview)` AWS Amazon SageMaker 此圖表說明如何透過 AI 助理與 Amazon SageMaker Unified Studio 遠端 MCP 伺服器互動。

![Spark 疑難排解代理程式架構。](http://docs.aws.amazon.com/zh_tw/emr/latest/ReleaseGuide/images/spark-troubleshooting-agent-architecture.png)


AI 助理將依照下列步驟，使用 MCP 伺服器提供的專用工具來協調故障診斷：
+ **特徵擷取和內容建置：**代理程式會自動從 Spark 應用程式收集和分析遙測資料，包括 Spark 歷史記錄伺服器日誌、組態設定和錯誤追蹤。它會擷取關鍵效能指標、資源使用率模式和失敗簽章，以建立全面的內容描述檔，以進行智慧型故障診斷。
+ **GenAI 根本原因分析器和建議引擎：**代理程式利用 AI 模型和 Spark 知識庫來關聯擷取的功能，並識別效能問題或故障的根本原因。它提供 Spark 應用程式執行中發生錯誤的診斷洞察和分析。
+ **GenAI Spark 程式碼建議：**根據上一個步驟的根本原因分析，代理程式會分析您現有的程式碼模式，並識別需要修正應用程式失敗程式碼的效率低下操作。它提供可行的建議，包括特定的程式碼修改、組態調整和具有具體範例的架構改進。

**Topics**
+ [簡介](#spark-troubleshooting-agent-intro)
+ [架構概觀](#spark-troubleshooting-agent-architecture)
+ [客服人員故障診斷的設定](spark-troubleshooting-agent-setup.md)
+ [使用 故障診斷代理程式](spark-troubleshooting-using-troubleshooting-agent.md)
+ [功能和功能](spark-troubleshooting-features.md)
+ [故障診斷和問答](spark-troubleshooting-agent-troubleshooting.md)
+ [詳細資訊中的 Spark 對客服人員工作流程進行故障診斷](spark-troubleshooting-agent-workflow.md)
+ [提示範例](spark-troubleshooting-agent-prompt-examples.md)
+ [IAM 角色設定](spark-troubleshooting-agent-iam-setup.md)
+ [使用 Spark 疑難排解工具](spark-troubleshooting-agent-using-tools.md)
+ [設定 Amazon SageMaker Unified Studio MCP 的介面 VPC 端點](spark-troubleshooting-agent-vpc-endpoints.md)
+ [Apache Spark 故障診斷代理程式的跨區域處理](spark-troubleshooting-cross-region-processing.md)
+ [使用 記錄 Amazon SageMaker Unified Studio MCP 呼叫 AWS CloudTrail](spark-troubleshooting-cloudtrail-integration.md)
+ [Apache Spark 代理程式的服務改進](spark-agents-service-improvements.md)