使用故障排除代理 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用故障排除代理

支持的部署模式

适用于 Amazon EMR 的 Apache Spark 故障排除代理支持针对失败的 Spark 工作负载的全面分析功能,包括自动错误诊断、性能瓶颈识别、代码建议和可行的建议,以提高以下 Spark 部署模式下的应用程序性能:

  • EMR 已开启 EC2

  • EMR Serverless

  • AWS Glue

请参阅特性和功能以了解详细的功能、容量和限制。

支持的接口

对 Amazon SageMaker 笔记本中的单元进行故障排除

演示使用 Amazon SageMaker 笔记本电脑的故障排除经验。对于任何笔记本手机故障,您可以通过单击Fix with AI按钮让 Amazon SageMaker Notebook Agent 对故障进行故障排除,请求进行分析,然后进行可能的代码修复(如果错误是由代码引起的)。

使用 Kiro CLI 对 Glue 和 EMR Spark 应用程序进行故障排除

启动 Kiro CLI 或你的 AI Assistant,然后验证已加载的工具以进行故障排除。

... sagemaker-unified-studio-mcp-code-rec (MCP) - spark_code_recommendation not trusted sagemaker-unified-studio-mcp-troubleshooting (MCP) - analyze_spark_workload not trusted ...

现在,您可以启动 Spark 故障排除代理工作流程了。

演示 Kiro CLI 的故障排除体验。您只需按以下提示即可开始故障排除过程:

Analyze my Glue job. The job name is "xxx" and the job run id is "xxx"

与其他 MCP 客户端集成

中所述的配置也故障排除代理的设置可以在其他 MCP 客户端中使用,也可以用于 IDEs 连接到托管 MCP 服务器: