特性和功能 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

特性和功能

支持的平台

  • 语言:Python 和 Scala Spark 应用程序

  • 目标平台:亚马逊 EMR、EMR Serverless 和 Glue AWS

工作方式

当你的 Spark 应用程序失败时,你可以使用故障排除代理自动调查出了什么问题。它会分析您的 Spark 事件日志、错误消息和资源使用情况,以查明确切的问题——无论是 Spark 执行器内存不足、配置错误还是代码错误。

当你要求自然语言提示分析你的 Spark 工作负载时,代理会连接到你平台的资源并提取功能(包括 Spark 事件日志、查询计划、执行者时间表、日志跟踪、配置和指标):

对于失败的工作负载,您将获得明确的根本原因说明和修复该问题的具体步骤。如果代理检测到与代码相关的问题,它会自动提供代码建议,以显示要在代码中更改的确切内容。您也可以随时直接请求代码级建议,无需进行全面分析。

可用区

Spark 故障排除代理可在以下区域使用:

  • 亚太地区:东京(ap-northeast-1)、首尔(ap-northeast-2)、新加坡(ap-southeast-1)、悉尼(ap-southeast-2)和孟买(ap-southeast-1)和孟买(ap-southeast-1)

  • 北美洲:加拿大(ca-central-1)

  • 欧洲:斯德哥尔摩(eu-north-1)、爱尔兰(eu-west-1)、伦敦(eu-west-2)、巴黎(eu-west-3)和法兰克福(eu-central-1)

  • 南美洲:圣保罗(sa-east-1)

  • 美国:弗吉尼亚州北部(us-east-1)、俄亥俄州(us-east-2)和俄勒冈州(us-west-2)

Spark 故障排除范围和用户要求

  • 支持的 Spark 工作负载状态:这些工具将仅支持对失败的 Spark 工作负载的响应。

  • EMR 持久用户界面:在分析 Amazon EMR EC2 工作负载时,分析工具将尝试连接到 EMR 持久用户界面以检索 Spark 的关键信息。此处记录了 EMR 持久用户界面的注意事项。

  • Glue Studio Spark 用户界面:在分析 AWS Glue 工作负载时,分析工具将尝试通过解析亚马逊 S3 中用户的 Spark 事件日志来检索 Spark 的关键信息。此处记录了允许的最大 Spark 事件日志大小:512 MB,滚动日志为 2 GB。

  • 代码建议:仅支持 Amazon EMR 和 Glue 工作负EC2 载 AWS 的工作负载 PySpark

  • 区域资源:Spark 故障排除代理是区域性的,使用该区域的底层 EMR 资源进行故障排除。不支持跨区域故障排除。