

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon EMR 集群问题排查
<a name="emr-troubleshoot"></a>

 EMR 集群在复杂的生态系统中运行，该生态系统包括开源软件、自定义应用程序代码和。 AWS 服务当以上任何环节出现问题时，集群都可能失败，或者花费比您预期更长的时间才能完成。以下主题可帮助您识别集群的问题以及如何修复它们。

**Topics**
+ [哪些工具可用于对 Amazon EMR 集群进行故障排查？](emr-troubleshoot-tools.md)
+ [查看并重新启动 Amazon EMR 和应用程序进程（进程守护程序）](emr-process-restart-stop-view.md)
+ [Amazon EMR 中的常见错误集合](emr-troubleshoot-errors.md)
+ [对因错误代码而失败的 Amazon EMR 集群进行问题排查](emr-troubleshoot-failed.md)
+ [排查 Amazon EMR 集群速度缓慢的问题](emr-troubleshoot-slow.md)
+ [解决将 Amazon EMR 与 Lake Formation 配合 AWS 使用时的常见问题](emr-troubleshoot-lf.md)

关于排查 [EMR 上的 Spark 应用程序](https://aws.github.io/aws-emr-best-practices/docs/bestpractices/Applications/Spark/troubleshooting/)问题的指导。

 在开发新的 Hadoop 应用程序时，我们建议您启用调试并处理一小部分但具有代表性的数据子集以测试应用程序。您可能还需要运行应用程序 step-by-step来分别测试每个步骤。有关更多信息，请参阅[配置 Amazon EMR 集群日志记录和调试](emr-plan-debugging.md)和[步骤 5：分步测试 Amazon EMR 集群](emr-troubleshoot-failed-5-test-steps.md)。