

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 对包含 AWS ParallelCluster 自定义资源的堆栈进行故障排除
<a name="cfn-cluster-ops-troubleshooting"></a>

使用 AWS ParallelCluster 自定义资源，从新的独立堆栈 CloudFormation 部署群集。您可以通过执行以下步骤来监控集群创建：

1. 导航到， AWS 管理控制台 然后 CloudFormation 在导航窗格中选择 **Stacks**。

1. 选择名为您为集群名称定义的名称的堆栈。

1. 如果堆栈状态为 `ROLLBACK_COMPLETE`，则表明在创建集群过程中出现了错误。

1. 选择**堆栈详细信息**，然后选择**事件**选项卡。

1. 在**逻辑 ID** 上搜索**事件**，查找您为集群名称定义的名称。该事件包含一个 `Status reason`，给出问题的理由。

1. 您也可以选择**堆栈**下拉菜单，然后选择**已删除**以查看已删除堆栈的列表。选择包含该集群名称的堆栈并查看**事件**以了解更多详细信息。

1. 要查看管理群集的自定义资源提供程序的输出，请选择**描述**为 “AWS ParallelCluster 群集自定义资源” 的堆栈。选择**资源**选项卡，找到**逻辑 ID** 为 `PclusterCfnFunctionLogGroup` 的资源，然后点击提供的链接。查看显示 Lambda 调试输出的日志流。

1. 要对集群进行故障排除，请参阅 [AWS ParallelCluster 故障排除](troubleshooting-v3.md)。