

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 `cfn-hup` 未執行時對叢集更新逾時進行故障診斷
<a name="troubleshooting-v3-cluster-update-timeout"></a>

`cfn-hup` 協助程式是一個常駐程式，它會偵測資源中繼資料中的變更，並在偵測到變更時執行使用者指定的動作。這是您透過 `UpdateStack` API 動作在執行中的 Amazon EC2 執行個體上進行組態更新的方式。

目前`cfn-hup`協助程式是由 啟動`supervisord`。但在啟動後，`cfn-hup`程序會與`supervisord`控制項分離。如果`cfn-hup`魔抗被外部演員殺死，則不會自動重新啟動。如果 `cfn-hup` 未執行，在叢集更新期間，CloudFormation 堆疊會如預期啟動更新程序，但前端節點上不會啟動更新程序，且堆疊最終會逾時。從叢集日誌 `/var/log/chef-client`中，您可以看到永遠不會叫用更新配方。

**檢查並在失敗`cfn-hup`時重新啟動**

1. 在前端節點上，檢查 是否`cfn-hup`正在執行：

   ```
   $ ps aux | grep cfn-hup
   ```

1. 檢查前端節點`/var/log/supervisord.log`上的`cfn-hup`日誌 `/var/log/cfn-hup.log`和 。

1. 如果 `cfn-hup` 未執行，請嘗試執行以重新啟動它：

   ```
   $ sudo /opt/parallelcluster/pyenv/versions/cookbook_virtualenv/bin/supervisorctl start cfn-hup
   ```