

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# AWS PCS 集群更新疑难解答
<a name="working-with_clusters_update_troubleshooting"></a>

本主题可帮助您识别和解决更新集群配置时可能出现的常见问题。

## 更新因记账配置错误而失败
<a name="update-fails-accounting-error"></a>

### 常见原因
<a name="accounting-error-cause"></a>

集群进入`UPDATE_FAILED`状态，错误消息表明存在记账配置问题。当记账配置与当前 Slurm 版本不兼容或包含无效设置时，通常会发生这种情况。

### 解决方案
<a name="accounting-error-resolution"></a>

检查您的记账设置是否与集群的 Slurm 版本兼容，并使用有效的配置参数提交更正后的更新请求。

## 更新失败，出现自定义设置错误
<a name="update-fails-custom-settings-error"></a>

### 常见原因
<a name="custom-settings-error-cause"></a>

集群进入`UPDATE_FAILED`状态，错误消息表明 Slurm 自定义设置存在问题。当您提供无效的 Slurm 参数值或不支持的参数组合时，就会发生这种情况。

### 解决方案
<a name="custom-settings-error-resolution"></a>

根据支持的参数验证您的 Slurm 自定义设置，并使用有效的参数值和组合提交更正后的更新请求。

## 无法提交更新请求
<a name="cannot-submit-update-request"></a>

### 常见原因
<a name="submit-error-cause"></a>

控制台中的更新按钮被禁用或者 API 返回 400 级错误。当群集未处于适当的状态、关联的资源未处于活动状态或您的配置中存在验证失败时，就会发生这种情况。

### 解决方案
<a name="submit-error-resolution"></a>

等待集群和所有关联资源达到`ACTIVE`状态，然后检查您的配置是否存在验证错误，然后再重新提交更新请求。

## 验证错误
<a name="validation-errors"></a>

### 常见原因
<a name="validation-cause"></a>

该命令立即返回，并带有 400 级 HTTP 错误和描述性消息。出现这种情况的原因是群集状态、资源状态或配置参数无效。

### 解决方案
<a name="validation-resolution"></a>

请解决响应中提到的特定验证错误，然后重试更新操作。