本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
AWS PCS 集群更新疑难解答
本主题可帮助您识别和解决更新集群配置时可能出现的常见问题。
更新因记账配置错误而失败
常见原因
集群进入UPDATE_FAILED状态,错误消息表明存在记账配置问题。当记账配置与当前 Slurm 版本不兼容或包含无效设置时,通常会发生这种情况。
解决方案
检查您的记账设置是否与集群的 Slurm 版本兼容,并使用有效的配置参数提交更正后的更新请求。
更新失败,出现自定义设置错误
常见原因
集群进入UPDATE_FAILED状态,错误消息表明 Slurm 自定义设置存在问题。当您提供无效的 Slurm 参数值或不支持的参数组合时,就会发生这种情况。
解决方案
根据支持的参数验证您的 Slurm 自定义设置,并使用有效的参数值和组合提交更正后的更新请求。
无法提交更新请求
常见原因
控制台中的更新按钮被禁用或者 API 返回 400 级错误。当群集未处于适当的状态、关联的资源未处于活动状态或您的配置中存在验证失败时,就会发生这种情况。
解决方案
等待集群和所有关联资源达到ACTIVE状态,然后检查您的配置是否存在验证错误,然后再重新提交更新请求。
验证错误
常见原因
该命令立即返回,并带有 400 级 HTTP 错误和描述性消息。出现这种情况的原因是群集状态、资源状态或配置参数无效。
解决方案
请解决响应中提到的特定验证错误,然后重试更新操作。