

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 问题排查
<a name="sagemaker-eks-operator-troubleshooting"></a>

请参阅以下各部分，了解如何纠正使用训练操作符时出现的错误。

## 我无法安装训练操作符
<a name="sagemaker-eks-operator-troubleshooting-installation-error"></a>

如果您无法安装训练操作符，请确保您使用的是[受支持版本的组件](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-eks-operator.html#sagemaker-eks-operator-supported-versions)。例如，如果您收到错误消息，提示您的 HyperPod AMI 版本与培训操作员不兼容，[请更新到最新版本](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html)。

## HyperPod 任务管理版本不兼容
<a name="sagemaker-eks-operator-troubleshooting-task-governance-version"></a>

在安装过程中，您可能会收到一条错误消息，提示 HyperPod 任务管理版本不兼容。训练操作符仅适用于版本 v1.3.0-eksbuild.1 或更高版本。请更新您的 HyperPod 任务管理插件，然后重试。

## 缺少权限
<a name="sagemaker-eks-operator-troubleshooting-task-missing-permissions"></a>

 在设置训练操作符或运行作业时，您可能会收到指示您无权运行某些操作的错误，例如 `DescribeClusterNode`。要纠正这些错误，请确保在[设置 Amazon EKS 容器组身份代理](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-eks-operator-install.html#sagemaker-eks-operator-install-pod-identity)时正确设置 IAM 权限。