

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 机器学习产品的故障排除
<a name="ml-troubleshooting"></a>

 本部分为您在机器学习产品的发布过程中可能遇到的一些常见错误提供帮助。如果您的问题未列出，请联系 [AWS Marketplace 卖家运营](https://aws.amazon.com/marketplace/management/contact-us/)团队。

## 常规：当我在模型包或算法中添加我的模型包的 Amazon 资源名称 (ARN) 时，出现了 400 错误 AWS Marketplace 管理门户
<a name="troubleshooting_error_code_400"></a>

### 常见原因
<a name="troubleshooting_common_cause"></a>

 在 SageMaker AI 中创建机器学习产品时，您没有选择在中发布产品 AWS Marketplace。

### 解决方案
<a name="troubleshooting_resolution"></a>

 如果您使用 Amazon SageMaker AI 控制台创建资源，则必须在 “**发布此模型包” 的最后一页上选择 “**是**”， AWS Marketplace或者在 “发布此****算法**” 时选择 “**是**” AWS Marketplace。您不能选择**否**然后稍后再发布。选择**是**不会发布模型包或算法。但是，它会在创建模型包或算法资源时对其进行验证，这是在 AWS Marketplace中使用所必需的。

 如果您使用 AWS 软件开发工具包[创建模型包](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateModelPackage.html#sagemaker-CreateModelPackage-request-CertifyForMarketplace)或[创建算法](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAlgorithm.html#sagemaker-CreateAlgorithm-request-CertifyForMarketplace)，请确保将参数设置`CertifyForMarketplace`为`true`。

重新创建经过认证和验证的模型包或算法资源后，在 AWS Marketplace 管理门户中添加新的 ARN。

## 一般：当我在模型包或算法中添加模型包或算法的 ARN 时，出现了 404 错误 AWS Marketplace 管理门户
<a name="troubleshooting_error_code_404"></a>

### 常见原因
<a name="troubleshooting_common_cause"></a>

 此错误可能是由于以下几个原因引起的：
+  ARN 可能无效。
+  模型包或算法资源不是在与卖家账户 AWS 账户 相同的情况下创建的。
+  您用于发布的用户或角色没有访问模型包或算法资源的正确 IAM 权限。

### 解决方案
<a name="troubleshooting_resolution"></a>

1.  检查 ARN，确保它是正确的 ARN 并符合预期格式：

    对于模型包， ARNs 应类似于`arn:aws:sagemaker:us-east-2:000123456789:model-package/my-model-package-name`。

    对于算法， ARNs 应类似于`arn:aws:sagemaker:us-east-2:000123456789:algorithm/my-algorithm`。

1.  确保所有用于发布的资源和资产都在您发布内容的卖家账户中。

1.  确保您的用户或角色拥有以下权限：

    对于模型包，必须允许对模型包资源执行 `sagemaker:DescribeModelPackage` 操作。

    对于算法，必须允许对算法资源执行 `sagemaker:DescribeAlgorithm` 操作。

## Amazon SageMaker AI：创建模型包或算法资源时收到 “客户端错误：注册表访问被拒绝” 失败消息
<a name="troubleshooting_error_sm_access_denied"></a>

### 常见原因
<a name="troubleshooting_common_cause"></a>

当用于创建模型包或算法的映像存储在属于另一个 AWS 账户的 [Amazon ECR](https://aws.amazon.com/ecr/) 存储库中时，可能会发生此错误。模型包或算法验证不支持跨账户映像。

### 解决方案
<a name="troubleshooting_resolution"></a>

将该映像复制到您用来发布的 Amazon ECR 存储库中。 AWS 账户 然后，使用新的映像位置继续创建资源。

## Amazon SageMaker AI：我收到 “未启动” 和 “客户端错误：未计划扫描...” 失败消息
<a name="troubleshooting_error_sm_failure"></a>

### 常见原因
<a name="troubleshooting_common_cause"></a>

当 SageMaker AI 无法开始扫描存储在 Amazon ECR 中的 Docker 容器镜像时，就会发生此错误。

### 解决方案
<a name="troubleshooting_resolution"></a>

如果发生这种情况，请打开 [Amazon ECR 控制台](https://console.aws.amazon.com/ecr/repositories?region=us-east-2)，找到您的映像上传到的存储库，选择映像，然后选择**扫描**。