

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 访问 Scikit-learn 和 Spark ML 的预构建 Docker 映像
<a name="pre-built-docker-containers-scikit-learn-spark"></a>

SageMaker AI 提供了预构建的 Docker 镜像，用于安装 scikit-learn 和 Spark ML 库。这些库还包括使用 SageMaker A [maz SageMaker on Python 软件开发工具包构建与 AI 兼容的 D](https://sagemaker.readthedocs.io/en/stable) ocker 镜像所需的依赖项。通过使用该开发工具包，您可以使用 scikit-learn 执行机器学习任务，并使用 Spark ML 创建和优化机器学习管道。有关安装和使用该开发工具包的说明，请参阅 [SageMaker Python 开发工具包](https://github.com/aws/sagemaker-python-sdk#installing-the-sagemaker-python-sdk)。

您还可以在自己的环境中从 Amazon ECR 存储库访问映像。

使用以下命令找出哪些版本的映像可用。例如，使用以下命令来查找可用 `ca-central-1` 区域中的可用 `sagemaker-sparkml-serving` 映像：

```
aws \
    ecr describe-images \
    --region ca-central-1 \
    --registry-id 341280168497 \
    --repository-name sagemaker-sparkml-serving
```

## 从 SageMaker AI Python 软件开发工具包访问图像
<a name="pre-built-docker-containers-scikit-learn-spark-sdk"></a>

下表包含指向 GitHub 存储库的链接，其中包含 scikit-learn 和 Spark ML 容器的源代码。该表还包含指向说明的链接，用于演示如何将这些容器与 Python SDK 估计器结合使用，以便运行自己的训练算法和托管自己的模型。


| 图书馆 | 预构建的 Docker 映像源代码 | 说明 | 
| --- | --- | --- | 
| scikit-learn |  [SageMaker AI Scikit-learn 容器](https://github.com/aws/sagemaker-scikit-learn-container)  |  [在亚马逊 Python 软件开发工具包中使用 Scikit-Learn SageMaker ](https://sagemaker.readthedocs.io/en/stable/using_sklearn.html)  | 
| Spark ML |  [SageMaker AI Spark 机器学习服务容器](https://github.com/aws/sagemaker-sparkml-serving-container)  |  [SparkML Python SDK 文档](https://sagemaker.readthedocs.io/en/stable/sagemaker.sparkml.html)  | 

有关更多信息和 Github 存储库的链接，请参阅[在 Amazon AI 中使用 Scikit-Learn 的资源 SageMaker](sklearn.md)和[在 Amazon AI 上使用 SparkML 服务的资源 SageMaker](sparkml-serving.md)。

## 手动指定预构建映像
<a name="pre-built-containers-scikit-learn-manual"></a>

如果您没有使用 SageMaker Python SDK 及其估算器之一来管理容器，则必须手动检索相关的预构建容器。 SageMaker 人工智能预构建的 Docker 镜像存储在亚马逊弹性容器注册表 (Amazon ECR) Container Registry 中。您可以使用它们的全名注册表地址来推送或拉取它们。 SageMaker AI 在 scikit-learn 和 Spark ML 中使用以下 Docker Image 网址模式：
+ `<ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-scikit-learn:<SCIKIT-LEARN_VERSION>-cpu-py<PYTHON_VERSION>`

  例如，`746614075791.dkr.ecr.us-west-1.amazonaws.com/sagemaker-scikit-learn:1.2-1-cpu-py3`
+ `<ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-sparkml-serving:<SPARK-ML_VERSION>`

  例如，`341280168497.dkr.ecr.ca-central-1.amazonaws.com/sagemaker-sparkml-serving:2.4`

有关账户 IDs 和 AWS 区域名称，请参阅 [Docker 注册表路径和示例代码](https://docs.aws.amazon.com/sagemaker/latest/dg-ecr-paths/sagemaker-algo-docker-registry-paths)。