存取 Scikit-learn 和 Spark ML 的 Docker 映像 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

存取 Scikit-learn 和 Spark ML 的 Docker 映像

SageMaker AI 提供預先建置的 Docker 映像,用於安裝 scikit-learn 和 Spark ML 程式庫。這些程式庫也包含使用 Amazon SageMaker Python SDK 建置與 SageMaker AI 相容的 Docker 映像所需的相依項。透過此 SDK,您可以使用 scikit-learn 來執行機器學習任務,並使用 Spark ML 來建立和調整機器學習管道。如需有關安裝和使用此 SDK 的指示,請參閱 SageMaker Python SDK

您也可以從自有環境的 Amazon ECR 儲存庫存取映像。

使用以下命令來尋找可用的映像版本。例如,使用下列指令尋找 ca-central-1 區域中的可用 sagemaker-sparkml-serving 映像:

aws \ ecr describe-images \ --region ca-central-1 \ --registry-id 341280168497 \ --repository-name sagemaker-sparkml-serving

從 SageMaker AI Python SDK 存取映像

下表包含 GitHub 儲存庫的連結,其中包含 scikit-learn 和 Spark ML 容器的原始程式碼。此表格也包含各項指示的連結,說明如何將這些容器與 Python SDK 估算器搭配使用,以執行您自有的訓練演算法並託管您自有的模型。

有關 GitHub 儲存庫的更多資訊和連結,請參閱使用 Scikit-learn 搭配 Amazon SageMaker AI 的資源使用 SparkML Serving 搭配 Amazon SageMaker AI 的資源

手動指定預先建置的映像

如果您不是使用 SageMaker Python SDK 及其估算器之一來管理容器,則必須手動擷取相關的預先建置容器。SageMaker AI 預先建置的 Docker 映像存放在 Amazon Elastic Container Registry (Amazon ECR) 中。您可以使用其全名登錄地址來推送或提取。SageMaker AI 針對 scikit-learn 和 Spark ML 使用以下 Docker 映像 URL 模式:

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-scikit-learn:<SCIKIT-LEARN_VERSION>-cpu-py<PYTHON_VERSION>

    例如 746614075791.dkr.ecr.us-west-1.amazonaws.com/sagemaker-scikit-learn:1.2-1-cpu-py3

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-sparkml-serving:<SPARK-ML_VERSION>

    例如 341280168497.dkr.ecr.ca-central-1.amazonaws.com/sagemaker-sparkml-serving:2.4

如需帳戶 IDs和 AWS 區域名稱,請參閱 Docker 登錄檔路徑和範例程式碼