本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
SageMaker AI Workflows
擴展機器學習 (ML) 操作時,您可以使用 Amazon SageMaker AI 全受管工作流程服務,為您的 ML 生命週期實作持續整合和部署 (CI/CD) 實務。使用 Pipeline SDK ,您可以選擇管道步驟並將其整合到一個統一的解決方案中,從資料準備到模型部署都能自動執行模型建置程序。對於 Kubernetes 型架構,您可以在您的 Kubernetes 叢集上安裝 SageMaker AI Operators,以使用 Kubernetes API 和命令列工具 (例如 kubectl) 原生建立 SageMaker AI 任務。使用 Kubeflow 管道的 SageMaker AI 元件,您可以從 Kubeflow 管道建立和監控原生 SageMaker AI 任務。來自 SageMaker AI 的工作參數、狀態和輸出都可以從 Kubeflow Pipelines UI 存取。最後,如果您想要排程批次任務,您可以使用 AWS Batch 任務佇列整合或 Jupyter 筆記本型工作流程服務,根據您定義的排程啟動獨立或定期執行。
總之,SageMaker AI 提供下列工作流程技術:
-
管道:用於建置和管理機器學習 (ML) 管道的工具。
-
Kubernetes 協調:用於 Kubernetes 叢集的 SageMaker AI 自訂運算子,以及用於 Kubeflow Pipelines 的元件。
-
SageMaker 筆記本工作:依需求或排定的 Jupyter 筆記本非互動式批次執行。
您也可以利用與 SageMaker AI 整合的其他服務來建立您的工作流程。選項包括下列服務:
-
Airflow 工作流程
:SageMaker API 可匯出用於建立和管理 Airflow 工作流程的組態。 -
AWS Step Functions
:Python 中的多步驟 ML 工作流程,可協調 SageMaker AI 基礎設施,而不必單獨佈建您的資源。 -
AWS Batch:將 SageMaker AI 訓練任務提交至 AWS Batch 任務佇列,您可以在其中排定任務在運算環境中執行的優先順序和排程任務。
有關管理 SageMaker 訓練和推理的詳細資訊,請參閱Amazon SageMaker Python SDK 工作流程