管道概觀 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

管道概觀

Amazon SageMaker AI 管道是有向無環圖 (DAG) 中的一系列互連步驟,這些步驟是使用拖放 UI 或 Pipelines SDK 所定義的。您也可以使用管道定義 JSON 結構描述建置管道。此 DAG JSON 定義會提供管道每個步驟之間的要求和關係的相關資訊。管道的 DAG 結構由步驟之間的資料相依性決定。當一個步驟的輸出的内容作為輸入傳遞給另一個步驟時,就會建立這些資料相依性。下列影像是管道 DAG 範例:

範例管道有向無環圖 (DAG)。
範例 DAG 包含下列步驟:
  1. AbaloneProcess (處理步驟的執行個體) 會對用於訓練的資料執行預先處理指令碼。例如,指令碼可以填入缺失值、標準化數值資料,或將資料分割成訓練、驗證和測試資料集。

  2. AbaloneTrain (訓練步驟的執行個體) 會設定超參數,並從預先處理的輸入資料訓練模型。

  3. AbaloneEval (處理步驟的另一個執行個體) 會評估模型的準確性。此步驟顯示資料相依性的範例 - 此步驟使用 AbaloneProcess 的測試資料集輸出。

  4. AbaloneMSECond條件步驟的實例,在此範例中,其會檢查以確保模型評估的均方誤差結果低於特定限制。如果模型不符合條件,管道執行會停止。

  5. 管道執行會繼續進行下列步驟:

    1. AbaloneRegisterModel,其中 SageMaker AI 會呼叫 RegisterModel 步驟,將模型當作版本控制模型套件群組註冊至 Amazon SageMaker 模型註冊表。

    2. AbaloneCreateModel,其中 SageMaker AI 會呼叫 CreateModel 步驟來建立模型,以準備批次轉換。在 AbaloneTransform 中,SageMaker AI 會呼叫轉換步驟,在您指定的資料集上產生模型預測。

下列主題描述 Pipelines 的基本概念。有關描述實現這些概念的教學課程,請參閱Pipelines 動作