本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 AWS 開發人員工具將 ML 組建、訓練和部署工作負載遷移至 Amazon SageMaker
由 Mustafa Waheed (AWS) 建立
Summary
注意: AWS CodeCommit 不再提供給新客戶。的現有客戶 AWS CodeCommit 可以繼續正常使用服務。進一步了解
此模式為遷移在 Unix 或 Linux 伺服器上執行的內部部署機器學習 (ML) 應用程式提供指引,以使用 Amazon SageMaker 在 AWS 上訓練和部署。此部署使用持續整合和持續部署 (CI/CD) 管道。遷移模式是使用 AWS CloudFormation 堆疊進行部署。
先決條件和限制
先決條件
使用 AWS 登陸區域的作用中 AWS
帳戶 在 Unix 或 Linux 伺服器上安裝和設定 AWS Command Line Interface (AWS CLI)
在 AWS CodeCommit 中佈建的 ML 原始碼儲存庫
限制
一個 AWS 區域中只能部署 300 個個別管道。
此模式適用於在 Python train-and-deploy程式碼的受監督 ML 工作負載。
產品版本
Docker 19.03.5 版,使用 Python 3.6x 建置 633a0ea
架構
來源技術堆疊
內部部署 Linux 運算執行個體,其中包含本機檔案系統或關聯式資料庫中的資料
來源架構

目標技術堆疊
使用 Amazon S3 部署的 AWS CodePipeline 用於資料儲存,而 Amazon DynamoDB 作為中繼資料存放區,用於追蹤或記錄管道執行
目標架構

應用程式遷移架構
原生 Python 套件和 AWS CodeCommit 儲存庫 (以及 SQL 用戶端,適用於資料庫執行個體上的內部部署資料集)

工具
Python3
Git
AWS CLI – AWS CLI
部署 AWS CloudFormation 堆疊,並將資料移至 S3 儲存貯體。S3 儲存貯體接著會導向目標。
史詩
任務 | 描述 | 所需的技能 |
---|---|---|
驗證原始程式碼和資料集。 | 資料科學家 | |
識別目標建置、訓練和部署執行個體類型和大小。 | 資料工程師、資料科學家 | |
建立功能清單和容量需求。 | ||
識別網路需求。 | DBA,系統管理員 | |
識別來源和目標應用程式的網路或主機存取安全需求。 | 資料工程師、ML 工程師、系統管理員 | |
決定備份策略。 | ML 工程師、系統管理員 | |
判斷可用性需求。 | ML 工程師、系統管理員 | |
識別應用程式遷移或切換策略。 | 資料科學家、ML 工程師 |
任務 | 描述 | 所需的技能 |
---|---|---|
建立 Virtual Private Cloud (VPC) | ML 工程師、系統管理員 | |
建立安全群組。 | ML 工程師、系統管理員 | |
為 ML 程式碼設定 Amazon S3 儲存貯體和 AWS CodeCommit 儲存庫分支。 | ML 工程師 |
任務 | 描述 | 所需的技能 |
---|---|---|
使用原生 MySQL 工具或第三方工具,將訓練、驗證和測試資料集遷移至佈建的 S3 儲存貯體。 | 這是 AWS CloudFormation 堆疊部署的必要項目。 | 資料工程師、ML 工程師 |
將 ML 訓練和託管程式碼封裝為 Python 套件,並推送至 AWS CodeCommit 或 GitHub 中的佈建儲存庫。 | 您需要儲存庫的分支名稱,才能部署 AWS CloudFormation 範本以進行遷移。 | 資料科學家、ML 工程師 |
任務 | 描述 | 所需的技能 |
---|---|---|
遵循 ML 工作負載遷移策略。 | 應用程式擁有者、ML 工程師 | |
部署 AWS CloudFormation 堆疊。 | 使用 AWS CLI 來建立在此解決方案提供的 YAML 範本中宣告的堆疊。 | 資料科學家、ML 工程師 |
任務 | 描述 | 所需的技能 |
---|---|---|
將應用程式用戶端切換到新的基礎設施。 | 應用程式擁有者、資料科學家、ML 工程師 |
任務 | 描述 | 所需的技能 |
---|---|---|
關閉臨時 AWS 資源。 | 從 AWS CloudFormation 範本關閉任何自訂資源 (例如,任何未使用的 AWS Lambda 函數)。 | 資料科學家、ML 工程師 |
檢閱並驗證專案文件。 | 應用程式擁有者、資料科學家 | |
使用運算子驗證結果和 ML 模型評估指標。 | 確定模型效能符合應用程式使用者的期望,且與內部部署狀態相當。 | 應用程式擁有者、資料科學家 |
關閉專案並提供意見回饋。 | 應用程式擁有者、ML 工程師 |
相關資源
附件
若要存取與本文件相關聯的其他內容,請解壓縮下列檔案: attachment.zip