Amazon Nova Forge - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Nova Forge

Amazon Nova Forge 是first-of-its-kind的服務,為組織提供使用 Nova 建置自己的前沿模型的最簡單且最具成本效益的方式。

Amazon Nova Forge 引進「開放式訓練」模型的概念,可讓組織存取各種早期模型檢查點,並在模型訓練的每個階段,將專屬資料與 Amazon 策劃的資料集混合。這可讓模型最大限度地從專屬資料中學習,同時將忘記基礎技能的風險降至最低,例如推理。

Nova Forge 提供下列主要功能:

  • 跨模型開發的所有階段存取檢查點,並在新 Nova 模型廣泛推出之前加以利用

  • 使用 Amazon Nova 策劃的訓練資料混合您的專屬資料

  • 在您的環境中使用獎勵函數執行強化學習

  • 使用最佳化的按鈕配方,透過視覺化工作流程或命令列界面使用 Nova 建置

  • 使用內建的負責 AI 工具組來實作自訂安全防護機制

先決條件

訂閱 Nova Forge

若要請求存取 Nova Forge 服務,第一個步驟是將下列鍵/值對作為標籤新增至您的角色:Forge-subscription。將這些標籤新增至角色後,請前往 SageMaker AI 主控台 > 模型訓練和自訂,然後按一下 Nova Forge。在此頁面上,您可以找到服務、定價資訊和功能的詳細資訊。您可以從此頁面請求訂閱,然後管理訂閱。

  1. 角色應具有呼叫 api 的許可ListAttachedRolePolicy,且回應應包含 AdministratorAccessAmazonSageMakerFullAccess政策。

  2. 登入角色應具有呼叫 api 的許可ListRoleTags,且回應標籤應包含 tag.key=forge-subscription

其他先決條件

也請確定下列先決條件已完成:

  1. 一般先決條件

  2. SageMaker HyperPod 使用者的其他步驟:將限制執行個體群組 (RIG) 新增至 HyperPod 叢集 (若要完成以下步驟,請參閱此處)

初始 HyperPod 設定

請依照AWS文件中的步驟,將 HyperPod CLI 連線至您的叢集。確保您使用nova-lite-2.0-release分支而非 release_v2 進行測試。本主題涵蓋:

  • 設定 AWSIAM 許可和政策

  • 設定 HyperPod CLI

  • 使用必要的執行個體群組建立叢集

  • 連線至叢集

驗證:完成設定後,請確認您可以成功執行hyperpod connect-cluster和存取叢集。

設定 Nova Forge 的許可

若要啟用 Nova Forge 模型和資料混合的存取,請授予 HyperPod 叢集的執行角色存取 Nova Forge S3 儲存貯體的許可。

  1. 找到您的執行角色。

    您的執行角色遵循命名慣例:

    arn:aws:iam::<AWS_ACCOUNT_ID>:role/<your-cluster-name>-9610a1d3ExecRole

    若要尋找您的執行角色:

    1. 導覽至 中的 IAM → 角色AWS 管理主控台

    2. 搜尋您的叢集名稱 (例如 9610a1d3Exec)

    3. 找到符合上述模式的角色

    4. 或者,如果叢集已建立,則可以在 SageMaker AI > 叢集管理 > 【您的叢集名稱】 > 執行個體 > 受限執行個體群組 > 執行角色 ARN AWS 管理主控台下的 中檢視執行角色

  2. 將變更套用至現有 RIG (如適用)

    重要

    如果您在建立 RIG 之後授予此許可,您必須更新叢集,變更才會生效。如需更新叢集的指示,請參閱以下疑難排解一節。

    注意

    如果沒有此許可,您的 RIG 將無法存取 Forge 功能所需的 Nova 資料集或模型檢查點。