本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
進階設定
SageMaker HyperPod 配方轉接器建置在 Nvidia Nemo 和 Pytorch-lightning 架構之上。如果您已經使用這些架構,則將您的自訂模型或功能整合到 SageMaker HyperPod 配方轉接器是一個類似的程序。除了修改配方轉接器之外,您還可以變更自己的預先訓練或微調指令碼。如需撰寫自訂訓練指令碼的指引,請參閱範例
使用 SageMaker HyperPod 轉接器建立您自己的模型
在配方轉接器內,您可以在下列位置自訂下列檔案:
-
collections/data:包含負責載入資料集的模組。目前,它僅支援來自 HuggingFace 的資料集。如果您有更進階的要求,程式碼結構可讓您在相同的資料夾內新增自訂資料模組。 -
collections/model:包括各種語言模型的定義。目前,它支援常見的大型語言模型,例如 Llama、Mixtral 和 Mistral。您可以靈活地在此資料夾內引入自己的模型定義。 -
collections/parts:此資料夾包含以分散式方式訓練模型的策略。其中一個範例是全碎片資料平行 (FSDP) 策略,允許跨多個加速器將大型語言模型碎片化。此外,這些策略支援各種形式的模型平行化。您也可以選擇引入自己的自訂訓練策略進行模型訓練。 -
utils:包含旨在協助管理訓練任務的各種公用程式。它可以做為您自己工具的儲存庫。您可以將自己的工具用於故障診斷或基準測試等任務。您也可以在此資料夾內新增自己的個人化 PyTorch Lightning 回呼。您可以使用 PyTorch Lightning 回呼,將特定功能或操作無縫整合到訓練生命週期。 -
conf:包含用於驗證訓練任務中特定參數的組態結構描述定義。如果引入新的參數或組態,您可以將自訂的結構描述新增至此資料夾。您可以使用自訂的結構描述來定義驗證規則。您可以驗證資料類型、範圍或任何其他參數限制條件。您也可以定義自己的自訂結構描述來驗證參數。