如何使用 Amazon Bedrock Model Distillation Amazon Bedrock 模型蒸餾功能如何運作

在 Amazon Bedrock 中自訂具有蒸餾的模型

模型蒸餾是將知識從更大型的智慧型模型 (稱為教師) 轉移到更小、更快速且具成本效益的模型 (稱為學生) 的程序。在此程序中，學生模型的效能會針對特定使用案例改善。Amazon Bedrock 模型蒸餾功能使用最新的資料合成技術，從教師模型產生多樣化、高品質的回應 (稱為合成資料)，並微調學生模型。

如何使用 Amazon Bedrock Model Distillation

若要使用 Amazon Bedrock 模型蒸餾功能，請執行下列動作：

選擇老師模型和學生模型 – 如需詳細資訊，請參閱模型分割的先決條件。
準備您的訓練資料以進行分割 – 您的訓練資料是存放在 .jsonl 檔案中的提示集合。Amazon Bedrock 會使用輸入資料從教師模型產生回應，並使用回應來微調學生模型。
- 最佳化提示 – 針對您想要的使用案例格式化輸入提示。如需詳細資訊，請參閱最佳化輸入提示以產生合成資料。
- 使用標記的範例 – 將標記的輸入資料準備為提示-回應對。Amazon Bedrock 可以使用這些配對作為最佳範例，同時從教師模型產生回應。如需詳細資訊，請參閱選項 1：提供您自己的資料準備提示。
- 使用調用日誌 – 如果您啟用 CloudWatch Logs 調用日誌，您可以使用存放在 Amazon S3 中的調用日誌中的現有教師回應作為訓練資料。Amazon Bedrock 中的調用日誌是模型調用的詳細記錄。如需詳細資訊，請參閱選項 2：使用調用日誌進行資料準備。
建立分割任務 – 此任務會為您的使用案例建立更小、更快速且更具成本效益的模型。只有您可以存取最終的蒸餾模型。Amazon Bedrock 不會使用您的資料來訓練任何其他教師或學生模型以供公開使用。如需詳細資訊，請參閱在 Amazon Bedrock 中提交模型蒸餾任務。如需設定隨需推論的詳細資訊，請參閱為自訂模型設定推論。

Amazon Bedrock 模型蒸餾功能如何運作

Amazon Bedrock 模型蒸餾功能是單一工作流程，可自動化建立蒸餾模型的程序。在此工作流程中，Amazon Bedrock 會從教師模型產生回應、新增資料合成技術以改善回應產生，然後利用產生的回應微調學生模型。擴增後的資料集會拆分成單獨的資料集，以用於訓練和驗證。Amazon Bedrock 僅使用訓練資料集中的資料來微調學生模型。

在您確定教師和學生模型之後，您可以選擇 Amazon Bedrock 針對您的使用案例建立蒸餾模型的方式。Amazon Bedrock 可以使用您提供的提示產生教師回應，您也可以透過調用日誌使用您生產資料的回應。Amazon Bedrock 模型蒸餾功能會使用這些回應來微調學生模型。

注意

如果 Amazon Bedrock Model Distillation 使用其專有資料合成技術來產生更高品質的教師回應，則您對教師模型的推論呼叫 AWS 帳戶會產生額外費用。這些費用將以教師模型的隨需推論費率計費。資料合成技術可能會將微調資料集的大小增加到最多 15k 個提示-回應對。如需 Amazon Bedrock 收費的詳細資訊，請參閱 Amazon Bedrock 定價。

Amazon Bedrock 會使用您提供的輸入提示，從教師模型產生回應。然後，Amazon Bedrock 會使用回應來微調您已識別的學生模型。視您的使用案例而定，Amazon Bedrock 可能會新增專屬資料合成技術，以產生多樣化和更高品質的回應。例如，Amazon Bedrock 可能會產生類似的提示，以從教師模型產生更多樣化的回應。或者，如果您選擇性地提供少量標記為提示-回應對的輸入資料，則 Amazon Bedrock 可能會使用這些配對作為最佳範例，指示教師產生類似的高品質回應。

如果您已有由教師模型產生的回應，並將其存放在調用日誌中，您可以使用這些現有的教師回應來微調學生模型。因此，您需要提供 Amazon Bedrock 對調用日誌的存取權。Amazon Bedrock 中的調用日誌是模型調用的詳細記錄。如需詳細資訊，請參閱使用 CloudWatch Logs 監控模型調用。

如果您選擇此選項，則可以繼續使用 Amazon Bedrocks 推論 API 操作，例如 InvokeModel 或 Converse API，並針對 Amazon Bedrock 中使用的所有調用收集調用日誌、模型輸入資料 (提示) 和模型輸出資料 (回應)。

當您使用 InvokeModel 或 Converse API 操作從模型產生回應時，您可以選擇將 requestMetadata 新增至回應。當您建立蒸餾任務時，您可以依此中繼資料進行篩選，作為調用日誌組態的一部分。您可以依特定使用案例進行篩選，然後 Amazon Bedrock 只會使用篩選的回應來微調學生模型。當您選擇使用調用日誌來微調學生模型時，您可以讓 Amazon Bedrock 僅使用提示，或使用提示-回應對。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

評估您的 RFT 模型

先決條件