Anpassen eines Modells mit Destillation in Amazon Bedrock
Modelldestillation ist der Prozess, Wissen von einem größeren, intelligenteren Modell (Lehrer) auf ein kleineres, schnelleres und kostengünstigeres Modell (Schüler) zu übertragen. Bei diesem Prozess verbessert sich die Leistung des Schülermodells für einen bestimmten Anwendungsfall. Amazon-Bedrock-Modelldestillation verwendet die neuesten Datensynthesetechniken, um anhand des Lehrermodells vielfältige, qualitativ hochwertige Antworten (synthetische Daten) zu generieren und das Schülermodell zu optimieren.
Gehen Sie wie folgt vor, um die Amazon-Bedrock-Modelldestillation zu verwenden:
-
Wählen Sie ein Lehrer- und ein Schülermodell aus. Weitere Informationen finden Sie unter Auswählen von Lehrer- und Schülermodellen für die Destillation.
-
Bereiten Sie Ihre Trainingsdaten für die Destillation vor. Ihre Trainingsdaten sind eine Sammlung von Prompts, die in
.jsonl-Dateien gespeichert sind. Amazon Bedrock verwendet die Eingabedaten, um Antworten aus dem Lehrermodell zu generieren, und nutzt die Antworten dann zur Feinabstimmung des Schülermodells.-
Sie können den Generierungsprozess von synthetischen Daten optimieren, indem Sie die Eingabe-Prompts für den gewünschten Anwendungsfall formatieren. Weitere Informationen finden Sie unter Optimieren von Eingabe-Prompts für die Generierung synthetischer Daten.
-
Sie können beschriftete Eingabedaten als Prompt-Response-Paare aufbereiten. Amazon Bedrock kann diese Paare als goldene Beispiele verwenden und gleichzeitig Antworten anhand des Lehrermodells generieren. Weitere Informationen finden Sie unter Option 1: Bereitstellen eigener Prompts für die Datenvorbereitung.
-
Wenn Sie die Aufrufprotokollierung von CloudWatch Logs aktivieren, können Sie bestehende Antworten von Lehrern aus Aufrufprotokollen, die in Amazon S3 gespeichert sind, als Trainingsdaten verwenden. Ein Aufrufprotokoll in Amazon Bedrock ist eine detaillierte Aufzeichnung von Modellaufrufen. Weitere Informationen finden Sie unter Option 2: Verwenden der Aufrufprotokolle für die Datenvorbereitung.
-
-
Erstellen Sie einen Destillationsauftrag. Mit diesem Auftrag wird ein kleineres, schnelleres und kostengünstigeres Modell für Ihren Anwendungsfall erstellt. Nur Sie können auf das endgültige destillierte Modell zugreifen. Amazon Bedrock verwendet Ihre Daten nicht, um andere Lehrer- oder Schülermodelle für den öffentlichen Gebrauch zu trainieren. Weitere Informationen finden Sie unter Übermitteln eines Auftrags zur Modelldestillation bei Amazon Bedrock. Wenn Ihr Destillationsauftrag abgeschlossen ist, können Sie die Ergebnisse des Anpassungsprozesses analysieren. Weitere Informationen finden Sie unter Analysieren der Ergebnisse eines Modellanpassungsauftrags. Weitere Informationen zum Einrichten von Inferenz für Ihr Modell finden Sie unter Einrichten von Inferenz für ein benutzerdefiniertes Modell.
Themen
So funktioniert die Amazon-Bedrock-Modelldestillation
Die Amazon-Bedrock-Modelldestillation ist ein einziger Workflow, der den Prozess der Erstellung eines destillierten Modells automatisiert. In diesem Workflow generiert Amazon Bedrock Antworten aus einem Lehrermodell, fügt Datensynthesetechniken zur Verbesserung der Antwortgenerierung hinzu und optimiert das Schülermodell anhand der generierten Antworten. Der erweiterte Datensatz wird in separate Datensätze aufgeteilt, die für Training und Validierung verwendet werden. Amazon Bedrock verwendet nur die Daten im Trainingsdatensatz, um das Schülermodell zu optimieren.
Nachdem Sie Ihre Lehrer- und Schülermodelle identifiziert haben, können Sie wählen, wie Amazon Bedrock ein destilliertes Modell für Ihren Anwendungsfall erstellen soll. Amazon Bedrock kann entweder anhand der von Ihnen bereitgestellten Prompts Lehrer-Antworten generieren oder Sie können Ihre Produktionsdaten mithilfe von Aufrufprotokollen verwenden. Die Amazon-Bedrock-Modelldestillation verwendet diese Antworten zur Feinabstimmung des Schülermodells.
Anmerkung
Wenn die Amazon-Bedrock-Modelldestillation proprietäre Datensynthesetechniken verwendet, um qualitativ hochwertigere Antworten von Lehrern zu generieren, fallen in Ihrem AWS-Konto zusätzliche Gebühren für Inferenzaufrufe an das Lehrermodell an. Diese Gebühren werden zu den On-Demand-Inferenzsätzen des Lehrermodells in Rechnung gestellt. Durch Datensynthesetechniken kann die Größe des Feinabstimmungsdatensatzes auf maximal 15 000 Prompt-Response-Paare erhöht werden. Weitere Informationen zu den Gebühren von Amazon Bedrock finden Sie unter Amazon Bedrock – Preise
Erstellen eines destillierten Modells mithilfe der von Ihnen bereitgestellten Prompts
Amazon Bedrock verwendet die von Ihnen bereitgestellten Prompts, um Antworten aus dem Lehrermodell zu generieren. Amazon Bedrock verwendet dann die Antworten, um das von Ihnen identifizierte Schülermodell zu optimieren. Abhängig von Ihrem Anwendungsfall kann Amazon Bedrock proprietäre Datensynthesetechniken hinzufügen, um vielfältige und qualitativ hochwertigere Antworten zu generieren. Amazon Bedrock könnte beispielsweise ähnliche Prompts generieren, um anhand des Lehrermodells vielfältigere Antworten zu generieren. Wenn Sie optional eine Handvoll beschrifteter Eingabedaten als Prompt-Response-Paare bereitstellen, kann Amazon Bedrock diese Paare auch als goldene Beispiele verwenden, um das Lehrermodell anzuweisen, ähnlich hochwertige Antworten zu generieren.
Erstellen eines destillierten Modells unter Verwendung von Produktionsdaten
Wenn Sie bereits über Antworten verfügen, die vom Lehrermodell generiert und in den Aufrufprotokollen gespeichert wurden, können Sie diese vorhandenen Lehrerantworten verwenden, um das Schülermodell zu optimieren. Dazu müssen Sie Amazon Bedrock Zugriff auf Ihre Aufrufprotokolle gewähren. Ein Aufrufprotokoll in Amazon Bedrock ist eine detaillierte Aufzeichnung von Modellaufrufen. Weitere Informationen finden Sie unter Überwachen des Modellaufrufs mithilfe von CloudWatch Logs.
Wenn Sie diese Option wählen, können Sie weiterhin Inferenz-API-Operationen von Amazon Bedrock wie InvokeModel- oder Converse-API verwenden und die Aufrufprotokolle, Modelleingabedaten (Prompts) und Modellausgabedaten (Antworten) für alle in Amazon Bedrock verwendeten Aufrufe sammeln.
Wenn Sie mithilfe der API-Operation InvokeModel oder Converse anhand des Modells Antworten generieren, können Sie die Antworten optional durch requestMetadata ergänzen. Wenn Sie einen Destillationsauftrag erstellen, können Sie im Rahmen der Konfiguration der Aufrufprotokolle nach diesen Metadaten filtern. Sie können nach Ihren spezifischen Anwendungsfällen filtern. Amazon Bedrock verwendet dann nur die gefilterten Antworten, um Ihr Schülermodell zu optimieren. Wenn Sie sich dafür entscheiden, Aufrufprotokolle zur Feinabstimmung Ihres Schülermodells zu verwenden, können Sie Amazon Bedrock anweisen, nur die Prompts zu verwenden, oder Sie nutzen die Prompt-Response-Paare.
Auswählen von Prompts mit Aufrufprotokollen
Wenn Sie festlegen, dass Amazon Bedrock nur die Prompts aus den Aufrufprotokollen verwendet, nutzt Amazon Bedrock die Prompts, um Antworten aus dem Lehrermodell zu generieren. In diesem Fall verwendet Amazon Bedrock die Antworten, um das von Ihnen identifizierte Schülermodell zu optimieren. Abhängig von Ihrem Anwendungsfall kann die Amazon-Bedrock-Modelldestillation proprietäre Datensynthesetechniken hinzufügen, um vielfältige und qualitativ hochwertigere Antworten zu generieren.
Auswählen von Prompt-Response-Paaren mit Aufrufprotokollen
Wenn Sie festlegen, dass Amazon Bedrock Prompt-Response-Paare aus den Aufrufprotokollen verwendet, generiert Amazon Bedrock keine Antworten aus dem Lehrermodell neu, sondern verwendet die Antworten aus dem Aufrufprotokoll zur Feinabstimmung des Schülermodells. Damit Amazon Bedrock die Antworten aus den Aufrufprotokollen lesen kann, muss das in Ihrem Modelldestillationsauftrag angegebene Lehrermodell mit dem im Aufrufprotokoll verwendeten Modell übereinstimmen. Wenn sie nicht übereinstimmen, werden die Aufrufprotokolle nicht verwendet. Wenn Sie den Antworten im Aufrufprotokoll Anforderungsmetadaten hinzugefügt haben, können Sie zur Feinabstimmung des Schülermodells die Filter für Anforderungsmetadaten angeben, sodass Amazon Bedrock nur bestimmte Protokolle liest, die für Ihren Anwendungsfall gültig sind.