Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Passen Sie ein Modell mit Destillation in Amazon Bedrock an
Modelldestillation ist der Prozess des Wissenstransfers von einem größeren, intelligenteren Modell (bekannt als Lehrer) auf ein kleineres, schnelleres und kostengünstigeres Modell (bekannt als Schüler). Bei diesem Prozess verbessert sich die Leistung des Schülermodells für einen bestimmten Anwendungsfall. Amazon Bedrock Model Distillation verwendet die neuesten Datensynthesetechniken, um anhand des Lehrermodells vielfältige, qualitativ hochwertige Antworten (sogenannte synthetische Daten) zu generieren und das Schülermodell zu verfeinern.
Gehen Sie wie folgt vor, um Amazon Bedrock Model Distillation zu verwenden:
-
Wählen Sie ein Lehrermodell und ein Schülermodell. Weitere Informationen finden Sie unter Wählen Sie Lehrer- und Schülermodelle für die Destillation.
-
Bereiten Sie Ihre Trainingsdaten für die Destillation vor. Ihre Trainingsdaten sind eine Sammlung von Eingabeaufforderungen, die in
.jsonl
Dateien gespeichert sind. Amazon Bedrock verwendet die Eingabedaten, um Antworten aus dem Lehrermodell zu generieren, und verwendet die Antworten zur Feinabstimmung des Schülermodells.-
Sie können den Prozess der Generierung synthetischer Daten optimieren, indem Sie Ihre Eingabeaufforderungen für den gewünschten Anwendungsfall formatieren. Weitere Informationen finden Sie unter Optimieren Sie Ihre Eingabeaufforderungen für die Generierung synthetischer Daten.
-
Sie können beschriftete Eingabedaten als Prompt-Response-Paare vorbereiten. Amazon Bedrock kann diese Paare als goldene Beispiele verwenden und gleichzeitig Antworten anhand des Lehrermodells generieren. Weitere Informationen finden Sie unter Option 1: Stellen Sie Ihre eigenen Eingabeaufforderungen für die Datenvorbereitung bereit.
-
Wenn Sie die Protokollierung von CloudWatch Logs-Aufrufen aktivieren, können Sie bestehende Antworten von Lehrern aus in Amazon S3 gespeicherten Aufrufprotokollen als Trainingsdaten verwenden. Ein Aufrufprotokoll in Amazon Bedrock ist eine detaillierte Aufzeichnung von Modellaufrufen. Weitere Informationen finden Sie unter Option 2: Verwenden Sie Aufrufprotokolle für die Datenvorbereitung.
-
-
Erstellen Sie einen Destillationsauftrag. Dieser Job erstellt ein kleineres, schnelleres und kostengünstigeres Modell für Ihren Anwendungsfall. Nur Sie können auf das endgültige destillierte Modell zugreifen. Amazon Bedrock verwendet Ihre Daten nicht, um andere Lehrer- oder Schülermodelle für den öffentlichen Gebrauch zu schulen. Weitere Informationen finden Sie unter Reichen Sie einen Auftrag zur Modelldestillation bei Amazon Bedrock ein. Wenn Ihr Destillationsauftrag abgeschlossen ist, können Sie die Ergebnisse des Anpassungsprozesses analysieren. Weitere Informationen finden Sie unter Analysieren Sie die Ergebnisse einer Modellanpassung. Informationen zum Einrichten von Inferenzen für Ihr Modell finden Sie unterInferenz für ein benutzerdefiniertes Modell einrichten.
So funktioniert Amazon Bedrock Model Distillation
Amazon Bedrock Model Distillation ist ein einziger Workflow, der den Prozess der Erstellung eines destillierten Modells automatisiert. In diesem Workflow generiert Amazon Bedrock Antworten anhand eines Lehrermodells, fügt Datensynthesetechniken hinzu, um die Antwortgenerierung zu verbessern, und optimiert das Schülermodell anhand der generierten Antworten. Der erweiterte Datensatz wird in separate Datensätze aufgeteilt, um ihn für Training und Validierung zu verwenden. Amazon Bedrock verwendet nur die Daten im Trainingsdatensatz, um das Studentenmodell zu optimieren.
Nachdem Sie Ihre Lehrer- und Schülermodelle identifiziert haben, können Sie wählen, wie Amazon Bedrock ein destilliertes Modell für Ihren Anwendungsfall erstellen soll. Amazon Bedrock kann entweder anhand der von Ihnen bereitgestellten Eingabeaufforderungen Antworten von Lehrern generieren, oder Sie können Antworten aus Ihren Produktionsdaten über Aufrufprotokolle verwenden. Amazon Bedrock Model Distillation verwendet diese Antworten zur Feinabstimmung des Studentenmodells.
Anmerkung
Wenn Amazon Bedrock Model Distillation seine eigenen Datensynthesetechniken verwendet, um qualitativ hochwertigere Antworten von Lehrern zu generieren, fallen zusätzliche Gebühren für Inferenzgespräche zum Lehrermodell an. AWS-Konto Diese Gebühren werden zu den On-Demand-Inferenztarifen des Lehrermodells in Rechnung gestellt. Durch Datensynthesetechniken kann die Größe des Feinabstimmungsdatensatzes auf maximal 15.000 Prompt-Response-Paare erhöht werden. Weitere Informationen zu den Gebühren von Amazon Bedrock finden Sie unter Amazon Bedrock Pricing
Erstellen eines destillierten Modells mithilfe der von Ihnen angegebenen Eingabeaufforderungen
Amazon Bedrock verwendet die von Ihnen bereitgestellten Eingabeaufforderungen, um Antworten aus dem Lehrermodell zu generieren. Amazon Bedrock verwendet dann die Antworten, um das von Ihnen identifizierte Studentenmodell zu optimieren. Abhängig von Ihrem Anwendungsfall kann Amazon Bedrock eigene Datensynthesetechniken hinzufügen, um vielfältige und qualitativ hochwertigere Antworten zu generieren. Amazon Bedrock könnte beispielsweise ähnliche Eingabeaufforderungen generieren, um anhand des Lehrermodells vielfältigere Antworten zu generieren. Oder, wenn Sie optional eine Handvoll beschrifteter Eingabedaten als Prompt-Response-Paare bereitstellen, kann Amazon Bedrock diese Paare als goldene Beispiele verwenden, um den Lehrer anzuweisen, ähnlich hochwertige Antworten zu generieren.
Erstellen eines destillierten Modells unter Verwendung von Produktionsdaten
Wenn Sie bereits über Antworten verfügen, die vom Lehrermodell generiert und in den Aufrufprotokollen gespeichert wurden, können Sie diese vorhandenen Lehrerantworten verwenden, um das Schülermodell zu verfeinern. Dazu müssen Sie Amazon Bedrock Zugriff auf Ihre Aufrufprotokolle gewähren. Ein Aufrufprotokoll in Amazon Bedrock ist eine detaillierte Aufzeichnung von Modellaufrufen. Weitere Informationen finden Sie unter Überwachen des Modellaufrufs mithilfe von Protokollen. CloudWatch
Wenn Sie sich für diese Option entscheiden, können Sie weiterhin Inferenz-API-Operationen von Amazon Bedrocks wie InvokeModeldie Converse API verwenden und die Aufrufprotokolle, Modelleingabedaten (Eingabeaufforderungen) und Modellausgabedaten (Antworten) für alle in Amazon Bedrock verwendeten Aufrufe sammeln.
Wenn Sie mithilfe der Converse
API-Operationen InvokeModel
oder Antworten aus dem Modell generieren, können Sie die Antworten optional ergänzen. requestMetadata
Wenn Sie einen Distillation-Job erstellen, können Sie im Rahmen der Konfiguration der Aufruf-Logs nach diesen Metadaten filtern. Sie können nach Ihren spezifischen Anwendungsfällen filtern. Amazon Bedrock verwendet dann nur die gefilterten Antworten, um Ihr Studentenmodell zu optimieren. Wenn Sie sich dafür entscheiden, Aufrufprotokolle zur Feinabstimmung Ihres Studentenmodells zu verwenden, können Sie Amazon Bedrock anweisen, nur die Eingabeaufforderungen zu verwenden, oder Prompt-Response-Paare verwenden.
Auswahl von Eingabeaufforderungen mit Aufruf-Logs
Wenn Sie festlegen, dass Amazon Bedrock nur die Eingabeaufforderungen aus den Aufrufprotokollen verwendet, verwendet Amazon Bedrock die Eingabeaufforderungen, um Antworten aus dem Lehrermodell zu generieren. In diesem Fall verwendet Amazon Bedrock die Antworten, um das von Ihnen identifizierte Studentenmodell zu optimieren. Abhängig von Ihrem Anwendungsfall kann Amazon Bedrock Model Distillation eigene Datensynthesetechniken hinzufügen, um vielfältige und qualitativ hochwertigere Antworten zu generieren.
Auswahl von Prompt-Response-Paaren mit Aufruf-Logs
Wenn Sie festlegen, dass Amazon Bedrock Prompt-Response-Paare aus den Aufrufprotokollen verwendet, generiert Amazon Bedrock keine Antworten aus dem Lehrermodell neu und verwendet die Antworten aus dem Aufrufprotokoll zur Feinabstimmung des Schülermodells. Damit Amazon Bedrock die Antworten aus den Aufrufprotokollen lesen kann, muss das in Ihrem Modeldestillationsjob angegebene Lehrermodell mit dem im Aufrufprotokoll verwendeten Modell übereinstimmen. Wenn sie nicht übereinstimmen, werden die Aufruf-Logs nicht verwendet. Wenn Sie den Antworten im Aufrufprotokoll Anforderungsmetadaten hinzugefügt haben, können Sie zur Feinabstimmung des Studentenmodells die Filter für Anforderungsmetadaten angeben, sodass Amazon Bedrock nur bestimmte Protokolle liest, die für Ihren Anwendungsfall gültig sind.