Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bereite deine Trainingsdatensätze für die Destillation vor
Bevor Sie mit einer Modellanpassung beginnen können, müssen Sie mindestens einen Trainingsdatensatz vorbereiten. Um Eingabedatensätze für Ihr benutzerdefiniertes Modell vorzubereiten, erstellen Sie .jsonl
Dateien, von denen jede Zeile ein JSON-Objekt ist, das einem Datensatz entspricht. Die von Ihnen erstellten Dateien müssen dem von Ihnen ausgewählten Format für die Modelldestillation und dem Modell entsprechen. Die darin enthaltenen Datensätze müssen auch den Größenanforderungen entsprechen.
Geben Sie die Eingabedaten als Eingabeaufforderungen ein. Amazon Bedrock verwendet die Eingabedaten, um Antworten aus dem Lehrermodell zu generieren, und verwendet die generierten Antworten zur Feinabstimmung des Schülermodells. Weitere Informationen zu den Eingaben, die Amazon Bedrock verwendet, und zur Auswahl einer Option, die für Ihren Anwendungsfall am besten geeignet ist, finden So funktioniert Amazon Bedrock Model Distillation Sie unter. Es gibt mehrere Optionen für die Vorbereitung Ihres Eingabedatensatzes.
Anmerkung
Amazon NovaModelle haben unterschiedliche Anforderungen an die Destillation. Weitere Informationen finden Sie unter Amazon NovaModelle zum Destillieren.
Themen
Unterstützte Modalitäten für die Destillation
Die unter aufgeführten Modelle Unterstützte Modelle und Regionen für Amazon Bedrock Model Distillation unterstützen nur die text-to-text Modalität.
Optimieren Sie Ihre Eingabeaufforderungen für die Generierung synthetischer Daten
Während der Modelldestillation generiert Amazon Bedrock einen synthetischen Datensatz, anhand dessen Ihr Studentenmodell an Ihren spezifischen Anwendungsfall angepasst wird. Weitere Informationen finden Sie unter So funktioniert Amazon Bedrock Model Distillation.
Sie können den Prozess der Generierung synthetischer Daten optimieren, indem Sie Ihre Eingabeaufforderungen für den gewünschten Anwendungsfall formatieren. Wenn der Anwendungsfall Ihres destillierten Modells beispielsweise Retrieval Augmented Generation (RAG) ist, würden Sie Ihre Eingabeaufforderungen anders formatieren, als wenn Sie möchten, dass sich das Modell auf Anwendungsfälle für Agenten konzentriert.
Im Folgenden finden Sie Beispiele dafür, wie Sie Ihre Eingabeaufforderungen für RAG- oder Agenten-Anwendungsfälle formatieren können.