Vorbereiten der Trainingsdatensätze für die Destillation
Bevor Sie mit einer Modellanpassung beginnen können, müssen Sie mindestens einen Trainingsdatensatz vorbereiten. Um Eingabedatensätze für ein benutzerdefiniertes Modell vorzubereiten, erstellen Sie .jsonl-Dateien, von denen jede Zeile ein JSON-Objekt ist, das einem Datensatz entspricht. Die von Ihnen erstellten Dateien müssen dem Format der Modelldestillation und dem ausgewählten Modell entsprechen. Zudem ist es erforderlich, dass die darin enthaltenen Datensätze die Größenanforderungen erfüllen.
Geben Sie die Eingabedaten als Prompts ein. Amazon Bedrock verwendet die Eingabedaten, um Antworten aus dem Lehrermodell zu generieren, und nutzt die generierten Antworten dann zur Feinabstimmung des Schülermodells. Weitere Informationen zu den Eingaben, die Amazon Bedrock verwendet, und zur Auswahl der besten Option für Ihren Anwendungsfall finden Sie unter So funktioniert die Amazon-Bedrock-Modelldestillation. Es gibt mehrere Möglichkeiten für die Vorbereitung eines Eingabedatensatzes.
Anmerkung
Amazon Nova-Modelle haben unterschiedliche Anforderungen an die Destillation. Weitere Informationen finden Sie unter Destillieren von Amazon Nova-Modellen.
Themen
Unterstützte Modalitäten für die Destillation
Die unter Unterstützte Modelle und Regionen für die Amazon-Bedrock-Modelldestillation aufgeführten Modelle unterstützen nur die Text-zu-Text-Modalität.
Optimieren von Eingabe-Prompts für die Generierung synthetischer Daten
Während der Modelldestillation generiert Amazon Bedrock einen synthetischen Datensatz, anhand dessen das Schülermodell an den spezifischen Anwendungsfall angepasst wird. Weitere Informationen finden Sie unter So funktioniert die Amazon-Bedrock-Modelldestillation.
Sie können den Generierungsprozess von synthetischen Daten optimieren, indem Sie die Eingabe-Prompts für den gewünschten Anwendungsfall formatieren. Wenn der Anwendungsfall des destillierten Modells beispielsweise Retrieval Augmented Generation (RAG) ist, formatieren Sie die Eingabe-Prompts anders, als wenn Anwendungsfälle für Agenten der Schwerpunkt des Modells sein sollen.
Im Folgenden finden Sie Beispiele dafür, wie Sie Eingabe-Prompts für RAG- oder Agentenanwendungsfälle formatieren können.