Bereite deine Trainingsdatensätze für die Destillation vor - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereite deine Trainingsdatensätze für die Destillation vor

Bevor Sie mit einer Modellanpassung beginnen können, müssen Sie mindestens einen Trainingsdatensatz vorbereiten. Um Eingabedatensätze für Ihr benutzerdefiniertes Modell vorzubereiten, erstellen Sie .jsonl Dateien, von denen jede Zeile ein JSON-Objekt ist, das einem Datensatz entspricht. Die von Ihnen erstellten Dateien müssen dem von Ihnen ausgewählten Format für die Modelldestillation und dem Modell entsprechen. Die darin enthaltenen Datensätze müssen auch den Größenanforderungen entsprechen.

Geben Sie die Eingabedaten als Eingabeaufforderungen ein. Amazon Bedrock verwendet die Eingabedaten, um Antworten aus dem Lehrermodell zu generieren, und verwendet die generierten Antworten zur Feinabstimmung des Schülermodells. Weitere Informationen zu den Eingaben, die Amazon Bedrock verwendet, und zur Auswahl einer Option, die für Ihren Anwendungsfall am besten geeignet ist, finden So funktioniert Amazon Bedrock Model Distillation Sie unter. Es gibt mehrere Optionen für die Vorbereitung Ihres Eingabedatensatzes.

Anmerkung

Amazon NovaModelle haben unterschiedliche Anforderungen an die Destillation. Weitere Informationen finden Sie unter Amazon NovaModelle zum Destillieren.

Unterstützte Modalitäten für die Destillation

Die unter aufgeführten Modelle Unterstützte Modelle und Regionen für Amazon Bedrock Model Distillation unterstützen nur die text-to-text Modalität.

Optimieren Sie Ihre Eingabeaufforderungen für die Generierung synthetischer Daten

Während der Modelldestillation generiert Amazon Bedrock einen synthetischen Datensatz, anhand dessen Ihr Studentenmodell an Ihren spezifischen Anwendungsfall angepasst wird. Weitere Informationen finden Sie unter So funktioniert Amazon Bedrock Model Distillation.

Sie können den Prozess der Generierung synthetischer Daten optimieren, indem Sie Ihre Eingabeaufforderungen für den gewünschten Anwendungsfall formatieren. Wenn der Anwendungsfall Ihres destillierten Modells beispielsweise Retrieval Augmented Generation (RAG) ist, würden Sie Ihre Eingabeaufforderungen anders formatieren, als wenn Sie möchten, dass sich das Modell auf Anwendungsfälle für Agenten konzentriert.

Im Folgenden finden Sie Beispiele dafür, wie Sie Ihre Eingabeaufforderungen für RAG- oder Agenten-Anwendungsfälle formatieren können.

RAG prompt example
{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a financial analyst charged with answering questions about 10K and 10Q SEC filings. Given the context below, answer the following question." } ], "messages": [ { "role": "user", "content": [ { "text": "<context>\nDocument 1: Multiple legal actions have been filed against us as a result of the October 29, 2018 accident of Lion Air Flight 610 and the March 10, 2019 accident of Ethiopian Airlines Flight 302.\n</context>\n\n<question>Has Boeing reported any materially important ongoing legal battles from FY2022?</question>" } ] } ] }
Agent prompt example
{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": 'You are an expert in composing functions. You are given a question and a set of possible functions. Based on the question, you will need to make one or more function/tool calls to achieve the purpose. Here is a list of functions in JSON format that you can invoke. [ { "name": "lookup_weather", "description: "Lookup weather to a specific location", "parameters": { "type": "dict", "required": [ "city" ], "properties": { "location": { "type": "string", }, "date": { "type": "string", } } } } ]' } ], "messages": [ { "role": "user", "content": [ { "text": "What's the weather tomorrow?" } ] }, { "role": "assistant", "content": [ { "text": "[lookup_weather(location=\"san francisco\", date=\"tomorrow\")]" } ] } ] }