Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
SFT auf Nova 2.0
Amazon Nova Lite 2.0 bietet erweiterte Funktionen für die überwachte Feinabstimmung, darunter einen erweiterten Argumentationsmodus, ein verbessertes multimodales Verständnis und eine erweiterte Kontexthandhabung. Mit SFT on Nova 2.0 können Sie diese leistungsstarken Funktionen an Ihre spezifischen Anwendungsfälle anpassen und gleichzeitig die überragende Leistung des Modells bei komplexen Aufgaben beibehalten.
Zu den wichtigsten Funktionen von SFT on Nova 2.0 gehören:
-
Unterstützung des Argumentationsmodus: Trainieren Sie Modelle so, dass sie vor den endgültigen Antworten explizite Argumentationsspuren erzeugen, um die Analysemöglichkeiten zu verbessern.
-
Fortgeschrittenes multimodales Training: Präzise Feinabstimmung in Sachen Dokumentenverständnis (PDF), Videoverständnis und bildgestützte Aufgaben.
-
Funktionen zum Aufrufen von Tools: Trainieren Sie Modelle, um externe Tools effektiv zu nutzen und Funktionen für komplexe Workflows aufzurufen.
-
Erweiterte Kontextunterstützung: Nutzen Sie längere Kontextfenster mit besserer Stabilität und Genauigkeit für dokumentenintensive Anwendungen.
Themen
Auswahl des Argumentationsmodus (nur Nova 2.0)
Amazon Nova 2.0 unterstützt den Argumentationsmodus für erweiterte Analysefunktionen:
-
Argumentationsmodus (aktiviert):
-
reasoning_enabled: trueIn der Trainingskonfiguration festgelegt -
Modellieren Sie Übungen, um Argumentationsspuren vor den endgültigen Antworten zu generieren
-
Verbessert die Leistung bei komplexen Argumentationsaufgaben
-
-
Modus ohne Argumentation (deaktiviert):
-
Den Parameter setzen
reasoning_enabled: falseoder weglassen (Standard) -
Standard-SFT ohne explizite Begründung
-
Geeignet für Aufgaben, bei denen Argumentation nicht von Vorteil ist step-by-step
-
Anmerkung
-
Wenn Argumentation aktiviert ist, ist ein hoher Argumentationsaufwand erforderlich. Für SFT gibt es keine Option mit geringem Argumentationsaufwand.
-
Inhalte zum multimodalen Denken werden für SFT nicht unterstützt. Der Argumentationsmodus gilt für reine Texteingaben.
reasoning_enabled:
trueEs ist zulässig, Amazon Nova anhand eines Datensatzes ohne Argumentation zu schulen. Dies kann jedoch dazu führen, dass das Modell seine Argumentationsfähigkeit verliert, da Amazon Nova in erster Linie lernt, die in den Daten enthaltenen Antworten zu generieren, ohne Argumentation anzuwenden.
Wenn Sie Amazon Nova mit einem Datensatz ohne Argumentation trainieren, aber dennoch Argumentation während der Inferenz verwenden möchten:
-
Deaktivieren Sie die Argumentation während des Trainings ()
reasoning_enabled: false -
Aktiviert die Argumentation zu einem späteren Zeitpunkt während der Inferenz
Dieser Ansatz ermöglicht zwar die Argumentation zum Zeitpunkt der Inferenz, garantiert jedoch keine bessere Leistung als Folgerungen ohne Argumentation.
Bewährte Methode: Aktivieren Sie Argumentation sowohl für Training als auch für Folgerungen, wenn Sie Datensätze mit Argumentation verwenden, und deaktivieren Sie sie für beide, wenn Sie Datensätze verwenden, die keine Argumentation verwenden.
Datenformat für das Aufrufen des Tools
SFT unterstützt Trainingsmodelle für die Verwendung von Tools (Funktionsaufruf). Im Folgenden finden Sie ein Beispiel für ein Eingabeformat für den Aufruf von Tools:
Beispiel für eine Eingabe:
{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are an expert in composing function calls." } ], "toolConfig": { "tools": [ { "toolSpec": { "name": "getItemCost", "description": "Retrieve the cost of an item from the catalog", "inputSchema": { "json": { "type": "object", "properties": { "item_name": { "type": "string", "description": "The name of the item to retrieve cost for" }, "item_id": { "type": "string", "description": "The ASIN of item to retrieve cost for" } }, "required": [ "item_id" ] } } } }, { "toolSpec": { "name": "getItemAvailability", "description": "Retrieve whether an item is available in a given location", "inputSchema": { "json": { "type": "object", "properties": { "zipcode": { "type": "string", "description": "The zipcode of the location to check in" }, "quantity": { "type": "integer", "description": "The number of items to check availability for" }, "item_id": { "type": "string", "description": "The ASIN of item to check availability for" } }, "required": [ "item_id", "zipcode" ] } } } } ] }, "messages": [ { "role": "user", "content": [ { "text": "I need to check whether there are twenty pieces of the following item available. Here is the item ASIN on Amazon: id-123. Please check for the zipcode 94086" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "The user wants to check how many pieces of the item with ASIN id-123 are available in the zipcode 94086" } } }, { "toolUse": { "toolUseId": "getItemAvailability_0", "name": "getItemAvailability", "input": { "zipcode": "94086", "quantity": 20, "item_id": "id-123" } } } ] }, { "role": "user", "content": [ { "toolResult": { "toolUseId": "getItemAvailability_0", "content": [ { "text": "[{\"name\": \"getItemAvailability\", \"results\": {\"availability\": true}}]" } ] } } ] }, { "role": "assistant", "content": [ { "text": "Yes, there are twenty pieces of item id-123 available at 94086. Would you like to place an order or know the total cost?" } ] } ] }
Wichtige Überlegungen zum Aufrufen von Tool-Daten:
-
ToolUse darf nur in der Runde des Assistenten erscheinen
-
ToolResult darf nur in der Runde eines Benutzers erscheinen
-
ToolResult sollte nur Text oder JSON sein; andere Modalitäten werden derzeit für Amazon Nova-Modelle nicht unterstützt
-
Das InputSchema in der ToolSpec muss ein gültiges JSON-Schema-Objekt sein
-
Jeder Assistent ToolResult muss auf einen gültigen Wert toolUseId aus einem vorhergehenden Assistenten verweisen ToolUse, wobei jeder Assistent genau einmal pro toolUseId Konversation verwendet wird
Dokument, das das Datenformat versteht
SFT unterstützt Trainingsmodelle für Aufgaben zum Verständnis von Dokumenten. Im Folgenden finden Sie ein Beispiel für ein Eingabeformat:
Beispiel für eine Eingabe
{ "schemaVersion": "bedrock-conversation-2024", "messages": [ { "role": "user", "content": [ { "text": "What are the ways in which a customer can experience issues during checkout on Amazon?" }, { "document": { "format": "pdf", "source": { "s3Location": { "uri": "s3://my-bucket-name/path/to/documents/customer_service_debugging.pdf", "bucketOwner": "123456789012" } } } } ] }, { "role": "assistant", "content": [ { "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?" } ], "reasoning_content": [ { "text": "I need to find the relevant section in the document to answer the question.", "type": "text" } ] } ] }
Wichtige Überlegungen zum Verständnis von Dokumenten:
-
Es werden nur PDF-Dateien unterstützt
-
Die maximale Dokumentgröße beträgt 10 MB
-
Ein Beispiel kann Dokumente und Text enthalten, darf jedoch keine Kombination von Dokumenten mit anderen Modalitäten (wie Bildern oder Videos) enthalten
Video Understanding für SFT
SFT unterstützt die Feinabstimmung von Modellen für Videoverständnisaufgaben. Im Folgenden finden Sie ein Beispiel für ein Eingabeformat:
Beispiel für eine Eingabe
{ "schemaVersion": "bedrock-conversation-2024", "messages": [ { "role": "user", "content": [ { "text": "What are the ways in which a customer can experience issues during checkout on Amazon?" }, { "video": { "format": "mp4", "source": { "s3Location": { "uri": "s3://my-bucket-name/path/to/videos/customer_service_debugging.mp4", "bucketOwner": "123456789012" } } } } ] }, { "role": "assistant", "content": [ { "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?" } ], "reasoning_content": [ { "text": "I need to find the relevant section in the video to answer the question.", "type": "text" } ] } ] }
Wichtige Überlegungen zum Verständnis von Videos:
-
Videos können maximal 50 MB groß sein
-
Videos können bis zu 15 Minuten lang sein
-
Pro Beispiel ist nur ein Video zulässig. Mehrere Videos in derselben Stichprobe werden nicht unterstützt
-
Ein Beispiel kann Video und Text enthalten, aber kein Video mit anderen Modalitäten (wie Bildern oder Dokumenten) mischen
Anweisungen zum Hochladen von Daten
Laden Sie Trainings- und Validierungsdatensätze in einen S3-Bucket hoch. Geben Sie diese Speicherorte im run Rezeptblock an:
## Run config run: ... data_s3_path: "s3://<bucket-name>/<training-directory>/<training-file>.jsonl"
Hinweis: Ersetzen Sie<bucket-name>,<training-directory>, <validation-directory><training-file>, und <validation-file> durch tatsächliche S3-Pfade.
Hinweis: Validierungsdatensätze werden derzeit nicht für SFT mit Amazon Nova 2.0 unterstützt. Wenn ein Validierungsdatensatz bereitgestellt wird, wird dieser ignoriert.
Einen Job zur Feinabstimmung erstellen
Definieren Sie das Basismodell mithilfe der model_name_or_path Felder model_type und im run Block:
## Run config run: ... model_type: amazon.nova-2-lite-v1:0:256k model_name_or_path: nova-lite-2/prod ...
Anleitung zu Hyperparametern
Verwenden Sie je nach Trainingsansatz die folgenden empfohlenen Hyperparameter:
Training mit vollem Rang
-
Epochen: 1
-
Lernrate (lr): 1e-5
-
Minimale Lernrate (min_lr): 1e-6
LoRa (Low-Rank-Anpassung)
-
Epochen: 2
-
Lernrate (lr): 5e-5
-
Minimale Lernrate (min_lr): 1e-6
Hinweis: Passen Sie diese Werte je nach Datensatzgröße und Validierungsleistung an. Überwachen Sie die Trainingsmetriken, um eine Überanpassung zu vermeiden.