Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Beaufsichtigte Feinabstimmung auf 2.0 Amazon Nova
-Übersicht
Amazon Nova2.0-SFT-Daten verwenden dasselbe Converse-API-Format wie Amazon Nova 1.0, mit zusätzlichen optionalen Inhaltsfeldern für Argumentation. Vollständige Formatspezifikationen finden Sie unter ReasoningContentBlockund das Converse API-Schema.
Unterstützte Features
Eingabetypen — Text, Bild oder Video in Benutzerinhaltsblöcken
Assistenteninhalte — Reine Textantworten und Argumentationsinhalte
Zusammensetzung des Datensatzes — Muss homogen sein. Wählen Sie eine der folgenden Optionen: Nur-Text-Wendungen, Text-+Bild-Wendungen oder Text-+Videoumblendungen
Wichtig
Es ist nicht möglich, Bilder und Videos innerhalb desselben Datensatzes oder über mehrere Runden hinweg zu mischen.
Aktuelle Einschränkungen
Verwendung von Tools — Obwohl die Verwendung von Tools im Eingabeformat unterstützt wird, wird sie derzeit von Amazon Nova 2.0 SFT nicht unterstützt. Das Hinzufügen von Werkzeugabschnitten kann dazu führen, dass Ihr Job fehlschlägt.
Inhalte zum multimodalen Denken — Das Converse-Format unterstützt zwar bildbasierte Argumentationsinhalte, diese werden jedoch von 2.0 SFT nicht unterstützt. Amazon Nova
Validierungssätze — Die Bereitstellung eines Validierungssatzes wird möglicherweise über die Benutzeroberfläche unterstützt, während der SFT-Schulung jedoch nicht.
Unterstützte Medienformate
Bilder — PNG, JPEG, GIF
Videos — MOV, MKV, MP4
Beispiele für Datenformate
Modi „Argumentation“ und „Argumentation ohne Argumentation“
Den Inhalt des Arguments verstehen: Der Argumentationsinhalt (auch genannt chain-of-thought) erfasst die Zwischenschritte des Modells beim Denken, bevor eine endgültige Antwort generiert wird. Verwenden assistant Sie anschließend das reasoningContent Feld, um diese Argumentationsspuren einzubeziehen.
So wird der Verlust berechnet:
Mit Argumentationsinhalt — Der Trainingsverlust umfasst sowohl Argumentationstoken als auch Token für das Endergebnis
Ohne Inhalt zum Argumentieren — Der Trainingsverlust wird nur anhand der endgültigen Ausgangstoken berechnet
Sie können mehrere Runden des Assistenten in Konversationen mit reasoningContent mehreren Runden einbeziehen.
Wann sollte der Argumentationsmodus aktiviert werden
Geben Sie reasoning_enabled: true in Ihrer Trainingskonfiguration an, wann das Modell Denkansätze generieren soll, bevor endgültige Ergebnisse erzielt werden, oder wenn Sie bei komplexen Argumentationsaufgaben eine verbesserte Leistung benötigen.
Anmerkung
Sie können den Argumentationsmodus unabhängig davon aktivieren, ob Ihre Trainingsdaten Argumentationsinhalte enthalten. Es wird jedoch empfohlen, Argumentationsspuren in Ihre Trainingsdaten aufzunehmen, damit das Modell aus diesen Beispielen lernen und die Qualität der Argumentation verbessern kann.
Legen Sie diese Einstellung fest, reasoning_enabled: false wenn Sie an einfachen Aufgaben trainieren, die nicht von expliziten Argumentationsschritten profitieren, oder wenn Sie die Geschwindigkeit optimieren und die Token-Nutzung reduzieren möchten.
Richtlinien zur Formatierung
Verwenden Sie Klartext, um Inhalte zu begründen.
Vermeiden Sie Markup-Tags wie
<thinking>und,</thinking>sofern dies für Ihre Aufgabe nicht ausdrücklich erforderlich ist.Stellen Sie sicher, dass der Inhalt der Argumentation klar und relevant für den Problemlösungsprozess ist.
Generierung von Argumentationsdaten
Wenn es Ihrem Datensatz an Argumentationsspuren mangelt, können Sie diese mit einem Modell erstellen, das Argumentation ermöglicht, wie z. Stellen Sie dem Modell Ihre Input-Output-Paare zur Verfügung und erfassen Sie dessen Argumentationsprozess, um einen mit Argumenten erweiterten Datensatz zu erstellen.
Verwendung von Argumentationstoken für das Training
Beim Training mit aktiviertem Argumentationsmodus lernt das Modell, internes Denken von der endgültigen Antwort zu trennen. Der Trainingsprozess funktioniert wie folgt:
Organisiert Daten als Tripel: Eingabe, Argumentation und Antwort
Optimiert mithilfe von standardmäßigen Verlusten bei der Vorhersage des nächsten Tokens sowohl bei Argumentations- als auch bei Antwort-Tokens
Ermutigt das Modell, intern zu argumentieren, bevor Antworten generiert werden
Inhalt für effektives Denken
Qualitativ hochwertige Inhalte zum Argumentieren sollten Folgendes beinhalten:
Zwischengedanken und Analysen
Logische Ableitungen und Inferenzschritte
Step-by-step Ansätze zur Problemlösung
Explizite Zusammenhänge zwischen Schritten und Schlußfolgerungen
Dies hilft dem Modell, die Fähigkeit zu entwickeln, vor der Beantwortung nachzudenken.
Richtlinien für die Vorbereitung von Datensätzen
Die folgende Tabelle enthält Richtlinien für die Vorbereitung Ihres Trainingsdatensatzes.
| Richtlinie | Description |
|---|---|
| Größe und Qualität |
|
| Diversität |
Fügen Sie verschiedene Beispiele hinzu, die Folgendes bewirken:
|
| Formatierung der Ausgabe |
Geben Sie das gewünschte Ausgabeformat in den Antworten des Assistenten eindeutig an. Beispiele hierfür sind JSON-Strukturen, Tabellen, das CSV-Format oder benutzerdefinierte Formate, die für Ihre Anwendung spezifisch sind. |
| Multi-turn-Konversationen |
|
| Checkliste für Qualität |
|