Bereiten Sie Ihre Trainingsdatensätze für die Feinabstimmung und die Fortsetzung des Vortrainings vor - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereiten Sie Ihre Trainingsdatensätze für die Feinabstimmung und die Fortsetzung des Vortrainings vor

Um Trainings- und Validierungsdatensätze für Ihr benutzerdefiniertes Modell vorzubereiten, erstellen Sie .jsonl Dateien, wobei jede Zeile ein JSON-Objekt ist, das einem Datensatz entspricht. Bevor Sie mit einer Modellanpassung beginnen können, müssen Sie mindestens einen Trainingsdatensatz vorbereiten. Die von Ihnen erstellten Dateien müssen dem Format für die gewählte Anpassungsmethode und das Modell entsprechen. Die darin enthaltenen Datensätze müssen je nach Modell den Größenanforderungen entsprechen.

Informationen zu den Modellanforderungen finden Sie unter. Modellanforderungen für Schulungs- und Validierungsdatensätze Die Standardkontingente, die für Schulungs- und Validierungsdatensätze gelten, die für die Anpassung verschiedener Modelle verwendet werden, finden Sie unter Summe der Kontingente für Schulungs- und Validierungsdatensätze in Amazon Bedrock-Endpunkten und Kontingenten in der. Allgemeine AWS-Referenz

Ob ein Validierungsdatensatz unterstützt wird und welches Format Ihr Trainings- und Validierungsdatensatz hat, hängt von den folgenden Faktoren ab.

  • Die Art des Anpassungsauftrags zur Feinabstimmung (Feinabstimmung oder Fortsetzung der Vorschulung).

  • Die Eingabe- und Ausgabemodalitäten der Daten.

Informationen zur Feinabstimmung von Amazon Nova Modellen finden Sie unter Feinabstimmung Amazon Nova von Modellen.

Unterstützte Modalitäten für die Feinabstimmung und kontinuierliche Vorschulung

In den folgenden Abschnitten werden die verschiedenen Funktionen zur Feinabstimmung und Vorbereitung der Schulung beschrieben, die von den einzelnen Modellen unterstützt werden, geordnet nach ihren Input- und Outputmodalitäten. Informationen zur Feinabstimmung von Modellen finden Sie unter Feinabstimmung von Amazon Nova Modellen. Amazon Nova

Text-to-Text Modelle

Text-to-Text Modelle können für verschiedene textbasierte Aufgaben optimiert werden, sowohl für Konversationsanwendungen als auch für Anwendungen ohne Konversation. Hinweise zur Vorbereitung von Daten für die Feinabstimmung von Modellen finden Sie unter. Text-to-Text Daten für die Feinabstimmung text-to-text von Modellen vorbereiten

Die folgenden Modelle, bei denen es sich nicht um Konversationen handelt, sind für Aufgaben wie Zusammenfassung, Übersetzung und Beantwortung von Fragen optimiert:

  • Amazon Titan Text G1 - Express

  • Amazon Titan Text G1 - Lite

  • Amazon Titan Text Premier

  • Cohere Command

  • Cohere Command Light

  • Meta Llama 3.1 8B Instruct

  • Meta Llama 3.1 70B Instruct

Die folgenden Konversationsmodelle sind für Single-Turn- und Multi-Turn-Interaktionen konzipiert. Wenn ein Modell die Converse-API verwendet, muss Ihr Datensatz zur Feinabstimmung dem Nachrichtenformat der Converse API entsprechen und System-, Benutzer- und Assistentennachrichten enthalten. Beispiele finden Sie unter Daten für die Feinabstimmung text-to-text von Modellen vorbereiten. Weitere Informationen zu den API-Vorgängen von Converse finden Sie unter. Führen Sie eine Konversation mit den Converse API-Operationen

  • Anthropisches Claude-3-Haiku

  • MetaLlama 3.2 1B Instruct(Converse API-Format)

  • MetaLlama 3.2 3B Instruct(Converse API-Format)

  • MetaLlama 3.2 11B InstructVision (Converse API-Format)

  • MetaLlama 3.2 90B InstructVision (Converse API-Format)

Text-Image-to-Text und Text-to-Image Modell s

Die folgenden Modelle unterstützen die Feinabstimmung für die Bilderzeugung und Text-Bildverarbeitung. Diese Modelle verarbeiten oder generieren Bilder auf der Grundlage von Texteingaben oder generieren Text, der sowohl auf Text- als auch auf Bildeingaben basiert. Informationen zur Vorbereitung von Daten für die Feinabstimmung Text-Image-to-Text und zur Modellierung von Text-to-Image Modellen finden Sie unter. Daten für die Feinabstimmung von Bild- und Textverarbeitungsmodellen vorbereiten

  • Amazon Titan Image Generator G1 V1

  • MetaLlama 3.2 11B InstructSehvermögen

  • MetaLlama 3.2 90B InstructVision

Von Bild zu Einbettung

Die folgenden Modelle unterstützen die Feinabstimmung für Aufgaben wie Klassifizierung und Abruf. Diese Modelle erzeugen numerische Repräsentationen (Einbettungen) aus Bildeingaben. Hinweise zur Vorbereitung von Daten für die Feinabstimmung von Image-to-Embeddings Modellen finden Sie unter. Bereiten Sie Daten für die Feinabstimmung der Bilderzeugung und das Einbetten von Modellen vor

  • Amazon Titan Multimodal Embeddings G1

  • Amazon Titan Image Generator G1 V1

Fortsetzung der Vorschulung: Text-to-Text

Die folgenden Modelle können für eine fortgesetzte Vorschulung verwendet werden. Diese Modelle unterstützen die kontinuierliche Vorschulung mit domänenspezifischen Daten, um ihr Basiswissen zu erweitern. Informationen zur Vorbereitung von Daten für das Continued Pre-Training for Text-to-Text Models finden Sie unter. Bereiten Sie Datensätze für die weitere Vorbereitung vor dem Training vor

  • Amazon Titan Text G1 - Express

  • Amazon Titan Text G1 - Lite