

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Fine-tune ein großes Sprachmodell (LLM) mit sofortigen Anweisungen
<a name="jumpstart-foundation-models-fine-tuning-instruction-based"></a>

Instruction-based Bei der Feinabstimmung werden beschriftete Beispiele verwendet, um die Leistung eines vorab trainierten Basismodells für eine bestimmte Aufgabe zu verbessern. Die gekennzeichneten Beispiele sind als Eingabeaufforderung und Antwortpaare formatiert und als Anweisungen formuliert. Durch diesen Feinabstimmungsprozess werden die Gewichtungen des Modells geändert. [Weitere Informationen zur unterrichtsbasierten Feinabstimmung finden Sie in den Artikeln [Einführung in FLAN: Generalisierbarere Sprachmodelle mit Instruktions- und Skalierungssprachenmodellen. Fine-Tuning](https://ai.googleblog.com/2021/10/introducing-flan-more-generalizable.html) Instruction-Finetuned ](https://arxiv.org/abs/2210.11416)

Fine-tuned LANguage Net (FLAN) -Modelle nutzen die Befehlsoptimierung, um Modelle für die Lösung allgemeiner nachgelagerter NLP-Aufgaben besser geeignet zu machen. Amazon SageMaker JumpStart bietet eine Reihe von Basismodellen in der FLAN-Modellfamilie an. Zum Beispiel werden die Anweisungen der FLAN-T5 Modelle auf eine Vielzahl von Aufgaben abgestimmt, um die Zero-shot-Leistung für eine Vielzahl gängiger Anwendungsfälle zu erhöhen. Mit zusätzlichen Daten und Feinabstimmungen können anweisungsbasierte Modelle weiter an spezifischere Aufgaben angepasst werden, die beim Vortraining nicht berücksichtigt wurden. 

So optimieren Sie ein LLM für eine bestimmte Aufgabe mithilfe von Anweisungen in Form von Prompt-Antwort-Paaren:

1. Bereiten Sie Ihre Anweisungen in JSON-Dateien vor. Weitere Informationen zum erforderlichen Format für die Dateien mit den Prompt-Antwort-Paaren und zur Struktur des Datenordners finden Sie unter [Vorbereiten und Hochladen von Trainingsdaten für die Optimierung mithilfe von Anweisungen](#jumpstart-foundation-models-fine-tuning-instruction-based-prepare-data).

1. Erstellen Sie Ihren Trainingsjob zur Optimierung. Detaillierte Anweisungen finden Sie unter [Erstellen eines Trainingsjobs zur Optimierung mithilfe von Anweisungen](#jumpstart-foundation-models-fine-tuning-instruction-based-train).

Umfassende Beispiele finden Sie unter [Beispiel-Notebooks](#jumpstart-foundation-models-fine-tuning-instruction-based-examples).

Nur ein Teil der Basismodelle ist mit der JumpStart anweisungsbasierten Feinabstimmung kompatibel. Instruction-based Die Feinabstimmung ist für die folgenden Foundation-Modelle verfügbar: 

**Anmerkung**  
Einige JumpStart Foundation-Modelle, wie Llama 2 7B, erfordern die Annahme einer Endbenutzer-Lizenzvereinbarung, bevor die Feinabstimmung vorgenommen und Inferenzen durchgeführt werden können. Weitere Informationen finden Sie unter [End-user Lizenzvereinbarungen](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula).
+ Flan-T5 Basis
+ Flan-T5 Groß
+ Flan-T5 Klein
+ Flan-T5 XL
+ Flan-T5 XXL
+ Llama 2 13B
+ Llama 2 13B Chat
+ Llama 2 13B Neuron
+ Llama 2 70B
+ Llama 2 70B Chat
+ Llama 2 7B
+ Llama 2 7B Chat
+ Llama 2 7B Neuron
+ Mistral 7B
+ RedPajama INCITE Basis 3B V1
+ RedPajama INCITE Basis 7B V1
+ RedPajama INCITE Chat 3B V1
+ RedPajama INCITE Chat 7B V1
+ RedPajama INCITE instruiere 3B V1
+ RedPajama INCITE, Instruktor 7B V1

## Vorbereiten und Hochladen von Trainingsdaten für die Optimierung mithilfe von Anweisungen
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-prepare-data"></a>

Trainingsdaten für die Optimierung mithilfe von Anweisungen müssen im Textdateiformat JSON Lines bereitgestellt werden, wobei jede Zeile ein Wörterbuch ist. Alle Trainingsdaten müssen sich in einem einzigen Ordner befinden. Der Ordner kann mehrere JSONL-Dateien enthalten. 

Der Trainingsordner kann auch eine JSON-Vorlagendatei (`template.json`) enthalten, die die Eingabe- und Ausgabeformate Ihrer Daten beschreibt. Wenn keine Vorlagendatei bereitgestellt wird, wird die folgende Vorlagendatei verwendet: 

```
{
  "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{context}",
  "completion": "{response}"
}
```

Gemäß der `template.json`-Datei muss jeder JSONL-Eintrag der Trainingsdaten die Felder `{instruction}`, `{context}` und `{response}` enthalten. 

Wenn Sie eine benutzerdefinierte JSON-Vorlagendatei bereitstellen, verwenden Sie die Tasten `"completion"` und `"prompt"`, um Ihre eigenen Pflichtfelder zu definieren. Gemäß der folgenden benutzerdefinierten JSON-Vorlagendatei muss jeder JSONL-Eintrag der Trainingsdaten die Felder `{question}`, `{context}` und `{answer}` enthalten:

```
{
  "prompt": "question: {question} context: {context}",
  "completion": "{answer}"
}
```

### Aufteilen von Daten zu Trainings- und Testzwecken
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-split-data"></a>

Sie können optional einen weiteren Ordner mit Validierungsdaten bereitstellen. Dieser Ordner sollte auch eine oder mehrere JSONL-Dateien enthalten. Wenn kein Validierungsdatensatz bereitgestellt wird, wird eine festgelegte Menge der Trainingsdaten für Validierungszwecke reserviert. Bei der Auswahl der Hyperparameter für die Optimierung Ihres Modells können Sie den Prozentsatz der für die Validierung verwendeten Trainingsdaten anpassen. 

### Hochladen von Optimierungsdaten in Amazon S3
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-upload-data"></a>

Laden Sie Ihre vorbereiteten Daten in Amazon Simple Storage Service (Amazon S3) hoch, um sie bei der Feinabstimmung eines JumpStart Basismodells zu verwenden. Sie können zum Hochladen Ihre Daten die folgenden Befehle verwenden:

```
from sagemaker.s3 import S3Uploader
import sagemaker
import random

output_bucket = sagemaker.Session().default_bucket()
local_data_file = {{"train.jsonl"}}
train_data_location = f{{"s3://{output_bucket}/dolly_dataset"}}
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"Training data: {train_data_location}")
```

## Erstellen eines Trainingsjobs zur Optimierung mithilfe von Anweisungen
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-train"></a>

Nachdem Ihre Daten auf Amazon S3 hochgeladen wurden, können Sie Ihr JumpStart Basismodell optimieren und bereitstellen. Informationen zur Optimierung Ihres Modells in Studio finden Sie unter [Fine-tune ein Modell in Studio](jumpstart-foundation-models-use-studio-updated-fine-tune.md). Informationen zur Feinabstimmung Ihres Modells mithilfe des SageMaker Python SDK finden Sie unter. [Fine-tune öffentlich zugängliche Foundation-Modelle mit der `JumpStartEstimator`Klasse](jumpstart-foundation-models-use-python-sdk-estimator-class.md)

## Beispiel-Notebooks
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-examples"></a>

Weitere Informationen zur Optimierung mithilfe von Anweisungen finden Sie in den folgenden Beispiel-Notebooks:
+ [Fine-tune Lama 2 Modelle auf JumpStart](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/llama-2-finetuning.html)
+ [Einführung in SageMaker JumpStart — Textgenerierung mit Mistral-Modellen](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/mistral-7b-instruction-domain-adaptation-finetuning.html)
+ [Einführung in SageMaker JumpStart — Textgenerierung mit Falcon-Modellen](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/falcon-7b-instruction-domain-adaptation-finetuning.html)
+ [SageMaker JumpStart Grundlegende Modelle - HuggingFace Text2Text-Anweisung Fine-Tuning](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/instruction-fine-tuning-flan-t5.html)