

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Regressions- oder Klassifizierungsjobs für Tabellendaten mithilfe der AutoML-API erstellen
<a name="autopilot-automate-model-development-create-experiment"></a>

Sie können programmatisch einen Autopilot-Regressions- oder -Klassifikationsjob für tabellarische Daten erstellen, indem Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html)API-Aktion in einer beliebigen Sprache aufrufen, die von Autopilot oder AWS CLI unterstützt wird. Weiter unten finden Sie eine Sammlung von obligatorischen und optionalen Eingabeanforderungsparametern für die API-Aktion `CreateAutoMLJobV2`. Sie finden die alternativen Informationen für die vorangegangene Version dieser Aktion, `CreateAutoMLJob`. Wir empfehlen jedoch, `CreateAutoMLJobV2` zu verwenden. 

Informationen darüber, wie diese API-Aktion in eine Funktion in der Sprache Ihrer Wahl übersetzt wird, finden Sie im Abschnitt [Siehe auch](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#API_CreateAutoMLJobV2_SeeAlso) von `CreateAutoMLJobV2` und wählen Sie ein SDK aus. Als Beispiel für Python-Benutzer finden Sie die vollständige Anforderungssyntax von `[create\$1auto\$1ml\$1job\$1v2](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_auto_ml_job_v2)` in AWS SDK für Python (Boto3).

**Anmerkung**  
[CreateAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html) und [DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html) sind neue Versionen von [CreateAutoMLJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html)und bieten [DescribeAutoMLJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJob.html)Abwärtskompatibilität.  
Wir empfehlen die Verwendung des `CreateAutoMLJobV2`. `CreateAutoMLJobV2` kann tabellarische Aufgabentypen bearbeiten, die mit denen der Vorgängerversion `CreateAutoMLJob` identisch sind, sowie nicht-tabellarische Aufgabentypen wie Bild- oder Textklassifizierung oder Zeitreihenprognosen.

Bei allen Experimenten mit tabellarischen Daten müssen mindestens der Name des Experiments, die Speicherorte für die Eingabe- und Ausgabedaten sowie die zu prognostizierenden Zieldaten angegeben werden. Optional können Sie auch die Art von Problem angeben, die Sie lösen möchten (Regression, Klassifizierung, Mehrklassen-Klassifizierung), Ihre Modellierungsstrategie wählen (*gestapelte Ensembles* oder *Hyperparameter-Optimierung*), die Liste der Algorithmen auswählen, die vom Autopilot-Job zum Trainieren der Daten verwendet werden u.v.m. 

 Nach der Ausführung des Experiments können Sie Versuche vergleichen und sich mit den Einzelheiten der Vorverarbeitungsschritte, Algorithmen und Hyperparameterbereiche der einzelnen Modelle befassen. [Sie haben auch die Möglichkeit, die [Erklärbarkeits-](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-explainability.html) und Leistungsberichte dazu herunterzuladen.](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-model-insights.html) Verwenden Sie die mitgelieferten [ Notebooks](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-automate-model-development-notebook-output.html ), um sich die Ergebnisse der automatisierten Datenexploration oder die Definitionen der Kandidatenmodelle anzusehen.

Hier finden Sie Richtlinien zur Migration eines `CreateAutoMLJob` nach `CreateAutoMLJobV2` in [Migrieren Sie a auf V2 CreateAuto MLJob CreateAuto MLJob](#autopilot-create-experiment-api-migrate-v1-v2).

## Erforderliche Parameter
<a name="autopilot-create-experiment-api-required-params"></a>

------
#### [ CreateAutoMLJobV2 ]

Wenn Sie `[CreateAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html)` aufrufen, um ein Autopilot-Experiment für tabellarische Daten zu erstellen, müssen Sie die folgenden Werte angeben:
+ Eine `[AutoMLJobName](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#API_CreateAutoMLJobV2_RequestSyntax)`, um den Namen Ihres Jobs anzugeben.
+ Mindestens eine `[AutoMLJobChannel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobChannel.html)` in `[AutoMLJobInputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLJobInputDataConfig)` zur Angabe Ihrer Datenquelle.
+ Sowohl eine `[AutoMLJobObjective](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLJobObjective)`-Metrik als auch der von Ihnen gewählte Aufgabentyp für überwachtes Lernen (binäre Klassifikation, Mehrklassen-Klassifizierung, Regression) in `AutoMLProblemTypeConfig`, oder gar keiner. Für tabellarische Daten müssen Sie `[TabularJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)` als Typ für `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)` wählen. Sie legen die Aufgabe für überwachtes Lernen im `ProblemType` Attribut von `TabularJobConfig` fest.
+ Eine `[OutputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLOutputDataConfig.html)` zur Angabe des Ausgabepfades in Amazon S3 zum Speichern der Artefakte Ihres AutoML-Jobs.
+ Ein `[RoleArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-RoleArn)`, zur Angabe der ARN der Rolle, die für den Zugriff auf Ihre Daten verwendet wird.

------
#### [ CreateAutoMLJob ]

Wenn Sie `[CreateAutoMLJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html)` aufrufen, um ein AutoML-Experiment zu erstellen, müssen Sie die folgenden vier Werte angeben:
+ Eine `[AutoMLJobName](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-AutoMLJobName)`, um den Namen Ihres Jobs anzugeben.
+ Mindestens eine `[AutoMLChannel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLChannel.html)` in `[InputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-InputDataConfig)` zur Angabe Ihrer Datenquelle.
+ Einen `[OutputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLOutputDataConfig.html)` zur Angabe des Ausgabepfades in Amazon S3 zum Speichern der Artefakte Ihres AutoML-Jobs.
+ Ein `[RoleArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-RoleArn)`, zur Angabe der ARN der Rolle, die für den Zugriff auf Ihre Daten verwendet wird.

------

Alle anderen Parameter sind optional.

## Optionale Parameter
<a name="autopilot-create-experiment-api-optional-params"></a>

Die folgenden Abschnitte enthalten Einzelheiten zu einigen optionalen Parametern, die Sie an Ihre `CreateAutoMLJobV2` API-Aktion übergeben können, wenn Sie Tabellendaten verwenden. Sie finden die alternativen Informationen für die Vorgängerversion dieser Aktion, `CreateAutoMLJob`. Wir empfehlen jedoch, `CreateAutoMLJobV2` zu verwenden.

### So stellen Sie die Trainingsweise eines AutoML-Jobs ein
<a name="autopilot-set-training-mode"></a>

Bei tabellarischen Daten hängt es von Ihrer Modellierungsstrategie (`ENSEMBLING` oder `HYPERPARAMETER_TUNING`) ab, welche Algorithmen anhand Ihrer Daten ausgeführt werden, um Ihre Modellkandidaten zu trainieren. Im Folgenden wird beschrieben, wie diese Trainingsweise eingestellt wird.

Wenn Sie das Feld leer lassen (oder`null`), wird das `Mode` aus der Größe Ihres Datensatzes abgeleitet.

Informationen zu den Trainingsmethoden für *gestapelte Ensembles* und *Hyperparameter-Optimierung* von Autopilot finden Sie unter [Trainingsweisen und Unterstützung von Algorithmen](autopilot-model-support-validation.md)

------
#### [ CreateAutoMLJobV2 ]

Für tabellarische Daten müssen Sie `[TabularJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)` als Typ für `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)` wählen.

Sie können die [Trainingsmethode](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-model-support-validation.html) eines AutoML-Jobs V2 mit dem `[TabularJobConfig.Mode](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)`-Parameter festlegen.

------
#### [ CreateAutoMLJob ]

Sie können die [Trainingsmethode](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-model-support-validation.html) eines AutoML-Jobs mit dem `[AutoMLJobConfig.Mode](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobConfig.html#sagemaker-Type-AutoMLJobConfig-Mode)`-Parameter festlegen.

------

### So wählen Sie Features und Algorithmen für das Training eines AutoML-Jobs aus
<a name="autopilot-feature-selection"></a>

#### Auswahl der Features
<a name="autopilot-automl-job-feature-selection-api"></a>

Autopilot bietet automatische Schritte zur Datenvorverarbeitung, einschließlich der Auswahl und Extraktion der Features. Sie können die Features, die im Training verwendet werden sollen, mit dem Attribut `FeatureSpecificatioS3Uri` aber auch manuell angeben.

Ausgewählte Features sollten in einer JSON-Datei im folgenden Format enthalten sein:

```
{ "FeatureAttributeNames":["col1", "col2", ...] }
```

Bei den Werten in `["col1", "col2", ...]` wird die Groß-/Kleinschreibung berücksichtigt. Es sollte sich dabei um eine Liste von Zeichenfolgen handeln, die eindeutige Werte enthalten, bei denen es sich um Teilmengen der Spaltennamen in den Eingabedaten handelt.

**Anmerkung**  
Die Liste der als Features bereitgestellten Spalten darf die Zielspalte nicht enthalten.

------
#### [ CreateAutoMLJobV2 ]

Für tabellarische Daten müssen Sie `[TabularJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)` als Typ für `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)` wählen.

Sie können die URL zu den ausgewählten Features mit dem `[TabularJobConfig.FeatureSpecificationS3Uri](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)`-Parameter festlegen.

------
#### [ CreateAutoMLJob ]

Sie können das `FeatureSpecificatioS3Uri` [Auto-Attribut MLCandidate GenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidateGenerationConfig.html) innerhalb der [CreateAutoMLJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html)API mit dem folgenden Format festlegen:

```
{
    "[AutoMLJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-AutoMLJobConfig)": {
        "[CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobConfig.html#sagemaker-Type-AutoMLJobConfig-CandidateGenerationConfig)": {
            "[FeatureSpecificationS3Uri](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidateGenerationConfig.html#sagemaker-Type-AutoMLCandidateGenerationConfig-FeatureSpecificationS3Uri)":"string"
            },
       }
  }
```

------

#### Auswahl der Algorithmen
<a name="autopilot-automl-job-algorithms-selection-api"></a>

Ihr Autopilot-Job führt standardmäßig eine vordefinierte Liste von Algorithmen an Ihrem Datensatz aus, um Modellkandidaten zu trainieren. Die Liste der Algorithmen hängt von der Trainingsweise (`ENSEMBLING` oder `HYPERPARAMETER_TUNING`) ab, die vom Job verwendet wird.

Sie können eine Teilmenge der Standardauswahl an Algorithmen angeben.

------
#### [ CreateAutoMLJobV2 ]

Für tabellarische Daten müssen Sie `[TabularJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)` als Typ für `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)` wählen.

Sie können ein Array von ausgewählten `AutoMLAlgorithms` im `AlgorithmsConfig` Attribut von angeben [CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateGenerationConfig.html).

Das Folgende ist ein Beispiel für ein `AlgorithmsConfig`-Attribut, das genau drei Algorithmen („xgboost“, „fastai“, „catboost“) in seinem `AutoMLAlgorithms`-Feld für die Trainingsweise „Ensembling“ auflistet.

```
{
   "[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)": {
        "[TabularJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)": {
          "[Mode](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)": "ENSEMBLING",
          "[CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateGenerationConfig.html)": {
            "[AlgorithmsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateGenerationConfig.html#sagemaker-Type-CandidateGenerationConfig-AlgorithmsConfig)":[
               {"[AutoMLAlgorithms](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLAlgorithmConfig.html)":["xgboost", "fastai", "catboost"]}
            ]
         },
       },
     },
  }
```

------
#### [ CreateAutoMLJob ]

Sie können ein Array von selected `AutoMLAlgorithms` im `AlgorithmsConfig` Attribut [Auto](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidateGenerationConfig.html) angeben MLCandidateGenerationConfig.

Das Folgende ist ein Beispiel für ein `AlgorithmsConfig`-Attribut, das genau drei Algorithmen („xgboost“, „fastai“, „catboost“) in seinem `AutoMLAlgorithms`-Feld für die Trainingsweise „Ensembling“ auflistet.

```
{
   "[AutoMLJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-AutoMLJobConfig)": {
        "[CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobConfig.html#sagemaker-Type-AutoMLJobConfig-CandidateGenerationConfig)": {
            "[AlgorithmsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidateGenerationConfig.html#sagemaker-Type-AutoMLCandidateGenerationConfig-AlgorithmsConfig)":[
               {"[AutoMLAlgorithms](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLAlgorithmConfig.html#sagemaker-Type-AutoMLAlgorithmConfig-AutoMLAlgorithms)":["xgboost", "fastai", "catboost"]}
            ]
         },
     "Mode": "ENSEMBLING" 
  }
```

------

Eine Liste der verfügbaren Algorithmen je Training `Mode` finden Sie unter [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLAlgorithmConfig.html#sagemaker-Type-AutoMLAlgorithmConfig-AutoMLAlgorithms](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLAlgorithmConfig.html#sagemaker-Type-AutoMLAlgorithmConfig-AutoMLAlgorithms). Einzelheiten zu den einzelnen Algorithmen finden Sie unter [Trainingsweisen und Unterstützung von Algorithmen](autopilot-model-support-validation.md).

### So geben Sie die Trainings- und Validierungsdatensätze eines AutoML-Jobs an
<a name="autopilot-data-sources-training-or-validation"></a>

Sie können Ihren eigenen Validierungsdatensatz und ein benutzerdefiniertes Datenteilungsverhältnis angeben oder den Datensatz automatisch von Autopilot teilen lassen.

------
#### [ CreateAutoMLJobV2 ]

Jedes [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobChannel.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobChannel.html)Objekt (siehe der erforderliche Parameter [Auto MLJob InputDataConfig](https://docs.aws.amazon.com/sagemaker-api/src/AWSSageMakerAPIDoc/build/server-root/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLJobInputDataConfig)) hat einen Wert`ChannelType`, der entweder auf `training` oder auf `validation` Werte gesetzt werden kann, die angeben, wie die Daten beim Erstellen eines Modells für maschinelles Lernen verwendet werden sollen. Es muss mindestens eine Datenquelle bereitgestellt werden, und es sind maximal zwei Datenquellen zulässig: eine für Trainingsdaten und eine für Validierungsdaten.

Wie Sie die Daten in Trainings- und Validierungsdatensätze aufteilen, hängt davon ab, ob Sie über eine oder zwei Datenquellen verfügen.
+ Wenn Sie nur über **eine Datenquelle** verfügen, wird die `ChannelType` standardmäßig auf `training` eingestellt und muss diesen Wert haben.
  + Wenn der Wert `ValidationFraction` in [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLDataSplitConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLDataSplitConfig.html) nicht festgelegt ist, werden standardmäßig 0,2 (20%) der Daten aus dieser Quelle für die Validierung verwendet. 
  + Wenn für `ValidationFraction` ein Wert zwischen 0 und 1 festgelegt wird, wird der Datensatz anhand des angegebenen Wertes aufgeteilt. Dabei gibt der Wert den Anteil des Datensatzes an, der für die Validierung verwendet wird.
+ Wenn Sie über **zwei Datenquellen** verfügen, muss der `ChannelType` für eines der `AutoMLJobChannel` Objekte auf `training` gesetzt werden, den Standardwert. Der `ChannelType` der anderen Datenquelle muss auf `validation` gesetzt werden. Die beiden Datenquellen müssen dasselbe Format haben, entweder CSV oder Parquet, und dasselbe Schema. In diesem Fall dürfen Sie den Wert für `ValidationFraction` nicht festlegen, da alle Daten aus jeder Quelle entweder für das Training oder für die Validierung verwendet werden. Das Einstellen dieses Werts verursacht einen Fehler.

------
#### [ CreateAutoMLJob ]

Jedes [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLChannel.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLChannel.html)Objekt (siehe erforderlicher Parameter [InputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-InputDataConfig)) hat einen`ChannelType`, der entweder auf `validation` Werte `training` oder gesetzt werden kann, die angeben, wie die Daten bei der Erstellung eines Modells für maschinelles Lernen verwendet werden sollen. Es muss mindestens eine Datenquelle bereitgestellt werden, und es sind maximal zwei Datenquellen zulässig: eine für Trainingsdaten und eine für Validierungsdaten.

Wie Sie die Daten in Trainings- und Validierungsdatensätze aufteilen, hängt davon ab, ob Sie über eine oder zwei Datenquellen verfügen.
+ Wenn Sie nur über **eine Datenquelle** verfügen, wird die `ChannelType` standardmäßig auf `training` eingestellt und muss diesen Wert haben.
  + Wenn der Wert `ValidationFraction` in [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLDataSplitConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLDataSplitConfig.html) nicht festgelegt ist, werden standardmäßig 0,2 (20%) der Daten aus dieser Quelle für die Validierung verwendet. 
  + Wenn für `ValidationFraction` ein Wert zwischen 0 und 1 festgelegt wird, wird der Datensatz anhand des angegebenen Wertes aufgeteilt. Dabei gibt der Wert den Anteil des Datensatzes an, der für die Validierung verwendet wird.
+ Wenn Sie über **zwei Datenquellen** verfügen, muss der `ChannelType` für eines der `AutoMLChannel` Objekte auf `training` gesetzt werden, den Standardwert. Der `ChannelType` der anderen Datenquelle muss auf `validation` gesetzt werden. Die beiden Datenquellen müssen dasselbe Format haben, entweder CSV oder Parquet, und dasselbe Schema. In diesem Fall dürfen Sie den Wert für `ValidationFraction` nicht festlegen, da alle Daten aus jeder Quelle entweder für das Training oder für die Validierung verwendet werden. Wenn dieser Wert festgelegt wird, verursacht dies einen Fehler.

------

Informationen zur Aufteilung und Quervalidierung in Autopilot finden Sie unter [Kreuzvalidierung im Autopilot](autopilot-metrics-validation.md#autopilot-cross-validation).

### So legen Sie den Aufgabentyp eines AutoML-Jobs fest
<a name="autopilot-set-problem-type-api"></a>

------
#### [ CreateAutoMLJobV2 ]

Für tabellarische Daten müssen Sie `[TabularJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)` als Typ für `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)` wählen.

Mit dem Parameter `[TabularJobConfig.ProblemType](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)` können Sie den Aufgabentyp für überwachtes Lernen (binäre Klassifikation, Mehrklassen-Klassifizierung, Regression) näher bezeichnen, das für die Modellkandidaten Ihres AutoML-Jobs V2 zur Verfügung steht.

------
#### [ CreateAutoMLJob ]

Sie können den [Aufgabentyp](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-datasets-problem-types.html#autopilot-problem-types) eines AutoML-Jobs mit dem Parameter `[CreateAutoPilot.ProblemType](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-ProblemType)` festlegen. Dies begrenzt die Art der Vorverarbeitung und der verwendeten Algorithmen, die Autopilot ausprobiert. Wenn Sie bei Abschluss des Auftrags den `[CreateAutoPilot.ProblemType](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-ProblemType)` festgelegt hatten, dann stimmt der `[ResolvedAttribute.ProblemType](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ResolvedAttributes.html)` mit dem von Ihnen eingestellten `ProblemType` überein. Wenn Sie das Feld leer lassen (oder`null`), wird der `ProblemType` für Sie abgeleitet. 

------

**Anmerkung**  
In manchen Fällen kann Autopilot `ProblemType` nicht mit ausreichender Sicherheit ableiten. In diesem Fall müssen Sie den Wert angeben, damit der Auftrag erfolgreich ist.

### So fügen Sie Stichprobengewichtungen zu einem AutoML-Job hinzu
<a name="autopilot-add-sample-weights-api"></a>

Sie können zu Ihrem tabellarischen Datensatz eine Spalte mit Stichprobengewichtungen hinzufügen und sie dann an Ihren AutoML-Job übergeben, um anzufordern, dass Datensatzzeilen während des Trainings und der Auswertung gewichtet werden.

Der Support für Stichprobengewichtungen steht nur im [Ensembling-Modus](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-model-support-validation.html#autopilot-training-mode) zur Verfügung. Ihre Gewichtungen sollten numerisch und dürfen nicht negativ sein. Datenpunkte mit ungültigem oder keinem Gewichtungswert sind ausgeschlossen. Weitere Informationen zu den verfügbaren Kennzahlen finden Sie unter [Gewichtete Metriken mit Autopilot](autopilot-metrics-validation.md#autopilot-weighted-metrics).

------
#### [ CreateAutoMLJobV2 ]

Für tabellarische Daten müssen Sie `[TabularJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TabularJobConfig.html)` als Typ für `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)` wählen.

Um die Stichprobengewichte bei der Erstellung eines Experiments festzulegen (siehe [CreateAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html)), können Sie den Namen Ihrer Spalte mit den Stichprobengewichten im `SampleWeightAttributeName` Attribut des `TabularJobConfig` Objekts angeben. Damit ist sichergestellt, dass Ihre objektive Kennzahl die Gewichtungen für das Training, die Bewertung und die Auswahl von Modellkandidaten verwendet.

------
#### [ CreateAutoMLJob ]

Um die Probengewichte bei der Erstellung eines Experiments festzulegen (siehe [CreateAutoMLJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html)), können Sie den Namen Ihrer Spalte mit den Stichprobengewichten im `SampleWeightAttributeName` Attribut des [MLChannelAuto-Objekts](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLChannel.html) angeben. Damit ist sichergestellt, dass Ihre objektive Kennzahl die Gewichtungen für das Training, die Bewertung und die Auswahl von Modellkandidaten verwendet.

------

### So konfigurieren Sie AutoML, um einen Remote-Job auf EMR Serverless für große Datensätze zu initiieren
<a name="autopilot-set-emr-serverless-api-tabular"></a>

Sie können Ihren AutoML-Job V2 so konfigurieren, dass er automatisch einen Remote-Job auf Amazon EMR Serverless initiiert, wenn zusätzliche Rechenressourcen für die Verarbeitung großer Datensätze benötigt werden. Durch die nahtlose Umstellung auf EMR Serverless, sofern erforderlich, kann der AutoML-Job Datensätze verarbeiten, die andernfalls die ursprünglich bereitgestellten Ressourcen übersteigen würden, ohne dass Sie manuell eingreifen müssen. EMR Serverless ist für die Problemtypen Tabellen und Zeitreihen verfügbar. Wir empfehlen, diese Option für tabellarische Datensätze mit mehr als 5 GB einzurichten.

Damit Ihr AutoML-Job V2 für große Datenmengen automatisch auf EMR Serverless umgestellt werden kann, müssen Sie der `AutoMLComputeConfig` der Eingabeaufforderung für AutoML-Job V2 ein `EmrServerlessComputeConfig`-Objekt bereitstellen, das ein `ExecutionRoleARN`-Feld enthält.

Der `ExecutionRoleARN` ist der ARN der IAM-Rolle, der dem AutoML-Job V2 die erforderlichen Berechtigungen zum Ausführen von EMR-Serverless-Jobs gewährt.

Diese Rolle sollte die folgende Vertrauensbeziehung haben:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "Service": "emr-serverless.amazonaws.com"
            },
            "Action": "sts:AssumeRole"
        }
    ]
}
```

------

Und gewähren Sie die Berechtigungen zum:
+ Erstellen, Auflisten und Aktualisieren von EMR-Serverless-Anwendungen.
+ Starten, Auflisten, Abrufen oder Abbrechen von Jobausführungen in einer EMR-Serverless-Anwendung.
+ Taggen von EMR-Serverless-Ressourcen.
+ Übergeben einer IAM-Rolle zur Ausführung an den EMR-Serverless-Service.

  Durch Erteilung der `iam:PassRole`-Berechtigung kann der AutoML-Job V2 vorübergehend die Rolle `EMRServerlessRuntimeRole-*` übernehmen und sie an den EMR-Serverless-Service übergeben. Dies sind die IAM-Rollen, die von den EMR Serverless Job Execution Environments verwendet werden, um auf andere AWS Dienste und Ressourcen zuzugreifen, die während der Laufzeit benötigt werden, wie Amazon S3 für den Datenzugriff, CloudWatch für die Protokollierung, den Zugriff auf den AWS Glue Datenkatalog oder andere Dienste, die Ihren Workload-Anforderungen entsprechen.

  Einzelheiten zu diesen Rollenberechtigungen finden Sie unter [Joblaufzeitrollen für Amazon EMR Serverless](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/security-iam-runtime-role.html).

Die im bereitgestellten JSON-Dokument definierte IAM-Richtlinie gewährt diese Berechtigungen:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [{
            "Sid": "EMRServerlessCreateApplicationOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:CreateApplication",
            "Resource": "arn:aws:emr-serverless:*:*:/*",
            "Condition": {
                "StringEquals": {
                    "aws:RequestTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessListApplicationOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:ListApplications",
            "Resource": "arn:aws:emr-serverless:*:*:/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessApplicationOperations",
            "Effect": "Allow",
            "Action": [
                "emr-serverless:UpdateApplication",
                "emr-serverless:GetApplication"
            ],
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessStartJobRunOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:StartJobRun",
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*",
            "Condition": {
                "StringEquals": {
                    "aws:RequestTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessListJobRunOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:ListJobRuns",
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessJobRunOperations",
            "Effect": "Allow",
            "Action": [
                "emr-serverless:GetJobRun",
                "emr-serverless:CancelJobRun"
            ],
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*/jobruns/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessTagResourceOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:TagResource",
            "Resource": "arn:aws:emr-serverless:*:*:/*",
            "Condition": {
                "StringEquals": {
                    "aws:RequestTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "IAMPassOperationForEMRServerless",
            "Effect": "Allow",
            "Action": "iam:PassRole",
            "Resource": "arn:aws:iam::*:role/EMRServerlessRuntimeRole-*",
            "Condition": {
                "StringEquals": {
                    "iam:PassedToService": "emr-serverless.amazonaws.com",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
         }
    ]
}
```

------

## Migrieren Sie a auf V2 CreateAuto MLJob CreateAuto MLJob
<a name="autopilot-create-experiment-api-migrate-v1-v2"></a>

Wir empfehlen Benutzern von `CreateAutoMLJob` nach `CreateAutoMLJobV2` zu migrieren.

In diesem Abschnitt werden die Unterschiede in den Eingabeparametern zwischen [CreateAutoMLJob](https://docs.aws.amazon.com/sagemaker-api/src/AWSSageMakerAPIDoc/build/server-root/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#API_CreateAutoMLJob_RequestSyntax)und [CreateAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#API_CreateAutoMLJobV2_RequestSyntax) erläutert, indem die Änderungen an der Position, dem Namen oder der Struktur der Objekte und Attribute der Eingabeanforderung zwischen den beiden Versionen hervorgehoben werden.
+ **Fordern Sie Attribute an, die sich von einer Version zur nächsten nicht geändert haben.**

  ```
  {
     "AutoMLJobName": "string",
     "AutoMLJobObjective": { 
        "MetricName": "string"
     },
     "ModelDeployConfig": { 
        "AutoGenerateEndpointName": boolean,
        "EndpointName": "string"
     },
     "OutputDataConfig": { 
        "KmsKeyId": "string",
        "S3OutputPath": "string"
     },
     "RoleArn": "string",
     "Tags": [ 
        { 
           "Key": "string",
           "Value": "string"
        }
     ]
  }
  ```
+ **Fordern Sie Attribute an, die von einer Version zur nächsten Position und Struktur geändert haben.**

  Die folgenden Attribute haben ihre Position geändert: `DataSplitConfig`, `Security Config`, `CompletionCriteria`, `Mode`, `FeatureSpecificationS3Uri`, `SampleWeightAttributeName`, `TargetAttributeName`.

------
#### [ CreateAutoMLJob ]

  ```
  { 
      "AutoMLJobConfig": { 
          "Mode": "string",
          "CompletionCriteria": { 
              "MaxAutoMLJobRuntimeInSeconds": number,
              "MaxCandidates": number,
              "MaxRuntimePerTrainingJobInSeconds": number
          },
          "DataSplitConfig": { 
              "ValidationFraction": number
          },
          "SecurityConfig": { 
              "EnableInterContainerTrafficEncryption": boolean,
              "VolumeKmsKeyId": "string",
              "VpcConfig": { 
              "SecurityGroupIds": [ "string" ],
              "Subnets": [ "string" ]
              }
          },
          "CandidateGenerationConfig": { 
              "FeatureSpecificationS3Uri": "string"
          }
      },
      "GenerateCandidateDefinitionsOnly": boolean,
      "ProblemType": "string"
  }
  ```

------
#### [ CreateAutoMLJobV2 ]

  ```
  {       
      "AutoMLProblemTypeConfig": {
          "TabularJobConfig": {
              "Mode": "string",
              "ProblemType": "string",
              "GenerateCandidateDefinitionsOnly": boolean,
              "CompletionCriteria": { 
                  "MaxAutoMLJobRuntimeInSeconds": number,
                  "MaxCandidates": number,
                  "MaxRuntimePerTrainingJobInSeconds": number
              },
              "FeatureSpecificationS3Uri": "string",
              "SampleWeightAttributeName": "string",
              "TargetAttributeName": "string"
          }
      },
      "DataSplitConfig": { 
          "ValidationFraction": number
      },
      "SecurityConfig": { 
          "EnableInterContainerTrafficEncryption": boolean,
          "VolumeKmsKeyId": "string",
          "VpcConfig": { 
              "SecurityGroupIds": [ "string" ],
              "Subnets": [ "string" ]
          }
      }
  }
  ```

------
+ **Die folgenden Attribute haben von einer Versionen zur nächsten Position und Struktur geändert.**

  Die folgende JSON-Datei veranschaulicht, wie [Auto MLJob Config funktioniert. CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobConfig.html#sagemaker-Type-AutoMLJobConfig-CandidateGenerationConfig)vom Typ [Auto MLCandidate GenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidateGenerationConfig.html) wurde zu [Auto verschoben MLProblemTypeConfig. TabularJobConfig. CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#API_CreateAutoMLJobV2_RequestSyntax)vom Typ [CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateGenerationConfig.html)V2.

------
#### [ CreateAutoMLJob ]

  ```
  {
     "AutoMLJobConfig": { 
        "CandidateGenerationConfig": { 
           "AlgorithmsConfig": [ 
              { 
                 "AutoMLAlgorithms": [ "string" ]
              }
           ],
           "FeatureSpecificationS3Uri": "string"
        }
  }
  ```

------
#### [ CreateAutoMLJobV2 ]

  ```
  {
      "AutoMLProblemTypeConfig": {
          "TabularJobConfig": {
              "CandidateGenerationConfig": { 
                  "AlgorithmsConfig": [ 
                      { 
                      "AutoMLAlgorithms": [ "string" ]
                      }
                  ],
              },
          }
      },
  }
  ```

------
+ **Fordern Sie Attribute an, die ihre Namen und ihre Struktur geändert haben.**

  Die folgende JSON-Datei veranschaulicht, wie [InputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-InputDataConfig)(Ein Array von [Auto MLChannel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLChannel.html)) in V2 zu [Auto MLJob InputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLJobInputDataConfig) (Ein Array von [Auto MLJob Channel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobChannel.html)) geändert wurde. Beachten Sie, dass die Attribute `SampleWeightAttributeName` und `TargetAttributeName` aus `InputDataConfig` nach `AutoMLProblemTypeConfig` umziehen.

------
#### [ CreateAutoMLJob ]

  ```
  {    
      "InputDataConfig": [ 
          { 
              "ChannelType": "string",
              "CompressionType": "string",
              "ContentType": "string",
              "DataSource": { 
                  "S3DataSource": { 
                      "S3DataType": "string",
                      "S3Uri": "string"
                  }
              },
              "SampleWeightAttributeName": "string",
              "TargetAttributeName": "string"
          }
      ]
  }
  ```

------
#### [ CreateAutoMLJobV2 ]

  ```
  {    
      "AutoMLJobInputDataConfig": [ 
          { 
              "ChannelType": "string",
              "CompressionType": "string",
              "ContentType": "string",
              "DataSource": { 
                  "S3DataSource": { 
                      "S3DataType": "string",
                      "S3Uri": "string"
                  }
              }
          }
      ]
  }
  ```

------