Amazon Forecast ist für Neukunden nicht mehr verfügbar. Bestehende Kunden von Amazon Forecast können den Service weiterhin wie gewohnt nutzen. [Erfahren Sie mehr“](https://aws.amazon.com/blogs/machine-learning/transition-your-amazon-forecast-usage-to-amazon-sagemaker-canvas/)

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Datensätze importieren
<a name="howitworks-datasets-groups"></a>

*Datasets* enthalten die Daten, die zum Trainieren eines [Predictors](howitworks-predictor.md) verwendet werden. Sie erstellen einen oder mehrere Amazon Forecast-Datensätze und importieren Ihre Trainingsdaten in diese. Eine *Datensatzgruppe* ist eine Sammlung ergänzender Datensätze, in denen eine Reihe sich ändernder Parameter im Laufe einer Reihe von Zeiträumen detailliert beschrieben wird. Nachdem Sie eine Dataset-Gruppe erstellt haben, verwenden Sie sie zum Schulen eines Predictors. 

Jede Dataset-Gruppe kann bis zu drei Datasets enthalten, eines von jedem [Dataset](#howitworks-dataset-domainstypes)-Typ: Ziel-Zeitreihen, verwandte Zeitreihen und Artikel-Metadaten.

Um Prognose-Datasets und Datensatzgruppen zu erstellen und zu verwalten, können Sie die Forecast-Konsole AWS Command Line Interface (AWS CLI) oder AWS das SDK verwenden.

Beispiele für Prognose-Datensätze finden Sie im [Amazon GitHub Forecast-Beispiel-Repository](https://github.com/aws-samples/amazon-forecast-samples).

**Topics**
+ [Datensätze](#howitworks-dataset)
+ [Dataset-Gruppen](#howitworks-datasetgroup)
+ [Beheben von Konflikten in der Häufigkeit der Datensammlung](#howitworks-data-alignment)
+ [Verwenden von Datasets verwandter Zeitreihen](related-time-series-datasets.md)
+ [Verwenden von Artikel-Metadaten-Datensätzen](item-metadata-datasets.md)
+ [Vordefinierte Dataset-Domänen und Dataset-Typen](howitworks-domains-ds-types.md)
+ [Aktualisieren von Daten](updating-data.md)
+ [Umgang mit fehlenden Werten](howitworks-missing-values.md)
+ [Datensatz-Richtlinien für Forecast](dataset-import-guidelines-troubleshooting.md)

## Datensätze
<a name="howitworks-dataset"></a>

Um Prognose-Datensätze zu erstellen und zu verwalten, können Sie die Forecast APIs einschließlich der [DescribeDataset](API_DescribeDataset.md) Operationen [CreateDataset](API_CreateDataset.md) und verwenden. Eine vollständige Liste der Forecast APIs finden Sie unter[API-Referenz](api-reference.md).

Beim Erstellen eines Datasets geben Sie u. a. folgende Informationen an:
+ Der frequency/interval Zeitpunkt, an dem Sie Ihre Daten aufgezeichnet haben. Sie können beispielsweise Einzelhandelsartikelverkäufe jede Woche aggregieren und aufzeichnen. In der [Erste Schritte](getting-started.md)-Übung verwenden Sie den durchschnittlich verbrauchten Strom pro Stunde.
+ Das Voraussageformat (die *Domäne*) und der Dataset-Typ (innerhalb der Domäne). Eine Datensatz-Domain gibt an, welche Art von Forecast du durchführen möchtest, während ein Datensatztyp dir dabei hilft, deine Trainingsdaten in prognosefreundliche Kategorien zu organisieren.
+ Das Dataset-*Schema* Ein Schema ordnet die Spaltenüberschriften Ihres Datasets zu. Wenn Sie beispielsweise die Nachfrage überwachen, haben Sie möglicherweise stündliche Daten über den Verkauf eines Artikels in mehreren Geschäften gesammelt. In diesem Fall würde Ihr Schema die Reihenfolge von links nach rechts definieren, in der Zeitstempel, Standort und Stundensatz in Ihrer Schulungsdatendatei angezeigt werden. Schemata definieren auch den Datentyp der einzelnen Spalten, z. B. `string` oder `integer`.
+ Informationen zur Geolokalisierung und Zeitzone. Das Geolocation-Attribut ist innerhalb des Schemas mit dem Attributtyp definiert. `geolocation` Zeitzoneninformationen werden mit dem [ CreateDatasetImportJob](API_CreateDatasetImportJob.md)Vorgang definiert. Sowohl Geolokalisierungs- als auch Zeitzonendaten müssen enthalten sein, um den [Wetterindex](weather.md) zu aktivieren.

Jede Spalte in Ihrem Prognose-Dataset stellt entweder eine *Prognosedimension* oder ein *Prognose-Feature* dar. Prognosedimensionen beschreiben die Aspekte Ihrer Daten, die sich im Laufe der Zeit nicht ändern, z. B. `store` oder `location` Prognosefunktionen enthalten alle Parameter in Ihren Daten, die im Laufe der Zeit variieren, z. B. `price` oder `promotion`. Einige Dimensionen, z. B. `timestamp` oder `itemId`, sind in Ziel-Zeitreihen-Datasets und Datasets verwandter Zeitreihen erforderlich.

### Dataset-Domänen und Dataset-Typen
<a name="howitworks-dataset-domainstypes"></a>

Wenn Sie einen Prognose-Datensatz erstellen, wählen Sie eine Domäne und einen Datensatztyp aus. Forecast bietet Domains für eine Reihe von Anwendungsfällen, z. B. für die Prognose der Einzelhandelsnachfrage oder des Web-Traffics. Sie können auch eine benutzerdefinierte Domäne erstellen. Eine vollständige Liste der Forecast-Domänen finden Sie unter[Vordefinierte Dataset-Domänen und Dataset-Typen](howitworks-domains-ds-types.md).

Innerhalb jeder Domain können Forecast-Benutzer die folgenden Arten von Datensätzen angeben:
+ Ziel-Zeitreihen-Datensatz (erforderlich) — Verwenden Sie diesen Datensatztyp, wenn es sich bei Ihren Trainingsdaten um Zeitreihen handelt *und* diese das Feld enthalten, für das Sie eine Prognose erstellen möchten. Dieses Feld wird als *Zielfeld* bezeichnet.
+ Verwandter Zeitreihendatensatz (optional) — Wählen Sie diesen Datensatztyp, wenn es sich bei Ihren Trainingsdaten um Zeitreihen handelt, diese aber das Zielfeld *nicht* enthalten. Wenn Sie beispielsweise eine Artikelnachfrage prognostizieren, kann ein Dataset verwandter Zeitreihen zwar über `price` aber nicht über `demand` als Feld verfügen.
+ Element-Metadaten-Datensatz (optional) — Wählen Sie diesen Datensatztyp, wenn es sich bei Ihren Trainingsdaten *nicht* um Zeitreihendaten handelt, sondern Metadateninformationen zu den Elementen in der Zielzeitreihe oder in verwandten Zeitreihendatensätzen enthalten. Wenn Sie beispielsweise die Artikelnachfrage prognostizieren, kann ein Datensatz mit Artikelmetadaten Dimensionen `color` oder `brand` als Dimensionen haben. 

  Forecast berücksichtigt nur die Daten, die von einem Elementmetadaten-Datensatztyp bereitgestellt werden, wenn Sie den [CNN-QR](aws-forecast-algo-cnnqr.md) - oder [DeePar\$1-Algorithmus](aws-forecast-recipe-deeparplus.md) verwenden.

  Artikel-Metadaten sind besonders nützlich in Kaltstart-Prognoseszenarien, in denen Sie über wenig direkte historische Daten, anhand derer Sie Vorhersagen treffen können, verfügen, aber über historische Daten über Artikel mit ähnlichen Metadaten-Attributen. Wenn Sie Elementmetadaten einbeziehen, erstellt Forecast Kaltstartprognosen auf der Grundlage ähnlicher Zeitreihen, wodurch genauere Prognosen erstellt werden können. 

Abhängig von den Informationen in Ihren Schulungsdaten und dem, was Sie prognostizieren möchten, können Sie mehr als ein Dataset erstellen. 

Angenommen, Sie möchten eine Prognose für die Nachfrage nach Einzelhandelsartikeln wie Schuhe, Socken usw. erstellen. Es bietet sich an, die folgenden Datasets in der RETAIL-Domäne zu erstellen:
+ Zielzeitreihen-Datensatz — Beinhaltet die historischen Zeitreihen-Nachfragedaten für die Einzelhandelsartikel (`item_id`,`timestamp`, und das Zielfeld). `demand` Da es das Zielfeld angibt, für das Sie eine Prognose erstellen möchten, müssen Sie mindestens ein Ziel-Zeitreihen-Dataset in einer Dataset-Gruppe haben.

  Sie können einem Ziel-Zeitreihen-Dataset auch bis zu zehn weitere Dimensionen hinzufügen. Wenn Sie nur ein Ziel-Zeitreihen-Dataset in Ihre Dataset-Gruppe aufnehmen, können Sie Prognosen entweder auf Artikelebene oder auf Prognosedimensionsebene erstellen. Weitere Informationen finden Sie unter [CreatePredictor](API_CreatePredictor.md).
+ Verwandter Zeitreihendatensatz — Enthält historische Zeitreihendaten mit Ausnahme des Zielfeldes, z. B. `price` oder. `revenue` Damit Daten verwandter Zeitreihen den Ziel-Zeitreihen-Daten zugeordnet werden können, muss jedes Dataset verwandter Zeitreihen die dieselben identifizierenden Felder enthalten. In der RETAIL-Domäne wären diese `item_id` und `timestamp`.

  Ein verwandtes Zeitreihen-Dataset kann Daten enthalten, die die Prognosen aus dem Zielzeitreihen-Dataset verfeinern. Sie können beispielsweise `price`-Daten in Ihr Dataset verwandter Zeitreihen für zukünftige Datumsangaben einschließen, für die Sie eine Prognose generieren möchten. Auf diese Weise kann Forecast Vorhersagen mit einer zusätzlichen Kontextdimension treffen. Weitere Informationen finden Sie unter [Verwenden von Datasets verwandter Zeitreihen](related-time-series-datasets.md).
+ Datensatz mit Artikelmetadaten — Beinhaltet Metadaten für Einzelhandelsartikel. Weitere Beispiele für Metadaten sind `brand`, `category`, `color` und `genre`.

**Beispiel-Dataset mit einer Prognosedimension**

Stellen Sie sich in Anlehnung an das vorherige Beispiel vor, dass Sie die Nachfrage nach Schuhen und Socken basierend auf den vorherigen Verkäufen in einem Geschäft prognostizieren möchten. Im folgenden Ziel-Zeitreihen-Dataset ist `store` eine Zeitreihen-Prognosedimension, während `demand` das Zielfeld ist. Socks werden in zwei Filialen (NYC und SFO) verkauft, und Schuhe werden nur in ORD verkauft.

Die ersten drei Zeilen dieser Tabelle enthalten die ersten verfügbaren Verkaufsdaten für die NYC-, SFO- und ORD-Filialen. Die letzten drei Zeilen enthalten die zuletzt aufgezeichneten Verkaufsdaten für jede Filiale. Die Zeile `...` stellt alle Artikelverkaufsdaten dar, die zwischen dem ersten und dem letzten Eintrag aufgezeichnet wurden.


| `timestamp` | `item_id` | `store` | `demand` | 
| --- | --- | --- | --- | 
| 2019-01-01 | socks | NYC |  25  | 
| 2019-01-05 | socks | SFO | 45 | 
| 2019-02-01 | shoes | ORD | 10 | 
| ... | 
| 2019-06-01 | socks | NYC | 100 | 
| 2019-06-05 | socks | SFO | 5 | 
| 2019-07-01 | shoes | ORD | 50 | 

### Dataset-Schema
<a name="howitworks-dataset-schema"></a>

Jedes Dataset erfordert ein Schema, d. h. eine vom Benutzer bereitgestellte JSON-Zuweisung der Felder in Ihren Schulungsdaten. Hier listen Sie sowohl die erforderlichen als auch die optionalen Dimensionen und Funktionen auf, die Sie in Ihr Dataset aufnehmen möchten.

Wenn Ihr Datensatz ein Geolocation-Attribut enthält, definieren Sie das Attribut innerhalb des Schemas mit dem Attributtyp. `geolocation` Weitere Informationen finden Sie unter [Geolocation-Informationen hinzufügen](weather.md#adding-geolocation). Um den [Wetterindex](weather.md) anwenden zu können, müssen Sie ein Geolocation-Attribut in Ihre Zielzeitreihe und alle zugehörigen Zeitreihendatensätze aufnehmen.

Einige Domänen haben optionale Dimensionen, die wir empfehlen, einzubeziehen. Optionale Dimensionen werden in den Beschreibungen der einzelnen Domänen weiter unten in dieser Anleitung aufgeführt. Ein Beispiel finden Sie unter [RETAIL-Domäne](retail-domain.md). Alle optionalen Dimensionen nehmen den Datentyp `string` an.

Für jedes Dataset ist ein Schema erforderlich. Im Folgenden finden Sie das zugehörige Schema für das obige Zielzeitreihen-Dataset.

```
{
     "attributes": [
        {
           "AttributeName": "timestamp",
           "AttributeType": "timestamp"
        },
        {
           "AttributeName": "item_id",
           "AttributeType": "string"
        },
        {
           "AttributeName": "store",
           "AttributeType": "string"
        },
        {
           "AttributeName": "demand",
           "AttributeType": "float"
        }
    ]
}
```

Wenn Sie Ihre Trainingsdaten in den Datensatz hochladen, der dieses Schema verwendet, geht Forecast davon aus, dass das `timestamp` `item_id` Feld Spalte 1, das `store` Feld Spalte 2, das Feld Spalte 3 und das `demand` Feld, das *Zielfeld*, Spalte 4 ist.

Für den Dataset-Typ der verwandte Zeitreihen müssen alle zugehörigen Funktionen den Attributtyp Gleitkommazahl oder Ganzzahl aufweisen. Für den Artikel-Metadaten-Dataset-Typ müssen alle Funktionen den Attributtyp Zeichenfolge haben. Weitere Informationen finden Sie unter [SchemaAttribute](API_SchemaAttribute.md).

**Anmerkung**  
Für jede Spalte im Datensatz ist ein `attributeName` `attributeType` Und-Paar erforderlich. Forecast reserviert eine Reihe von Namen, die nicht als Name eines Schemaattributs verwendet werden können. Die Liste der reservierten Namen finden Sie unter [Reservierte Feldnamen](reserved-field-names.md).

## Dataset-Gruppen
<a name="howitworks-datasetgroup"></a>

Eine *Dataset-Gruppe* ist eine Sammlung von einem bis drei verwandten Datasets, mit einem von jedem Dataset-Typ. Sie importieren Datasets in eine Dataset-Gruppe und verwenden dann die Dataset-Gruppe, um einen Predictor zu schulen.

Forecast umfasst die folgenden Operationen, um Datensatzgruppen zu erstellen und ihnen Datensätze hinzuzufügen:
+ [CreateDatasetGroup](API_CreateDatasetGroup.md)
+ [UpdateDatasetGroup](API_UpdateDatasetGroup.md)

## Beheben von Konflikten in der Häufigkeit der Datensammlung
<a name="howitworks-data-alignment"></a>

Forecast kann Prädiktoren mit Daten trainieren, die nicht mit der Datenhäufigkeit übereinstimmen, die Sie in der [CreateDataset](API_CreateDataset.md) Operation angeben. Sie können beispielsweise Daten importieren, die in stündlichen Intervallen aufgezeichnet wurden, obwohl einige der Daten zu Beginn der Stunde nicht mit einem Zeitstempel versehen sind (02:20, 02:45). Forecast verwendet die von Ihnen angegebene Datenfrequenz, um mehr über Ihre Daten zu erfahren. Anschließend aggregiert Forecast die Daten während des Prädiktortrainings. Weitere Informationen finden Sie unter [Datenaggregation für verschiedene Prognosefrequenzen](data-aggregation.md). 

# Verwenden von Datasets verwandter Zeitreihen
<a name="related-time-series-datasets"></a>

Ein Dataset verwandter Zeitreihen enthält Zeitreihendaten, die nicht in einem Ziel-Zeitreihen-Dataset enthalten sind und möglicherweise die Genauigkeit Ihres Predictors verbessern.

Im Bereich der Bedarfsprognosen würde ein Zielzeitreihendatensatz beispielsweise `item_id` Dimensionen `timestamp` und Dimensionen enthalten, während ein ergänzender verwandter Zeitreihendatensatz auch die folgenden zusätzlichen Funktionen enthält: `item price``promotion`, und. `weather`

Ein Dataset verwandter Zeitreihen kann bis zu 10 Prognosedimensionen (die gleichen in Ihrem Ziel-Zeitreihen-Dataset) und bis zu 13 zugehörige Zeitreihen-Funktionen enthalten.

**Python-Notizbücher**  
Eine step-by-step Anleitung zur Verwendung verwandter Zeitreihen-Datasets finden Sie unter [Integrieren verwandter](https://github.com/aws-samples/amazon-forecast-samples/blob/master/notebooks/advanced/Incorporating_Related_Time_Series_dataset_to_your_Predictor/Incorporating_Related_Time_Series_dataset_to_your_Predictor.ipynb) Zeitreihen.

**Topics**
+ [Historische und zukunftsgerichtete verwandte Zeitreihen](#related-time-series-historical-futurelooking)
+ [Validierung von Datasets verwandter Zeitreihen](#related-time-series-dataset-validation)
+ [Beispiel: Zukunftsorientierte, verwandte Zeitreihendatei](#related-time-series-example)
+ [Beispiel: Prognose der Granularität](#related-time-series-granularity)
+ [Ältere Prädiktoren und verwandte Zeitreihen](#related-time-series-legacy)

## Historische und zukunftsgerichtete verwandte Zeitreihen
<a name="related-time-series-historical-futurelooking"></a>

**Anmerkung**  
 Eine verwandte Zeitreihe, die alle Werte innerhalb des Prognosezeitraums enthält, wird als zukunftsgerichtete Zeitreihe behandelt. 

 Verwandte Zeitreihen gibt es in zwei Formen: 
+  **Historische Zeitreihen**: Zeitreihen *ohne* Datenpunkte innerhalb des Prognosehorizonts. 
+  **Zukunftsorientierte Zeitreihen**: Zeitreihen *mit* Datenpunkten innerhalb des Prognosehorizonts. 

Historische Bezugszeitreihen enthalten Datenpunkte bis zum Prognosehorizont und keine Datenpunkte innerhalb des Prognosehorizonts. Zeitreihen, die sich auf die Zukunft beziehen, enthalten Datenpunkte bis zum *und* innerhalb des Prognosezeitraums. 

![\[Time series graph showing target, forward-looking, and historical related data with forecast window.\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/short-long-rts.png)


## Validierung von Datasets verwandter Zeitreihen
<a name="related-time-series-dataset-validation"></a>

Für ein Dataset verwandter Zeitreihen gelten die folgenden Einschränkungen:
+ Es darf nicht den Zielwert aus den Ziel-Zeitreihen enthalten.
+ Es muss die Dimensionen `item_id` und `timestamp` und mindestens ein verwandtes Feature (z. B. `price`) enthalten.
+ Funktionsdaten verwandter Zeitreihen müssen vom Datentyp `int` oder `float` sein.
+ Um die gesamte Zielzeitreihe verwenden zu können, müssen alle Elemente aus dem Zielzeitreihendatensatz auch im entsprechenden Zeitreihendatensatz enthalten sein. Wenn eine zugehörige Zeitreihe nur eine Teilmenge von Elementen aus der Zielzeitreihe enthält, sind die Modellerstellung und die Generierung von Prognosen auf diese bestimmte Teilmenge von Elementen beschränkt.

   Wenn die Zielzeitreihe beispielsweise 1000 Elemente enthält und der zugehörige Zeitreihendatensatz nur 100 Elemente enthält, dann basieren das Modell und die Prognosen nur auf diesen 100 Elementen. 
+ Die Häufigkeit, mit der Daten im zugehörigen Zeitreihen-Dataset erfasst werden, muss mit dem Intervall übereinstimmen, in dem Sie Prognosen generieren möchten (die *Prognosegranularität*).

  Wenn Sie beispielsweise Prognosen mit einer wöchentlichen Granularität generieren möchten, muss die Häufigkeit, mit der Daten in der zugehörigen Zeitreihe erfasst werden, ebenfalls wöchentlich sein, selbst wenn die Häufigkeit, mit der Daten in der Zielzeitreihe erfasst werden, täglich ist.
+ Die Daten eines jeden Artikels im Dataset verwandter Zeitreihen müssen am oder vor dem Anfangs-`timestamp` der entsprechenden `item_id` im Ziel-Zeitreihen-Dataset beginnen.

  Wenn beispielsweise die Daten verwandter Zeitreihen für `socks` am 01.01.2019 beginnen und die Ziel-Zeitreihen-Daten für `shoes` am 01.02.2019 beginnen, müssen die Daten verwandter Zeitreihen für `socks` am oder vordem 01.01.2019 beginnen und die Daten für `shoes` müssen am oder vordem 01.02.2019 beginnen.
+ *Bei zukunftsbezogenen Zeitreihendatensätzen muss sich der letzte Zeitstempel für jedes Element auf dem letzten Zeitstempel im benutzerdefinierten Prognosefenster (dem sogenannten Prognosehorizont) befinden.*

  In der nachstehenden Beispieldatei verwandter Zeitreihen müssen die `timestamp`-Daten sowohl für die Socken und für die Schuhe am oder nach dem 01.07.2019 (dem letzten aufgezeichneten Zeitstempel) *plus* dem Prognosehorizont enden. Wenn die Datenfrequenz in der Zielzeitreihe täglich ist und der Prognosehorizont 10 Tage beträgt, müssen tägliche Datenpunkte bis zum 11.07.2019 in der Datei mit den entsprechenden zukunftsgerichteten Zeitreihen angegeben werden.
+ Bei historischen Bezugszeitreihendatensätzen muss der letzte Zeitstempel für jedes Element mit dem letzten Zeitstempel in der Zielzeitreihe übereinstimmen.

  In der folgenden Beispieldatei mit verwandten Zeitreihen müssen die `timestamp` Daten für Socken und Schuhe am 01.07.2019 (dem letzten aufgezeichneten Zeitstempel) enden.
+ Die im zugehörigen Zeitreihendatensatz angegebenen Prognosedimensionen müssen entweder den im Zielzeitreihendatensatz angegebenen Dimensionen entsprechen oder eine Teilmenge davon sein.
+  In verwandten Zeitreihen dürfen keine Werte fehlen. Informationen zu fehlenden Werten in einem verwandten Zeitreihendatensatz finden Sie unter [Umgang mit fehlenden Werten](howitworks-missing-values.md). 

## Beispiel: Zukunftsorientierte, verwandte Zeitreihendatei
<a name="related-time-series-example"></a>

Die folgende Tabelle zeigt eine korrekt konfigurierte Dataset-Datei verwandter Zeitreihen. Nehmen Sie für dieses Beispiel Folgendes an:
+ Der letzte Datenpunkt wurde am 01.07.2019 im Ziel-Zeitreihen-Dataset aufgezeichnet.
+  Der Prognosehorizont beträgt 10 Tage. 
+ Die Prognosegranularität ist täglich (`D`). 

Eine „`…`“-Zeile gibt alle Datenpunkte zwischen den vorherigen und nachfolgenden Zeilen an.


| `timestamp` | `item_id` | `store` | `price` | 
| --- | --- | --- | --- | 
| 2019-01-01 | Socken | NYC | 10 | 
| 2019-01-02 | Socken | NYC | 10 | 
| 2019-01-03 | Socken | NYC | 15 | 
| ... | 
| 2019-06-01 | Socken | NYC | 10 | 
| ... | 
| 2019-07-01 | Socken | NYC | 10 | 
| ... | 
| 2019-07-11 | Socken | NYC | 20 | 
| 2019-01-05 | Socken | SFO | 45 | 
| ... | 
| 2019-06-05 | Socken | SFO | 10 | 
| ... | 
| 2019-07-01 | Socken | SFO | 10 | 
| ... | 
| 2019-07-11 | Socken | SFO | 30 | 
| 2019-02-01 | Schuhe | ORD | 50 | 
| ... | 
| 2019-07-01 | Schuhe | ORD | 75 | 
| ... | 
| 2019-07-11 | Schuhe | ORD | 60 | 

## Beispiel: Prognose der Granularität
<a name="related-time-series-granularity"></a>

Die folgende Tabelle zeigt kompatible Datenaufzeichnungsfrequenzen für Zielzeitreihen und zugehörige Zeitreihen, die mit einer wöchentlichen Granularität prognostiziert werden sollen. Da Daten in einem verknüpften Zeitreihendatensatz nicht aggregiert werden können, akzeptiert Forecast nur die Häufigkeit verwandter Zeitreihendaten, die der ausgewählten Prognosegranularität entspricht.


| Zieleingabedaten (Häufigkeit) | Verwandte Zeitreihen (Häufigkeit) | Prognose der Granularität | Von Forecast unterstützt? | 
| --- | --- | --- | --- | 
| Täglich | Wöchentlich | Wöchentlich | Ja | 
| Wöchentlich | Wöchentlich | Wöchentlich | Ja | 
| – | Wöchentlich | Wöchentlich | Ja | 
| Täglich | Täglich | Wöchentlich | Nein | 

## Ältere Prädiktoren und verwandte Zeitreihen
<a name="related-time-series-legacy"></a>

**Anmerkung**  
Informationen zum Upgrade eines vorhandenen Prädiktors auf finden Sie unter AutoPredictor [Aktualisierung auf AutoPredictor](howitworks-predictor.md#upgrading-autopredictor)

[Wenn Sie einen älteren Prädiktor verwenden, können Sie einen verwandten Zeitreihendatensatz verwenden, wenn Sie einen Prädiktor mit den Algorithmen [CNN-QR](aws-forecast-algo-cnnqr.md), [DeePar\$1](aws-forecast-recipe-deeparplus.md) und Prophet trainieren.](aws-forecast-recipe-prophet.md) [NPTS](aws-forecast-recipe-npts.md)[, [ARIMA](aws-forecast-recipe-arima.md) und ETS akzeptieren keine verwandten Zeitreihendaten.](aws-forecast-recipe-ets.md)

Die folgende Tabelle zeigt die Typen verwandter Zeitreihen, die jeder Amazon Forecast-Algorithmus akzeptiert. 


|  | CNN-QR | DeepAR\$1 | Prophet | NPTS | ARIMA | ETS | 
| --- | --- | --- | --- | --- | --- | --- | 
|  Zeitreihen im Zusammenhang mit historischen Zeitreihen  | ![\[Yes\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-yes.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | 
|  Zeitreihen in Bezug auf die Zukunft  | ![\[Yes\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-yes.png)  | ![\[Yes\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-yes.png)  | ![\[Yes\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-yes.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/icon-no.png)  | 

 Wenn Sie AutoML verwenden, können Sie sowohl historische als auch zukunftsgerichtete Zeitreihendaten angeben, und Forecast verwendet gegebenenfalls nur diese Zeitreihen. 

 Wenn Sie *zukunftsbezogene* Zeitreihendaten bereitstellen, verwendet Forecast die entsprechenden Daten mit CNN-QR, DeePar\$1 und Prophet und verwendet die entsprechenden Daten nicht mit NPTS, ARIMA und ETS. Falls *historische Bezugszeitreihendaten* bereitgestellt werden, verwendet Forecast die zugehörigen Daten mit CNN-QR und nicht die zugehörigen Daten mit DeePar\$1, Prophet, NPTS, ARIMA und ETS. 

# Verwenden von Artikel-Metadaten-Datensätzen
<a name="item-metadata-datasets"></a>

Ein *Datensatz mit Artikelmetadaten* enthält kategoriale Daten, die einen wertvollen Kontext für die Artikel in einem Zielzeitreihendatensatz bieten. Im Gegensatz zu verwandten Zeitreihen-Datensätzen liefern Artikel-Metadaten-Datensätze Informationen, die statisch sind. Das heißt, die Datenwerte bleiben über die Zeit konstant, wie die Farbe oder die Marke eines Artikels. Artikelmetadaten-Datensätze sind optionale Ergänzungen zu Ihren Datensatzgruppen. Sie können Artikel-Metadaten nur dann verwenden, wenn jeder Artikel in Ihrem Ziel-Zeitreihen-Datensatz im entsprechenden Artikel-Metadaten-Datensatz vorhanden ist.

Artikel-Metadaten können Marke, Farbe, Modell, Kategorie, Herkunftsort oder andere Zusatzmerkmale eines bestimmten Artikel enthalten. Beispielsweise könnte ein Metadatensatz für Artikel-Metadaten den Kontext für einige der Nachfragedaten liefern, die in einem Ziel-Zeitreihen-Datensatz gefunden wurden, der die Verkäufe von schwarzen Amazon-E-Readern mit 32 GB Speicherplatz darstellt. Da sich diese Merkmale nicht von day-to-day oder unterscheiden hour-to-hour, gehören sie zu einem Elementmetadaten-Datensatz.

Artikel-Metadaten sind nützlich, um aussagekräftige Muster in Ihren Zeitreihendaten zu erkennen und nachzuverfolgen. Wenn Sie einen Element-Metadaten-Datensatz in Ihre Datensatzgruppe aufnehmen, kann Forecast das Modell trainieren, um genauere Vorhersagen auf der Grundlage von Ähnlichkeiten zwischen Elementen zu treffen. Sie könnten beispielsweise feststellen, dass von Amazon hergestellte Produkte mit virtuellen Assistenten mit größerer Wahrscheinlichkeit ausverkauft sein werden als die von anderen Unternehmen hergestellten und dann Ihre Lieferkette entsprechend planen.

Elementmetadaten sind besonders nützlich in Kaltstart-Prognoseszenarien, in denen Sie keine historischen Daten haben, anhand derer Sie Vorhersagen treffen könnten, aber historische Daten zu Elementen mit ähnlichen Metadatenattributen haben. Mithilfe der Elementmetadaten kann Forecast ähnliche Elemente wie Ihre Kaltstart-Artikel nutzen, um eine Prognose zu erstellen.

Wenn Sie Elementmetadaten einbeziehen, erstellt Forecast Kaltstartprognosen auf der Grundlage ähnlicher Zeitreihen, wodurch genauere Prognosen erstellt werden können. Coldstart-Prognosen werden für Elemente generiert, die sich im Elementmetadaten-Datensatz, aber nicht in der nachfolgenden Zeitreihe befinden. Zunächst generiert Forecast Prognosen für die Nicht-Kaltstart-Elemente, bei denen es sich um Elemente mit historischen Daten in der nachfolgenden Zeitreihe handelt. Als Nächstes werden für jedes Coldstart-Element die nächsten Nachbarn mithilfe des Metadaten-Datensatzes des Elements ermittelt. Anschließend werden diese nächstgelegenen Nachbarn verwendet, um eine Kaltstartprognose zu erstellen.

Jede Zeile in einem Artikel-Metadatensatz kann bis zu 10 Metadatenfelder enthalten, von denen eines ein Identifikationsfeld sein muss, um die Metadaten einem Artikel in der Ziel-Zeitreihe zuordnen zu können. Wie bei allen Datensatztypen werden die Werte der einzelnen Felder durch ein Datensatz-Schema ausgewiesen.

**Python-Notizbücher**  
Eine step-by-step Anleitung zur Verwendung von Element-Metadaten finden Sie unter [Element-Metadaten integrieren](https://github.com/aws-samples/amazon-forecast-samples/blob/master/notebooks/advanced/Incorporating_Item_Metadata_Dataset_to_your_Predictor/Incorporating_Item_Metadata_Dataset_to_your_Predictor.ipynb).

**Topics**
+ [Beispiel: Artikel-Metadaten-Datei und Schema](#item-metadata-example)
+ [Ältere Prädiktoren und Artikelmetadaten](#item-metadata-legacy)
+ [Weitere Informationen finden Sie unter:](#item-metadata-see-also)

## Beispiel: Artikel-Metadaten-Datei und Schema
<a name="item-metadata-example"></a>

In der folgenden Tabelle wird ein Abschnitt einer korrekt konfigurierten Metadaten-Datensatzdatei für Artikel gezeigt, mit der Amazon E-Reader beschrieben werden. Nehmen Sie für dieses Beispiel an, dass die Kopfzeile das Schema des Datensatzes darstellt und dass jeder aufgeführte Artikel in einem entsprechenden Ziel-Zeitreihen-Datensatz enthalten ist.


| `item_id` | `brand` | `model` | `color` | `waterproof` | 
| --- | --- | --- | --- | --- | 
| 1 | amazon | paperwhite | black | Ja | 
| 2 | amazon | paperwhite | blue | Ja | 
| 3 | amazon | base\$1model | black | Nein | 
| 4 | amazon | base\$1model | white | Nein | 
| ... | 

Im Folgenden werden die gleichen Informationen im CSV-Format dargestellt.

```
1,amazon,paperwhite,black,yes
2,amazon,paperwhite,blue,yes
3,amazon,base_model,black,no
4,amazon,base_model,white,no
...
```

Folgendes ist das Schema für diesen Beispieldatensatz.

```
{
     "attributes": [
        {
           "AttributeName": "item_id",
           "AttributeType": "string"
        },
        {
           "AttributeName": "brand",
           "AttributeType": "string"
        },
        {
           "AttributeName": "model",
           "AttributeType": "string"
        },
        {
           "AttributeName": "color",
           "AttributeType": "string"
        },
        {
           "AttributeName": "waterproof",
           "AttributeType": "string"
        }
    ]
}
```

## Ältere Prädiktoren und Artikelmetadaten
<a name="item-metadata-legacy"></a>

**Anmerkung**  
Informationen zum Upgrade eines vorhandenen Prädiktors auf finden Sie unter AutoPredictor [Aktualisierung auf AutoPredictor](howitworks-predictor.md#upgrading-autopredictor)

[Wenn Sie einen älteren Prädiktor verwenden, können Sie Artikelmetadaten verwenden, wenn Sie einen Prädiktor mit den [CNN-QR](aws-forecast-algo-cnnqr.md) - oder DeePar\$1-Algorithmen trainieren.](aws-forecast-recipe-deeparplus.md) Wenn Sie AutoML verwenden, können Sie Artikelmetadaten angeben, und Forecast verwendet gegebenenfalls nur diese Zeitreihen.

## Weitere Informationen finden Sie unter:
<a name="item-metadata-see-also"></a>

[Eine ausführliche Anleitung zur Verwendung von Artikelmetadaten-Datensätzen finden Sie unter [Incorporating Item Metadata Datasets in Your Predictor](https://github.com/aws-samples/amazon-forecast-samples/blob/master/notebooks/advanced/Incorporating_Item_Metadata_Dataset_to_your_Predictor/Incorporating_Item_Metadata_Dataset_to_your_Predictor.ipynb) im Amazon Forecast Samples Repository. GitHub ](https://github.com/aws-samples/amazon-forecast-samples)

# Vordefinierte Dataset-Domänen und Dataset-Typen
<a name="howitworks-domains-ds-types"></a>

Um einen Predictor zu schulen, erstellen Sie ein oder mehrere Datasets, fügen sie einer Dataset-Gruppe hinzu und stellen die Dataset-Gruppe für die Schulung bereit.

Für jedes Dataset, das Sie erstellen, ordnen Sie eine Dataset-Domäne und einen Dataset-Typ zu. Eine *Dataset-Domäne* gibt ein vordefiniertes Dataset-Schema für einen allgemeinen Anwendungsfall an und wirkt sich nicht auf Modellalgorithmen oder Hyperparameter aus.

Amazon Forecast unterstützt die folgenden Dataset-Domänen:
+ [RETAIL-Domäne](retail-domain.md)— Für Nachfrageprognosen im Einzelhandel
+ [INVENTORY\$1PLANNING-Domäne](inv-planning-domain.md)— Für die Lieferkette und die Bestandsplanung
+ [EC2 CAPACITY-Domäne](ec2-capacity-domain.md)— Für die Prognose der Kapazität von Amazon Elastic Compute Cloud (Amazon EC2) 
+ [WORK\$1FORCE-Domäne](workforce-domain.md)— Für die Personalplanung 
+ [WEB\$1TRAFFIC-Domäne](webtraffic-domain.md)— Zur Schätzung des future Web-Traffics 
+ [METRICS-Domäne](metrics-domain.md)— Zur Prognose von Kennzahlen wie Umsatz und Cashflow
+ [CUSTOM-Domäne](custom-domain.md)— Für alle anderen Arten von Zeitreihenprognosen

Jede Domäne kann ein bis drei *Dataset-Typen* haben. Die für eine Domäne erstellten Dataset-Typen basieren auf dem verwendeten Datentyp sowie den Daten, die Sie für die Schulung verwenden möchten.

Jede Domäne benötigt ein Ziel-Zeitreihen-Dataset und unterstützt optional den Dataset-Typ der verwandten Zeitreihen oder den Artikel-Metadaten-Dataset-Typ.

Die Dataset-Typen sind:
+ Zielzeitreihe — Der einzig erforderliche Datensatztyp. Dieser Typ definiert das *Zielfeld*, für das Sie Prognosen generieren möchten. Wenn Sie beispielsweise eine Prognose für die Verkäufe für eine Produktreihe erstellen möchten, müssen Sie für jedes Produkt, für das Sie eine Prognose erstellen möchten, ein Dataset der Zeitreihenverlaufsdaten erstellen. Ebenso können Sie einen Zielzeitreihen-Datensatz für Kennzahlen wie Umsatz, Cashflow und Umsatz erstellen, die Sie möglicherweise prognostizieren möchten.
+ Verwandte Zeitreihen — Zeitreihendaten, die sich auf die Zielzeitreihendaten beziehen. Beispielsweise steht der Preis in Zusammenhang mit den Produktverkaufsdaten und kann daher als verwandte Zeitreihen angegeben werden.
+ Elementmetadaten — Metadaten, die für die Zielzeitreihendaten gelten. Wenn Sie beispielsweise Verkäufe für ein bestimmtes Produkt prognostizieren, werden Attribute des Produkts — wie Marke, Farbe und Genre — Teil der Artikelmetadaten sein. Bei Prognosen zur EC2-Kapazität für EC2-Instances können die Metadaten die Rechenleistung und den Arbeitsspeicher der Instance-Typen enthalten.

Ihre Eingabedaten müssen für jeden Dataset-Typ bestimmte Pflichtfelder enthalten. Darüber hinaus können Sie optionale Felder einbeziehen, die Ihnen von Amazon Forecast vorgeschlagen werden.

Die folgenden Beispiele zeigen, wie Sie eine Dataset-Domäne und entsprechende Dataset-Typen auswählen.

**Example Beispiel 1: Dataset-Typen in der Domäne RETAIL**  
Wenn Sie als Einzelhändler eine Prognose zur Nachfrage für bestimmte Artikel erstellen möchten, können Sie die folgenden Datasets in der Domäne RETAIL erstellen:  
+ Das Zielzeitenreihen-Dataset wird für die bisheriger Zeitreihendaten zur Nachfrage (Verkäufe) für die einzelnen Artikel (jedes vom Händler verkaufte Produkt) benötigt. In der Domäne RETAIL muss das Dataset für diesen Dataset-Typ die Felder `item_id`, `timestamp` und `demand` enthalten. Das Feld `demand` ist das Prognoseziel, in der Regel die vom Händler in einer bestimmten Woche oder an einem bestimmten Tag verkaufte Anzahl der Artikel.
+ Optional ein Dataset des Typs der verwandten Zeitreihen. In der Domäne RETAIL kann dieser Typ optional, aber empfohlen, Zeitreihendaten wie `price`, `inventory_onhand` und `webpage_hits` enthalten.
+ Optional ein Dataset vom Artikel-Metadatentyp. In der Domäne RETAIL empfiehlt Amazon Forecast Ihnen, Metadaten zu den Artikeln bereitzustellen, die Sie in Ziel-Zeitreihen angegeben haben, beispielsweise `brand`, `color`, `category` und `genre`.

**Example Beispiel 2: Dataset-Typen in der Domäne METRICS**  
Wenn Sie wichtige Kennzahlen für Ihr Unternehmen — wie Umsatz, Umsatz und Cashflow — prognostizieren möchten, können Sie Amazon Forecast die folgenden Datensätze zur Verfügung stellen:  
+ Das Ziel-Zeitreihen-Dataset mit bisherigen Zeitreihendaten für die Metrik, für die Sie eine Prognose erstellen möchten. Wenn Sie an der Vorhersage des Umsatzes aller Geschäftsbereiche in Ihrem Unternehmen interessiert sind, können Sie ein `target time series`-Dataset mit den Feldern `metric`, `business unit` und `metric_value` erstellen.
+ Wenn Sie über Metadaten für die einzelnen Metriken verfügen, die nicht erforderlich sind, wie `category` oder `location`, können Sie Datasets vom Typ der verwandten Zeitreihen und vom Typ der Artikel-Metadaten bereitstellen.
Sie müssen mindestens einen Zielzeitreihendatensatz für Forecast bereitstellen, um Prognosen für Ihre Zielkennzahlen zu generieren.

**Example Beispiel 3: Dataset-Typen in der Domäne CUSTOM**  
Die Schulungsdaten für Ihre Prognoseanwendung passen möglicherweise in keine der Amazon Forecast-Domänen. Wählen Sie in diesem Fall die Domäne CUSTOM aus. Sie müssen das Ziel-Zeitreihen-Dataset angeben, können jedoch eigene, benutzerdefinierte Felder hinzufügen.  
In der Übung [Erste Schritte](getting-started.md) wird der Stromverbrauch für einen Client prognostiziert. Die Schulungsdaten für den Stromverbrauch passen in keine der Dataset-Domänen, daher wurde die Domäne CUSTOM verwendet. In der Übung wird nur ein Dataset-Typ verwendet, nämlich der Ziel-Zeitreihentyp. Wir ordnen die Datenfelder den für den Dataset-Typ benötigten minimalen Feldern zu.

# RETAIL-Domäne
<a name="retail-domain"></a>

Die RETAIL-Domäne unterstützt die folgenden Dataset-Typen. Für jeden Dataset-Typ sind die Pflichtfelder sowie die optionalen Felder aufgeführt. Weitere Informationen zur Zuordnung von Feldern zu Spalten in Ihren Schulungsdaten finden Sie unter [Dataset-Domänen und Dataset-Typen](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Ziel-Zeitreihen-Dataset-Typ](#target-time-series-type-retail-domain)
+ [Dataset-Typ der verwandten Zeitreihen](#related-time-series-type-retail-domain)
+ [Artikel-Metadaten-Dataset-Typ](#item-metadata-type-retail-domain)

## Ziel-Zeitreihen-Dataset-Typ
<a name="target-time-series-type-retail-domain"></a>

Die Ziel-Zeitreihe enthält die bisherigen Zeitreihendaten für jeden Artikel bzw. jedes Produkt, der bzw. das vom Einzelhändler verkauft wurde. Die folgenden Felder sind erforderlich: 
+ `item_id `(Zeichenfolge) — Eine eindeutige Kennung für den Artikel oder das Produkt, für das Sie die Nachfrage vorhersagen möchten.
+ `timestamp` (Zeitstempel)
+ `demand`(float) — Die Anzahl der Verkäufe für diesen Artikel zum Zeitpunkt des Zeitstempels. Dies ist auch das *Ziel*-Feld, für das Amazon Forecast eine Prognose erstellt.

Die folgende Dimension ist optional und kann verwendet werden, um die Prognosegranularität zu ändern:
+ `location`(string) — Der Standort des Geschäfts, in dem der Artikel verkauft wurde. Dies sollte nur verwendet werden, wenn Sie mehrere Stores/Standorte haben.

Idealerweise sollten nur diese erforderlichen Felder und optionalen Dimensionen einbezogen werden. Sonstige zusätzliche Zeitreihen sollten in einem Dataset verwandter Zeitreihen enthalten sein.

## Dataset-Typ der verwandten Zeitreihen
<a name="related-time-series-type-retail-domain"></a>

Sie können Amazon Forecast Datasets verwandter Zeitreihen bereitstellen, beispielsweise den Preis oder die Anzahl der Klicks auf einen Artikel im Onlineshop an einem bestimmten Datum. Je mehr Informationen Sie bereitstellen, desto genauer wird die Prognose. Die folgenden Felder sind erforderlich: 
+ `item_id ` (string)
+ `timestamp `(Zeitstempel)

Die folgenden Felder sind optional und können beim Verbessern von Prognoseergebnissen nützlich sein:
+ `price`(float) — Der Preis des Artikels zum Zeitpunkt des Zeitstempels.
+ `promotion_applied`(integer; 1=true, 0=false) — Ein Kennzeichen, das angibt, ob zum Zeitpunkt des Zeitstempels eine Marketingaktion für diesen Artikel stattgefunden hat.

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

## Artikel-Metadaten-Dataset-Typ
<a name="item-metadata-type-retail-domain"></a>

Dieses Dataset stellt Amazon Forecast Informationen zu den Metadaten (Attributen) der Artikel bereit, für deren Nachfrage Prognosen erstellt werden sollen. Die folgenden Felder sind erforderlich:
+ `item_id ` (string)

Die folgenden Felder sind optional und können beim Verbessern von Prognoseergebnissen nützlich sein:
+ `category` (string)
+ `brand` (string)
+ `color` (string)
+ `genre` (string)

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

# CUSTOM-Domäne
<a name="custom-domain"></a>

Die CUSTOM-Domäne unterstützt die folgenden Dataset-Typen. Für jeden Dataset-Typ sind die Pflichtfelder sowie die optionalen Felder aufgeführt. Weitere Informationen zur Zuordnung von Feldern zu Spalten in Ihren Schulungsdaten finden Sie unter [Dataset-Domänen und Dataset-Typen](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Ziel-Zeitreihen-Dataset-Typ](#target-time-series-type-custom-domain)
+ [Dataset-Typ der verwandten Zeitreihen](#related-time-series-type-custom-domain)
+ [Artikel-Metadaten-Dataset-Typ](#item-metadata-type-custom-domain)

## Ziel-Zeitreihen-Dataset-Typ
<a name="target-time-series-type-custom-domain"></a>

Die folgenden Felder sind erforderlich:
+ `item_id ` (string)
+ `timestamp` (Zeitstempel)
+ `target_value`(Ganzzahl mit Fließkomma) — Dies ist das `target` Feld, für das Amazon Forecast eine Prognose generiert.

Idealerweise sollten nur diese erforderlichen Felder einbezogen werden. Sonstige zusätzliche Zeitreihen sollten in einem Dataset verwandter Zeitreihen enthalten sein.

## Dataset-Typ der verwandten Zeitreihen
<a name="related-time-series-type-custom-domain"></a>

Die folgenden Felder sind erforderlich:
+ `item_id` (string)
+ `timestamp` (Zeitstempel)

Neben den Pflichtfeldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

## Artikel-Metadaten-Dataset-Typ
<a name="item-metadata-type-custom-domain"></a>

Das folgende Feld ist erforderlich:
+ `item_id` (string)

Das folgende Feld ist optional und kann beim Verbessern von Prognoseergebnissen nützlich sein:
+ `category` (string)

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

# INVENTORY\$1PLANNING-Domäne
<a name="inv-planning-domain"></a>

Verwenden Sie die INVENTORY\$1PLANNING-Domäne zum Erstellen von Prognosen für die Nachfrage nach Rohstoffen und der Planung des Inventarbestands für einen bestimmten Artikel. Die folgenden Dataset-Typen werden unterstützt. Für jeden Dataset-Typ sind die Pflichtfelder sowie die optionalen Felder aufgeführt. Weitere Informationen zur Zuordnung von Feldern zu Spalten in Ihren Schulungsdaten finden Sie unter [Dataset-Domänen und Dataset-Typen](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Ziel-Zeitreihen-Dataset-Typ](#target-time-series-type-inv-planning-domain)
+ [Dataset-Typ der verwandten Zeitreihen](#related-time-series-type-related-time-series-domain)
+ [Artikel-Metadaten-Dataset-Typ](#item-metadata-type-related-time-series-domain)

## Ziel-Zeitreihen-Dataset-Typ
<a name="target-time-series-type-inv-planning-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `item_id` (string)
+ `timestamp` (Zeitstempel)
+ `demand`(float) — Dies ist das `target` Feld, für das Amazon Forecast eine Prognose generiert.

Die folgende Dimension ist optional und kann verwendet werden, um die Prognosegranularität zu ändern:
+ `location`(string) — Der Standort des Distributionszentrums, in dem der Artikel gelagert wird. Dies sollte nur verwendet werden, wenn Sie mehrere Stores/Standorte haben.

Idealerweise sollten nur diese erforderlichen Felder und optionalen Dimensionen einbezogen werden. Sonstige zusätzliche Zeitreihen sollten in einem Dataset verwandter Zeitreihen enthalten sein.

## Dataset-Typ der verwandten Zeitreihen
<a name="related-time-series-type-related-time-series-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `item_id` (string)
+ `timestamp` (Zeitstempel)

Die folgenden Felder sind optional und können beim Verbessern von Prognoseergebnissen nützlich sein:
+ `price`(Float) — Der Preis des Artikels 

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

## Artikel-Metadaten-Dataset-Typ
<a name="item-metadata-type-related-time-series-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `item_id` (string)

Die folgenden Felder sind optional und können beim Verbessern von Prognoseergebnissen nützlich sein:
+ `category`(string) — Die Kategorie des Artikels.
+ `brand`(string) — Die Marke des Artikels.
+ `lead_time`(string) — Die Vorlaufzeit in Tagen für die Herstellung des Artikels.
+ `order_cycle`(Zeichenfolge) — Der Bestellzyklus beginnt, wenn die Arbeit beginnt, und endet, wenn der Artikel versandbereit ist.
+ `safety_stock`(string) — Die Mindestmenge an Lagerbestand, die für diesen Artikel vorrätig sein muss.

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

# EC2 CAPACITY-Domäne
<a name="ec2-capacity-domain"></a>

Verwenden Sie die EC2 CAPACITY-Domain für die Prognose der Amazon EC2 EC2-Kapazität. Die folgenden Dataset-Typen werden unterstützt. Für jeden Dataset-Typ sind die Pflichtfelder sowie die optionalen Felder aufgeführt. Weitere Informationen zur Zuordnung von Feldern zu Spalten in Ihren Schulungsdaten finden Sie unter [Dataset-Domänen und Dataset-Typen](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

## Ziel-Zeitreihen-Dataset-Typ
<a name="target-time-series-type-ec2-capacity-domain"></a>

Die folgenden Felder sind erforderlich:
+ `instance_type`(string) — Der Instance-Typ (z. B. c5.xlarge).
+ `timestamp` (Zeitstempel)
+ `number_of_instances`(integer) — Die Anzahl der Instanzen dieses bestimmten Instance-Typs, die zum Zeitpunkt des Zeitstempels genutzt wurden. Dies ist das `target`-Feld, für das Amazon Forecast eine Prognose erstellt.

Die folgende Dimension ist optional und kann verwendet werden, um die Prognosegranularität zu ändern:
+ `location`(string) — Sie können eine angeben AWS-Region, z. B. us-west-2 oder us-east-1. Dies sollte nur verwendet werden, wenn Sie mehrere Regionen modellieren.

Idealerweise sollten nur diese erforderlichen und empfohlenen optionalen Felder einbezogen werden. Sonstige zusätzliche Zeitreihen sollten in einem Dataset verwandter Zeitreihen enthalten sein.

## Dataset-Typ der verwandten Zeitreihen
<a name="related-time-series-type-ec2-capacity-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `instance_type` (string)
+ `timestamp` (Zeitstempel)

Neben den Pflichtfeldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

# WORK\$1FORCE-Domäne
<a name="workforce-domain"></a>

Verwenden Sie die WORK\$1FORCE-Domäne, um Prognosen für die benötigte Anzahl an Mitarbeitern zu erstellen. Die folgenden Dataset-Typen werden unterstützt. Für jeden Dataset-Typ sind die Pflichtfelder sowie die optionalen Felder aufgeführt. Weitere Informationen zur Zuordnung von Feldern zu Spalten in Ihren Schulungsdaten finden Sie unter [Dataset-Domänen und Dataset-Typen](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Ziel-Zeitreihen-Dataset-Typ](#target-time-series-type-workforce-domain)
+ [Dataset-Typ der verwandten Zeitreihen](#related-time-series-type-workforce-domain)
+ [Artikel-Metadaten-Dataset-Typ](#item-metadata-type-workforce-domain)

## Ziel-Zeitreihen-Dataset-Typ
<a name="target-time-series-type-workforce-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `workforce_type`(string) — Die Art der prognostizierten Erwerbsbevölkerung. Das kann beispielsweise der Bedarf in einem Callcenter oder in einem Auftragsabwicklungszentrum sein.
+ `timestamp` (Zeitstempel)
+ `workforce_demand`(Ganzzahl mit Fließkomma) — Dies ist das `target` Feld, für das Amazon Forecast eine Prognose generiert.

Die folgende Dimension ist optional und kann verwendet werden, um die Prognosegranularität zu ändern:
+ `location`(string) — Der Standort, an dem nach Arbeitskräften gesucht wird. Dies sollte verwendet werden, wenn Sie mehrere Stores/Standorte haben.

Idealerweise sollten nur diese erforderlichen Felder und optionalen Dimensionen einbezogen werden. Sonstige zusätzliche Zeitreihen sollten in einem Dataset verwandter Zeitreihen enthalten sein.

## Dataset-Typ der verwandten Zeitreihen
<a name="related-time-series-type-workforce-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `workforce_type` (string)
+ `timestamp` (Zeitstempel)

Neben den Pflichtfeldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

## Artikel-Metadaten-Dataset-Typ
<a name="item-metadata-type-workforce-domain"></a>

Das folgende Feld ist erforderlich: 
+ `workforce_type` (string)

Die folgenden Felder sind optional und können beim Verbessern von Prognoseergebnissen nützlich sein:
+ `wages`(float) — Die Durchschnittslöhne für diese bestimmte Belegschaft.
+ `shift_length`(string) — Die Länge der Schicht.
+ `location`(string) — Der Standort der Belegschaft.

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

# WEB\$1TRAFFIC-Domäne
<a name="webtraffic-domain"></a>

Verwenden Sie die WEB\$1TRAFFIC-Domäne, um Prognosen zum Web-Datenverkehr zu einer oder mehreren Web-Properties zu erstellen. Die folgenden Dataset-Typen werden unterstützt. In den relevanten Themen werden die Pflichtfelder und optionalen Felder beschrieben, die von dem Dataset-Typ unterstützt werden. Weitere Informationen zur Zuordnung dieser Felder zu Spalten in Ihren Schulungsdaten finden Sie unter [Dataset-Domänen und Dataset-Typen](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Ziel-Zeitreihen-Dataset-Typ](#target-time-series-type-webtraffic-domain)
+ [Dataset-Typ der verwandten Zeitreihen](#related-time-series-type-webtraffic-domain)

## Ziel-Zeitreihen-Dataset-Typ
<a name="target-time-series-type-webtraffic-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `item_id`(Zeichenfolge) — Eine eindeutige Kennung für jede prognostizierte Web-Eigenschaft.
+ `timestamp` (Zeitstempel)
+ `value`(float) — Dies ist das `target` Feld, für das Amazon Forecast eine Prognose generiert.

Idealerweise sollten nur diese erforderlichen Felder einbezogen werden. Sonstige zusätzliche Zeitreihen sollten in einem Dataset verwandter Zeitreihen enthalten sein.

## Dataset-Typ der verwandten Zeitreihen
<a name="related-time-series-type-webtraffic-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `item_id` (string)
+ `timestamp` (Zeitstempel)

Neben den Pflichtfeldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

### Artikel-Metadaten-Dataset-Typ
<a name="idem-metadata-type-webtraffic-domain"></a>

Das folgende Feld ist erforderlich: 
+ `item_id` (string)

Das folgende Feld ist optional und kann beim Verbessern von Prognoseergebnissen nützlich sein:
+ `category` (string)

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

# METRICS-Domäne
<a name="metrics-domain"></a>

Verwenden Sie die METRICS-Domäne, um Prognosen zu Metriken wie Umsatz, Verkäufe und Cashflow zu erstellen. Die folgenden Dataset-Typen werden unterstützt. Für jeden Dataset-Typ sind die Pflichtfelder sowie die optionalen Felder aufgeführt. Weitere Informationen zur Zuordnung von Feldern zu Spalten in Ihren Schulungsdaten finden Sie unter [Dataset-Domänen und Dataset-Typen](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Ziel-Zeitreihen-Dataset-Typ](#target-time-series-type-metrics-domain)
+ [Dataset-Typ der verwandten Zeitreihen](#related-time-series-type-metrics-domain)
+ [Artikel-Metadaten-Dataset-Typ](#item-metadata-type-metrics-domain)

## Ziel-Zeitreihen-Dataset-Typ
<a name="target-time-series-type-metrics-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `metric_name` (string)
+ `timestamp` (Zeitstempel)
+ `metric_value`(Fließkomma-Ganzzahl) — Dies ist das `target` Feld, für das Amazon Forecast eine Prognose generiert (z. B. die Höhe des an einem bestimmten Tag generierten Umsatzes).

Idealerweise sollten nur diese erforderlichen Felder einbezogen werden. Sonstige zusätzliche Zeitreihen sollten in einem Dataset verwandter Zeitreihen enthalten sein.

## Dataset-Typ der verwandten Zeitreihen
<a name="related-time-series-type-metrics-domain"></a>

Die folgenden Felder sind erforderlich: 
+ `metric_name` (string)
+ `timestamp` (Zeitstempel)

Neben den Pflichtfeldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

## Artikel-Metadaten-Dataset-Typ
<a name="item-metadata-type-metrics-domain"></a>

Das folgende Feld ist erforderlich: 
+ `metric_name` (string)

Das folgende Feld ist optional und kann beim Verbessern von Prognoseergebnissen nützlich sein:
+ `category` (string)

Neben den Pflichtfeldern und den empfohlenen optionalen Feldern können Ihre Schulungsdaten auch weitere Felder enthalten. Um andere Felder in das Dataset aufzunehmen, geben Sie die Felder in einem Schema an, wenn Sie das Dataset erstellen.

# Aktualisieren von Daten
<a name="updating-data"></a>

Wenn Sie neue Daten sammeln, sollten Sie diese Daten in Forecast importieren. Dazu stehen Ihnen zwei Optionen zur Verfügung: Ersatz und inkrementelle Updates. Bei einem Importauftrag für Ersatzdatensätze werden alle vorhandenen Daten mit den neu importierten Daten überschrieben. Bei einer inkrementellen Aktualisierung werden die neu importierten Daten an den Datensatz angehängt.

Nach dem Import Ihrer neuen Daten können Sie einen vorhandenen Prädiktor verwenden, um eine Prognose für diese Daten zu erstellen.

**Topics**
+ [Modi importieren](#idsi)
+ [Aktualisierung vorhandener Datensätze](#idsi-console)
+ [Aktualisierung von Prognosen](#update-data-new-forecasts)

## Modi importieren
<a name="idsi"></a>

Um zu konfigurieren, wie Amazon Forecast neue Daten zu einem vorhandenen Datensatz hinzufügt, geben Sie den Importmodus für Ihren Datensatz-Importjob an. Der Standard-Importmodus ist`FULL`. Sie können den Importmodus nur mithilfe der Amazon Forecast API konfigurieren.
+ Um alle vorhandenen Daten in Ihrem Datensatz zu überschreiben, geben Sie dies `FULL` im [CreateDatasetImportJob](API_CreateDatasetImportJob.md) API-Vorgang an.
+ Um die Datensätze an die vorhandenen Daten in Ihrem Datensatz anzuhängen, geben Sie dies `INCREMENTAL` im [CreateDatasetImportJob](API_CreateDatasetImportJob.md) API-Vorgang an. Wenn ein vorhandener Datensatz und ein importierter Datensatz dieselbe Zeitreihen-ID (Element-ID, Dimension und Zeitstempel) haben, wird der vorhandene Datensatz durch den neu importierten Datensatz ersetzt. Amazon Forecast verwendet immer den Datensatz mit dem aktuellsten Zeitstempel.

Wenn Sie keinen Datensatz importiert haben, ist die inkrementelle Option nicht verfügbar. Der Standard-Importmodus ist ein vollständiger Ersatz.

### Richtlinien für den inkrementellen Importmodus
<a name="idsi-incremental"></a>

Wenn Sie einen inkrementellen Dataset-Import durchführen, können Sie das Zeitstempelformat, das Datenformat oder die Geolokalisierungsdaten nicht ändern. Um eines dieser Elemente zu ändern, müssen Sie einen vollständigen Datendatensatzimport durchführen.

## Aktualisierung vorhandener Datensätze
<a name="idsi-console"></a>

**Wichtig**  
Standardmäßig ersetzt ein Datensatz-Importjob alle vorhandenen Daten in dem Datensatz, in den Sie importiert haben. Sie können dies ändern, indem Sie den Job für den Datensatz-Import angeben[Modi importieren](#idsi).

Um einen Datensatz zu aktualisieren, erstellen Sie einen Datensatz-Importjob für den Datensatz und geben Sie den Importmodus an.

------
#### [ CLI ]

Verwenden Sie den `create-dataset-import-job` Befehl, um einen Datensatz zu aktualisieren. Geben Sie für den an `import-mode``FULL`, ob vorhandene Daten ersetzt oder `INCREMENTAL` erweitert werden sollen. Weitere Informationen finden Sie unter [Modi importieren](#idsi).

Der folgende Code zeigt, wie Sie einen Datensatz-Importjob erstellen, der inkrementell neue Daten in einen Datensatz importiert.

```
aws forecast create-dataset-import-job \
                        --dataset-import-job-name dataset import job name \
                        --dataset-arn dataset arn \
                        --data-source "S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"} \
                        --import-mode INCREMENTAL
```

------
#### [ Python ]

Verwenden Sie die `create_dataset_import_job` Methode, um einen Datensatz zu aktualisieren. Geben Sie für den an `import-mode``FULL`, ob vorhandene Daten ersetzt oder `INCREMENTAL` erweitert werden sollen. Weitere Informationen finden Sie unter [Modi importieren](#idsi).

```
import boto3

forecast = boto3.client('forecast')

response = forecast.create_dataset_import_job(
    datasetImportJobName = 'YourImportJob',
    datasetArn = 'dataset_arn',
    dataSource = {"S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"}},
    importMode = 'INCREMENTAL'
)
```

------

## Aktualisierung von Prognosen
<a name="update-data-new-forecasts"></a>

Wenn Sie neue Daten sammeln, möchten Sie diese möglicherweise verwenden, um neue Prognosen zu erstellen. Forecast trainiert einen Prädiktor nicht automatisch neu, wenn Sie einen aktualisierten Datensatz importieren. Sie können einen Prädiktor jedoch manuell neu trainieren, um eine neue Prognose mit den aktualisierten Daten zu generieren. Wenn Sie beispielsweise tägliche Verkaufsdaten sammeln und neue Datenpunkte in Ihre Prognose aufnehmen möchten, können Sie die aktualisierten Daten importieren und sie zur Generierung einer Prognose verwenden, ohne einen neuen Prädiktor trainieren zu müssen. Damit sich neu importierte Daten auf Ihre Prognosen auswirken, müssen Sie den Prädiktor neu trainieren.

**Um aus den neuen Daten eine Prognose zu generieren:**

1. Laden Sie die neuen Daten in einen Amazon S3 S3-Bucket hoch. Ihre neuen Daten sollten nur die Daten enthalten, die seit Ihrem letzten Datensatz-Import hinzugefügt wurden.

1. Erstellen Sie einen Auftrag zum **inkrementellen** Import von Datensätzen mit den neuen Daten. Die neuen Daten werden an die vorhandenen Daten angehängt, und die Prognose wird aus den aktualisierten Daten generiert. Wenn Ihre neue Datendatei sowohl zuvor importierte Daten als auch neue Daten enthält, erstellen Sie einen Importauftrag für **vollständige** Datensätze.

1. Erstellen Sie eine neue Prognose mit dem vorhandenen Prädiktor.

1. Rufen Sie die Prognose wie gewohnt ab.

# Umgang mit fehlenden Werten
<a name="howitworks-missing-values"></a>

Ein häufiges Problem in Zeitreihenprognosedaten sind fehlende Werte. Ihre Daten können aus verschiedenen Gründen fehlende Werte enthalten, darunter Messfehler, Formatierungsprobleme, menschliche Fehler oder fehlende Informationen, die aufgezeichnet werden müssen. Wenn Sie beispielsweise die Produktnachfrage für ein Einzelhandelsgeschäft prognostizieren und ein Artikel ausverkauft oder nicht verfügbar ist, gibt es keine Verkaufsdaten, die aufgezeichnet werden müssen, solange dieser Artikel nicht vorrätig ist. Bei ausreichender Prävalenz können fehlende Werte erhebliche Auswirkungen auf die Genauigkeit eines Modells haben.

Amazon Forecast bietet eine Reihe von Füllmethoden, um fehlende Werte in Ihren Zielzeitreihen und verwandten Zeitreihendatensätzen zu behandeln. Füllen ist der Prozess des Hinzufügens standardisierter Werte zu fehlenden Einträgen in Ihrem Datensatz.

Forecast unterstützt die folgenden Füllmethoden:
+ **Mittlere Füllung** — Füllt alle fehlenden Werte zwischen dem Start- und Enddatum des Elements eines Datensatzes aus.
+ **Hinterfüllung** — Füllt alle fehlenden Werte zwischen dem letzten aufgezeichneten Datenpunkt und dem globalen Enddatum eines Datensatzes aus.
+ **Zukünftiges Füllen (nur verwandte Zeitreihen)** — Füllt alle fehlenden Werte zwischen dem globalen Enddatum und dem Ende des Prognosehorizonts auf.

Die folgende Abbildung bietet eine visuelle Darstellung verschiedener Füllmethoden.

![\[Timeline showing three items with varying durations and fill methods between global start and end dates.\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/Filling_types.PNG)


## Auswählen der Fülllogik
<a name="choosing-missing-values"></a>

Bei der Auswahl einer Fülllogik sollten Sie überlegen, wie die Logik von Ihrem Modell interpretiert wird. In einem Einzelhandelsszenario unterscheidet sich beispielsweise die Erfassung von 0 Verkäufen eines verfügbaren Artikels von der Erfassung von 0 Verkäufen eines nicht verfügbaren Artikels, da letzteres kein mangelndes Kundeninteresse an dem Artikel impliziert. Aus diesem Grund kann das `0` Ausfüllen der Zielzeitreihe dazu führen, dass der Prädiktor bei seinen Prognosen zu wenig voreingenommen ist, wohingegen beim `NaN` Ausfüllen das tatsächliche Vorkommen, dass 0 verfügbare Artikel verkauft wurden, ignoriert und der Prädiktor übermäßig voreingenommen ist.

Die folgenden Zeitreihendiagramme veranschaulichen, wie die Auswahl des falschen Füllwerts die Genauigkeit Ihres Modells erheblich beeinflussen kann. In den Grafiken A und B wird die Nachfrage nach einem Artikel dargestellt, bei dem es sich um einen Teil handelt out-of-stock, wobei die schwarzen Linien die tatsächlichen Verkaufsdaten darstellen. Fehlende Werte in A1 werden mit `0` gefüllt, was zu Prognosen mit relativ schwacher Tendenz (dargestellt durch die gepunkteten Linien) in A2 führt. Ebenso werden fehlende Werte in B1 mit `NaN` gefüllt, was zu Prognosen mit höherer Genauigkeit in B2 führt.

![\[Time-series graphs comparing item demand predictions with different filling values for missing data.\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/images/filling_values.PNG)


Eine Liste der unterstützten Fülllogik finden Sie im folgenden Abschnitt.

## Zielzeitreihen und zugehörige Zeitreihenfülllogik
<a name="filling-restrictions"></a>

Füllungen sind bei Zielzeitreihen und zugehörigen Zeitreihen-Datasets möglich. Jeder Dataset-Typ weist unterschiedliche Füllrichtlinien und Einschränkungen auf.


**Füllrichtlinien**  

| Dataset-Typ | Standardmäßig füllen? | Unterstützte Füllmethoden | Standardfülllogik | Akzeptierte Fülllogik | 
| --- | --- | --- | --- | --- | 
| Zielzeitreihe | Ja | Mittel- und Rückfüllung | 0 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/howitworks-missing-values.html)  | 
| Zugehörige Zeitreihen | Nein | Mittel-, Rück- und zukünftige Füllung | Kein Standard |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/forecast/latest/dg/howitworks-missing-values.html)  | 

**Wichtig**  
Sowohl für Zielzeitreihen als auch für zugehörige Zeitreihendatensätze `max` werden `mean` `median``min`,, und auf der Grundlage eines fortlaufenden Zeitfensters mit den 64 neuesten Dateneinträgen vor den fehlenden Werten berechnet.

## Syntax fehlender Werte
<a name="filling-syntax"></a>

Um fehlende Werte aufzufüllen, geben Sie beim Aufrufen des [CreatePredictor](API_CreatePredictor.md)Vorgangs die Fülltypen an, die implementiert werden sollen. Die Fülllogik ist in [FeaturizationMethod](API_FeaturizationMethod.md)Objekten angegeben.

Der folgende Auszug veranschaulicht ein korrekt formatiertes `FeaturizationMethod`-Objekt für ein Zielzeitreihenattribut und ein zugehöriges Zeitreihenattribut (jeweils `target_value` und `price`).

 Um eine Füllmethode auf einen bestimmten Wert festzulegen, setzen Sie den Füllparameter auf `value` und definieren Sie den Wert in einem entsprechenden `_value` Parameter. Wie unten dargestellt, wird das Auffüllen für die zugehörige Zeitreihe auf den Wert 2 gesetzt, wobei Folgendes gilt: `"backfill": "value"` und`"backfill_value":"2"`. 

```
[
    {
        "AttributeName": "target_value",
        "FeaturizationPipeline": [
            {
                "FeaturizationMethodName": "filling",
                "FeaturizationMethodParameters": {
                    "aggregation": "sum",
                    "middlefill": "zero",
                    "backfill": "zero"
                }
            }
        ]
    },
    {
        "AttributeName": "price",
        "FeaturizationPipeline": [
            {
                "FeaturizationMethodName": "filling",
                "FeaturizationMethodParameters": {
                    "middlefill": "median",
                    "backfill": "value",
                    "backfill_value": "2",
                    "futurefill": "max"               
                    }
            }
        ]
    }
]
```

# Datensatz-Richtlinien für Forecast
<a name="dataset-import-guidelines-troubleshooting"></a>

Beachten Sie die folgenden Richtlinien, wenn Amazon Forecast Ihren Datensatz nicht importieren kann oder wenn Ihr Datensatz nicht wie erwartet funktioniert.

**Zeitstempelformat**  
Für die Erfassungshäufigkeiten Jahr (`Y``M`), Monat (`W`), Woche (`D`) und Tag () unterstützt Forecast das `yyyy-MM-dd` Zeitstempelformat (z. B.`2019-08-21`) und optional das `HH:mm:ss` Format (z. B.`2019-08-21 15:00:00`).  
Für die Frequenzen Stunde (`H`) und Minute (`M`) unterstützt Forecast nur das `yyyy-MM-dd HH:mm:ss` Format (zum Beispiel`2019-08-21 15:00:00`).  
Richtlinie: Ändern Sie das Zeitstempelformat für die Sammlungshäufigkeit Ihres Datasets zum unterstützten Format.

**Amazon S3 S3-Datei oder Bucket**  
Wenn Sie einen Datensatz importieren, können Sie entweder den Pfad zu einer CSV- oder Parquet-Datei in Ihrem Amazon Simple Storage Service (Amazon S3) -Bucket angeben, der Ihre Daten enthält, oder den Namen des S3-Buckets, der Ihre Daten enthält. Wenn Sie eine CSV- oder Parquet-Datei angeben, importiert Forecast nur diese Datei. Wenn Sie einen S3-Bucket angeben, importiert Forecast alle CSV- oder Parquet-Dateien im Bucket, bis zu 10.000 Dateien. Wenn Sie mehrere Dateien importieren, indem Sie einen Bucket-Namen angeben, müssen alle CSV- oder Parquet-Dateien dem angegebenen Schema entsprechen.  
Richtlinie: Geben Sie eine bestimmte Datei oder einen S3-Bucket mit der folgenden Syntax an:  
`s3://bucket-name/example-object.csv`  
`s3://bucket-name/example-object.parquet`  
`s3://bucket-name/prefix/`  
`s3://bucket-name`  
Parquet-Dateien können die Erweiterung .parquet, .parq, .pqt oder gar keine Erweiterung haben.

**Vollständige Datensatz-Aktualisierungen**  
Ihr erster Datensatz-Import ist immer ein vollständiger Import. Bei nachfolgenden Importen kann es sich entweder um vollständige oder inkrementelle Aktualisierungen handeln. Sie müssen die Forecast-API verwenden, um den Importmodus anzugeben.  
Bei einer vollständigen Aktualisierung werden alle vorhandenen Daten durch die neu importierten Daten ersetzt. Da Jobs zum Import vollständiger Datensätze nicht aggregiert werden, ist Ihr letzter Datenimport derjenige, der beim Trainieren eines Prädiktors oder beim Generieren einer Prognose verwendet wird.  
Richtlinie: Erstellen Sie eine inkrementelle Datensatzaktualisierung, um Ihre neuen Daten an die vorhandenen Daten anzuhängen. Stellen Sie andernfalls sicher, dass Ihr letzter Datensatz-Import alle Daten enthält, die Sie modellieren möchten, und nicht nur die neuen Daten, die seit dem letzten Import gesammelt wurden.

**Inkrementelle Datensatzaktualisierungen**  
Felder wie Zeitstempel, Datenformat, Geolokalisierung usw. werden aus dem aktuell aktiven Datensatz gelesen. Sie müssen diese Informationen nicht in einen inkrementellen Datensatz-Import einbeziehen. Wenn sie enthalten sind, müssen sie mit den ursprünglich angegebenen Werten übereinstimmen.   
Richtlinie: Führen Sie einen vollständigen Datensatz-Import durch, um einen dieser Werte zu ändern.

**Attributreihenfolge**  
Die in der Schemadefinition angegebene Reihenfolge der Attribute muss der Spaltenreihenfolge in der CSV- oder Parquet-Datei entsprechen, die Sie importieren. Wenn Sie beispielsweise das erste Attribut `timestamp` definiert haben, `timestamp` muss es sich auch um die erste Spalte in der Eingabedatei handeln.   
Richtlinie: Stellen Sie sicher, dass die Spalten in der Eingabedatei dieselbe Reihenfolge haben wie die Schemaattribute, die Sie erstellt haben. 

**Wetterindex**  
Um den Wetterindex anwenden zu können, müssen Sie ein [Geolocation-Attribut](weather.md#adding-geolocation) in Ihre Zielzeitreihe und alle zugehörigen Zeitreihen-Datasets aufnehmen. Sie müssen auch [Zeitzonen für die Zeitstempel](weather.md#specifying-timezones) Ihrer Zielzeitreihen angeben.  
Richtlinie: Stellen Sie sicher, dass Ihre Datensätze ein Geolocation-Attribut enthalten und dass Ihren Zeitstempeln eine Zeitzone zugewiesen ist. [Weitere Informationen finden Sie im Wetterindex unter Bedingungen und Einschränkungen.](weather.md#weather-conditions-restrictions)

**Dataset-Header**  
Ein Datensatz-Header in Ihrer Eingabe-CSV kann zu einem Validierungsfehler führen. Wir empfehlen, einen Header für CSV-Dateien wegzulassen.  
Lösung: Löschen Sie den Dataset-Header, und versuchen Sie es erneut.  
Für Parquet-Dateien ist ein Datensatz-Header erforderlich. 

**Dataset-Status**  
Bevor Sie Trainingsdaten mit der [CreateDatasetImportJob](API_CreateDatasetImportJob.md) Operation importieren können, müssen Sie zunächst die Daten `Status` des Datensatzes importieren`ACTIVE`.   
Richtlinie: Verwenden Sie die [DescribeDataset](API_DescribeDataset.md)-Operation, um den Status des Datasets abzurufen. Wenn die Erstellung oder Aktualisierung des Datasets fehlgeschlagen ist, überprüfen Sie die Formatierung Ihrer Dataset-Datei, und versuchen Sie erneut, sie zu erstellen.

**Standarddateiformat**  
Das Standarddateiformat ist CSV. 

**Dateiformat und Trennzeichen**  
Forecast unterstützt nur das CSV-Dateiformat (Comma-Separated Values) und das Parquet-Format. Sie können Werte nicht mit Tabulatoren, Leerzeichen, Doppelpunkten oder anderen Zeichen voneinander trennen.  
Richtlinie: Konvertieren Sie Ihren Datensatz in das CSV-Format (verwenden Sie nur Kommas als Trennzeichen) oder das Parquet-Format und versuchen Sie erneut, die Datei zu importieren. 

**Dateiname**  
Dateinamen müssen mindestens ein alphabetisches Zeichen enthalten. Dateien mit ausschließlich numerischen Namen können nicht importiert werden.  
Richtlinie: Benennen Sie Ihre Eingabedatendatei um, sodass sie mindestens ein alphabetisches Zeichen enthält, und versuchen Sie erneut, die Datei zu importieren. 

**Partitionierte Parquet-Daten**  
Forecast liest keine partitionierten Parquet-Dateien.

**Anforderungen an den Datensatz für Was-wäre-wenn-Analysen**  
Für Was-wäre-wenn-Analysen sind CSV-Datensätze erforderlich. Die TimeSeriesSelector Ausführung der [CreateWhatIfAnalysis](API_CreateWhatIfAnalysis.md) Aktion und die TimeSeriesReplacementDataSource Ausführung von Parquet-Dateien werden [CreateWhatIfForecast](API_CreateWhatIfForecast.md) nicht akzeptiert.