Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Grundlegendes zur Exportzustellung
In den folgenden Abschnitten finden Sie Informationen zu Ihrer Exportlieferung.
-
Übergeordnete S3-Verzeichnisstruktur exportieren: Wie Exportdaten in dem S3-Verzeichnis strukturiert sind, in das Ihr Export geliefert wird.
-
Aktualisierung des Exports: Wie oft Ihr Export in Ihrem S3-Verzeichnis aktualisiert wird.
-
Überschreiben exportieren und neu erstellen: Wie sich Ihre Exportlieferung beim Überschreiben ändert und neue Versandeinstellungen erstellt werden.
-
Namen und Blöcke von Exportdatendateien: So werden die Exportdateien (Gzip/CSV oder Parquet) benannt.
Exportieren Sie die Struktur des übergeordneten S3-Verzeichnisses
Jeder Export liefert die Daten aus der Abfrage an S3 (als eine oder mehrere Dateien oder gzip/csv Parquet-Dateien) und eine Manifest.json Metadatendatei, die Informationen über die Exportdefinition zum Zeitpunkt der Ausführung des Exports enthält.
- Daten
-
Die aus der Exportabfrage resultierenden Daten werden im folgenden S3-Dateipfad gespeichert:
s3://<bucket-name>/<prefix>/<export-name>/data/<partition>/Die Partition entspricht der Tabelle, die abgefragt wird. Für CUR 2.0 entspricht die Partition dem „Abrechnungszeitraum“ eines bestimmten CUR 2.0-Exports.
prefix: Das S3-Dateipräfix, das Sie dem Export zuweisen.export-name: Der Name, den Sie dem Export zuweisen.partition: Die Partition beschreibt, wie eine einzelne Tabelle für die Auslieferung in separate Tabellen partitioniert wird. Für CUR 2.0 entspricht die Partition dem „Abrechnungszeitraum“ im Format.BILLING_PERIOD=YYYY-MMDie Partition für November 2023 lautet beispielsweise 2023-11.Im Folgenden finden Sie ein Beispiel für einen S3-Dateipfad:
s3://my-data-export-s3-bucket/my-cur-files/business_group_a_cur/data/BILLING_PERIOD=2023-11 - Metadaten
-
Die
Manifest.jsonMetadatendatei für die Abfrage wird im folgenden S3-Dateipfad gespeichert:s3://<bucket-name>/<prefix>/<export-name>/metadata/<partition>/<export-name>-Manifest.jsonDie
Manifest.jsonDatei wird jedes Mal aktualisiert, wenn der Export aktualisiert wird. Für jede neue Partition, die durch den Export erstellt wird, wird eine neueManifest.jsonDatei erstellt. Für CUR 2.0 bedeutet dies, dass eine neueManifest.jsonDatei generiert wird, wenn ein neuer Abrechnungszeitraum beginnt.Manifestdateien enthalten die folgenden Informationen:
-
Alle Spalten, die im Export enthalten sind.
-
Eine Liste der Exportdateien und ihres Dateipfads. Wir empfehlen, diese Liste programmgesteuert zu lesen, um herauszufinden, welche Dateien aufgenommen werden sollen.
-
Der Zeitraum, der vom Export abgedeckt wird.
Die
Manifest.jsonwird erst geliefert, wenn alle Exportdatendateien an S3 geliefert wurden. -
Aktualisierung des Exports
Bei Datenexporten werden Ihre Exporte jedes Mal aktualisiert, wenn die Quelldaten aktualisiert werden. Bei CUR 2.0 erfolgt dies mindestens einmal täglich. Der aktuelle Abrechnungszeitraum (Partition) wird aktualisiert, bis der Abrechnungszeitraum endet. Ab diesem Zeitpunkt beginnen die Lieferungen des nächsten Abrechnungszeitraums. Lieferungen des nächsten Abrechnungszeitraums enthalten nur Gebühren und Abrechnungsdaten für diesen Abrechnungszeitraum. Nach Ablauf des Abrechnungszeitraums AWS kann die Exportlieferung für den vorherigen Abrechnungszeitraum innerhalb der ersten zwei Wochen nach Ablauf des Abrechnungszeitraums aktualisiert werden.
Exportieren, überschreiben und neu erstellen
Wenn Sie einen Export erstellen, können Sie wählen, ob Sie entweder neue Exportdateien erstellen oder die vorhandenen Exportdateien bei jeder Aktualisierung überschreiben möchten.
- Neues erstellen
-
Beim Erstellen neuer Exportdateien wird mehr S3-Speicherplatz beansprucht, da alle Exportaktualisierungen beibehalten werden. Das Überschreiben der vorherigen Exportdateien verbraucht weniger S3-Speicherplatz, da nur die neueste Version jeder Aktualisierung des Abrechnungszeitraums beibehalten wird.
Im Modus „Neu erstellen“ werden die Exportdateien an den folgenden S3-Pfad übermittelt:
s3://<bucket-name>/<prefix>/<export-name>/data/<partition>/<timestamp>-<execution-id>Das
timestampist das Datum und die Uhrzeit der Ausführung des Exports. Dasexecution-idist die eindeutige ID, die der Ausführung zugewiesen wurde.Bei „Neu erstellen“ werden bei jeder Exportausführung zwei
Manifest.jsonDateien geliefert. Eine wird immetadata/<partition>/<timestamp>-<execution-id>Verzeichnis gespeichert und die andere wird immetadata/<partition>Verzeichnis überschrieben. Das Manifest immetadata/<partition>Verzeichnis stellt immer die letzte Aktualisierung dar, und ihre Daten werden verwendet, um den Speicherort der zuletzt aktualisierten Exportdateien zu identifizieren. - Überschreiben
-
Das Überschreiben gilt nur für Aktualisierungen derselben Partition (d. h. für den Abrechnungszeitraum). Sobald ein neuer Abrechnungszeitraum beginnt, erstellt der Export ein neues S3-Verzeichnis mit einem Namen, der auf der letzten Partition oder dem letzten Abrechnungszeitraum basiert, und beginnt, die neue Exportpartition dort bereitzustellen. Der Export der vorherigen Partition wird nicht überschrieben, es sei denn, die Daten für diese spezifische Partition werden aktualisiert.
Im Modus „Überschreiben“ werden die Exportdateien an den folgenden S3-Pfad übermittelt:
s3://<bucket-name>/<prefix>/<export-name>/data/<partition>/Die Exportdateien in diesem Dateiverzeichnis werden bei jeder Lieferung derselben Partition (d. h. bei jedem Abrechnungszeitraum) überschrieben.
Exportdateien werden als mehrere „Chunks“ (separate Dateien gzip/csv oder Parquet-Dateien) geliefert, wenn der Export ausreichend groß ist. Wenn der Export im Laufe des Monats an Größe verliert (aufgrund einer geänderten Abfrage oder Korrektur von Daten), sind möglicherweise weniger Chunks erforderlich, um die Exportaktualisierung durchzuführen. In diesem Fall überschreibt Data Exports alle zusätzlichen Blöcke aus der letzten Aktualisierung mit leeren Daten.
Zum Überschreiben wird bei jeder
Manifest.jsonExportausführung eine Datei geliefert. Sie wird immetadata/<partition>Verzeichnis gespeichert und bei jeder Aktualisierung überschrieben.
Exportieren Sie Datendateinamen und -blöcke
Exporte liefern entweder die Ergebnisse einer Ausführung als eine Datei (gzip/csv or Parquet) or in multiple “chunks” (separate gzip/csvoder als Parquet-Dateien), wenn der Export ausreichend groß wird.
Exporte werden für das gzip/csv Dateiformat wie folgt benannt:
<export-name>-<chunk-number>.csv.gz
Exporte werden für das Parquet-Format wie folgt benannt:
<export-name>-<chunk-number>.snappy.parquet
Blocknummern haben immer fünf Ziffern. Chunk-Nummern werden ab. 00001
Zusammenfassung
- Exportieren Sie Datendateinamen mit Verzeichnis, um neue zu erstellen
-
Parquet:
s3://<bucket-name>/<prefix>/<export-name>/data/<partition>/<timestamp>-<execution-id>/<export-name>-<chunk-number>.snappy.parquetgzip/csv:
s3://<bucket-name>/<prefix>/<export-name>/data/<partition>/<timestamp>-<execution-id>/<export-name>-<chunk-number>.csv.gz - Datendateinamen mit Verzeichnis zum Überschreiben exportieren
-
Parquet:
s3://<bucket-name>/<prefix>/<export-name>/data/<partition>/<export-name>-<chunk-number>.snappy.parquetgzip/csv:
s3://<bucket-name>/<prefix>/<export-name>/data/<partition>/<export-name>-<chunk-number>.csv.gz - Manifest-Dateinamen mit Verzeichnis zum Erstellen eines neuen
-
Der Modus „Neu erstellen“ liefert
Manifest.jsonan zwei Speicherorte.Der erste Speicherort befindet sich in einem Ordner, der eine bestimmte Ausführung eines Exports darstellt (benannt nach
timestampundexecution-id). Dieses Manifest entspricht dieser spezifischen Ausführung. Der Dateipfad lautet wie folgt:s3://<bucket-name>/<prefix>/<export-name>/metadata/<partition>/<timestamp>-<execution-id>Der zweite Speicherort befindet sich in einem Partitionsordner, der alle Ausführungen enthält. Dieses Manifest ist dieselbe Datei wie bei der letzten Ausführung des Exports. Sie können dieses Manifest lesen, um die genauen Dateipfade aller zuletzt exportierten Dateien zu identifizieren. Der Dateipfad lautet wie folgt:
s3://<bucket-name>/<prefix>/<export-name>/metadata/<partition>/Manifest.json - Manifest-Dateinamen mit Verzeichnis zum Überschreiben
-
Der Modus „Überschreiben“ liefert
Manifest.jsonan einen Ort.s3://<bucket-name>/<prefix>/<export-name>/metadata/<partition>Das Manifest in diesem Verzeichnis wird bei jeder Aktualisierung einer bestimmten Partition (d. h. bei jedem Abrechnungszeitraum) überschrieben.