Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Ablauffrist für Tabellen aufzeichnen
Standardmäßig laufen Datensätze in Ihren S3-Tabellen nicht ab. Um die Speicherkosten für Ihre Tabellen zu minimieren, können Sie das Ablaufen von Datensätzen für die Tabellen aktivieren und konfigurieren. Mit dieser Option entfernt Amazon S3 automatisch Datensätze aus einer Tabelle, wenn die Datensätze ablaufen.
Wenn Sie das Ablaufen von Datensätzen für eine Tabelle aktivieren, geben Sie an, wie viele Tage Datensätze in der Tabelle aufbewahrt werden sollen, bevor die Datensätze ablaufen. Dabei kann es sich um eine beliebige Anzahl von Tagen handeln, die von einem Tag bis zu 2.147.483.647 Tagen reichen. Um beispielsweise Tabellendatensätze für ein Jahr aufzubewahren, geben Sie Tage an. 365 Die Datensätze bleiben dann 365 Tage lang bestehen. Nach 365 Tagen laufen die Datensätze ab und Amazon S3 entfernt sie automatisch.
Sie können den Ablauf von Datensätzen für AWS verwaltete Tabellen aktivieren und konfigurieren, in denen bestimmte Datensätze aus bestimmten AWS-Services, derzeit Amazon S3 Storage Lens und Amazon SageMaker Catalog, gespeichert werden. Optionen für das Ablaufen von Datensätzen sind derzeit für andere AWS verwaltete Tabellen nicht verfügbar. Die Ausnahme bilden Journaltabellen Amazon S3 S3-Metadaten. Journaltabellen verwenden unterschiedliche Einstellungen für das Ablaufen von Datensätzen, die Sie auf der Service-Ebene angeben. Informationen zum Konfigurieren des Ablaufs von Datensätzen für diesen Tabellentyp finden Sie unterAblauf von Journaltabellen-Datensätzen. Beachten Sie, dass Optionen für das Ablaufen von Datensätzen für S3-Tabellen, die Sie erstellen, nicht verfügbar sind.
Nachdem Sie den Ablauf von Datensätzen für eine Tabelle aktiviert haben, können Sie ihn jederzeit deaktivieren. Amazon S3 läuft dann nicht mehr ab und entfernt keine Datensätze mehr aus der Tabelle.
Themen
So funktioniert das Ablaufen von Datensätzen
Der Ablauf von Datensätzen entfernt automatisch Datensätze aus einer S3-Tabelle, wenn die Datensätze älter sind als die Anzahl von Tagen, die Sie in den Einstellungen für das Ablaufen von Datensätzen für die Tabelle angegeben haben. Um zu bestimmen, wann Datensätze ablaufen, verwendet Amazon S3 bestimmte Zeitstempel in den Datensätzen. Die Wahl der Zeitstempelspalte leitet sich direkt aus dem Tabellenschema für eine Tabelle ab. Sie müssen nicht angeben, welche Zeitstempelspalte verwendet werden soll. Die Tabellen werden von verwaltet AWS und Amazon S3 wählt automatisch die entsprechende Spalte aus, die verwendet werden soll, wenn Sie das Ablaufen von Datensätzen für eine Tabelle aktivieren.
Sie können Einstellungen für das Ablaufen von Datensätzen für AWS verwaltete Tabellen aktivieren und konfigurieren, in denen bestimmte Amazon S3 Storage Lens-Metriken oder spezifische Amazon SageMaker Catalog-Metadaten gespeichert werden. Optionen für das Ablaufen von Datensätzen sind für die folgenden AWS verwalteten Tabellen für diese Dienste verfügbar:
-
S3-Speicherlinse —
bucket_property_metricsdefault_activity_metrics,default_storage_metrics,expanded_prefixes_activity_metrics, undexpanded_prefixes_storage_metrics. Um zu ermitteln, wann Datensätze in diesen Tabellen ablaufen, verwendet Amazon S3 dasreport_timeFeld in den Datensätzen. -
SageMaker Amazon-Katalog —
ASSET. Um zu bestimmen, wann Datensätze in dieser Tabelle ablaufen, verwendet Amazon S3 dassnapshot_timeFeld in den Datensätzen.
Nachdem Sie den Ablauf von Datensätzen für eine Tabelle aktiviert haben, startet Amazon S3 mit der Ausführung von Datensatzablaufjobs, die die folgenden Operationen für die Tabelle ausführen:
-
Identifizieren Sie Datensätze, die älter als die angegebene Ablaufeinstellung sind.
-
Erstellen Sie einen neuen Snapshot, der Verweise auf die abgelaufenen Datensätze ausschließt.
Das Entfernen basiert auch auf dem Ablauf des Snapshots und den Einstellungen für das Entfernen nicht referenzierter Dateien in den Wartungskonfigurationseinstellungen für die Tabelle. Weitere Informationen zu diesen Einstellungen finden Sie unterWartung von Tabellen.
Warnung
Amazon S3 läuft ab und entfernt Datensätze innerhalb von 24 bis 48 Stunden, nachdem die Datensätze ablaufen können. Tabellendatensätze werden aus dem letzten Snapshot entfernt. Daten und Speicherplatz für die Datensätze werden bei der Tabellenverwaltung entfernt. Tabellendatensätze können nach ihrem Ablauf nicht wiederhergestellt werden.
Den Ablauf von Datensätzen für eine Tabelle konfigurieren
Sie können die Einstellungen für das Ablaufen von Datensätzen für eine S3-Tabelle aktivieren, konfigurieren und anderweitig verwalten, indem Sie die Amazon S3 S3-Konsole, die Amazon S3 S3-REST-API, AWS Command Line Interface (AWS CLI) oder verwenden AWS SDKs.
Bevor Sie versuchen, diese Aufgaben für eine Tabelle auszuführen, stellen Sie sicher, dass Sie über die folgenden AWS Identity and Access Management (IAM-) Berechtigungen verfügen:
-
s3tables:GetTableRecordExpirationConfiguration— Mit dieser Aktion können Sie auf die aktuellen Einstellungen für das Ablaufen von Datensätzen für Tabellen zugreifen. -
s3tables:PutTableRecordExpirationConfiguration— Mit dieser Aktion können Sie Einstellungen für das Ablaufen von Datensätzen für Tabellen aktivieren, konfigurieren und deaktivieren. -
s3tables:GetTableRecordExpirationJobStatus— Mit dieser Aktion können Sie den Status von Vorgängen zum Ablaufen von Datensätzen (Jobs) für Tabellen und die Zugriffsmetriken für die Vorgänge überwachen.
In den folgenden Abschnitten wird erklärt, wie Sie die Einstellungen für das Ablaufen von Datensätzen für eine Tabelle mithilfe der Amazon S3 S3-Konsole und der aktivieren, konfigurieren und deaktivieren AWS CLI. Verwenden Sie den PutTableRecordExpirationConfigurationVorgang, um diese Aufgaben mit der Amazon S3 S3-REST-API oder einem AWS SDK auszuführen. Weitere Informationen finden Sie unter Entwickeln mit Amazon S3 in der Amazon Simple Storage Service API-Referenz.
Gehen Sie wie folgt vor, um die Einstellungen für das Ablaufen von Datensätzen für eine S3-Tabelle mithilfe der Konsole zu aktivieren und zu konfigurieren.
Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/
. -
Wählen Sie im linken Navigationsbereich Tabellen-Buckets aus.
-
Wählen Sie auf der Seite Tabellen-Buckets den Bucket aus, in dem die Tabelle gespeichert ist.
-
Wählen Sie auf der Registerkarte Tabellen die Tabelle aus.
-
Wählen Sie auf der Registerkarte Wartung im Abschnitt Ablauf des Datensatzes die Option Bearbeiten aus.
-
Wählen Sie unter Ablauf des Datensatzes die Option Aktivieren aus.
-
Geben Sie für Tage, nach denen Datensätze ablaufen, die Anzahl der Tage ein, für die Datensätze in der Tabelle aufbewahrt werden sollen. Dies kann eine beliebige ganze Zahl im Bereich von 1 bis 2.147.483.647 sein. Um beispielsweise Datensätze für ein Jahr aufzubewahren, geben Sie ein.
365Warnung
Beachten Sie bei der Festlegung des geeigneten Aufbewahrungszeitraums für Datensätze in der Tabelle, dass Datensätze nach deren Ablauf nicht wiederhergestellt werden können.
-
Wählen Sie Änderungen speichern aus.
Um den Aufbewahrungszeitraum anschließend zu ändern, wiederholen Sie die vorherigen Schritte.
Um anschließend den Ablauf von Datensätzen zu deaktivieren, wiederholen Sie die Schritte 1 bis 5. Wählen Sie dann für Schritt 6 die Option Deaktivieren aus. Wenn Sie die gewünschten Änderungen vorgenommen haben, wählen Sie Save changes (Änderungen speichern) aus.
Um die Einstellungen für das Ablaufen von Datensätzen für eine S3-Tabelle mithilfe von zu konfigurieren und zu verwalten AWS CLI, führen Sie den put-table-record-expiration-configurationBefehl aus.
Sie können damit beginnen, eine JSON-Datei zu erstellen, die die Einstellungen für das Ablaufen von Datensätzen enthält, die auf die Tabelle angewendet werden sollen. Das folgende Beispiel zeigt den Inhalt einer JSON-Datei, die das Ablaufen von Datensätzen für eine Tabelle aktiviert. Es gibt auch eine Aufbewahrungsfrist von 30 Tagen für Datensätze in der Tabelle an. Mit anderen Worten, es gibt an, dass Tabelleneinträge nach 30 Tagen ablaufen sollen.
{ "status": "enabled", "settings": { "days":30{ }
Um das vorherige Beispiel zu verwenden, ersetzen Sie das durch Ihre eigenen Informationen.user input
placeholders
Warnung
Beachten Sie bei der Festlegung des geeigneten Aufbewahrungszeitraums für Datensätze in der Tabelle, dass Datensätze nach deren Ablauf nicht wiederhergestellt werden können.
Um das Ablaufen von Datensätzen für eine Tabelle zu deaktivieren, geben Sie disabled für das status Feld einen Wert an und lassen Sie das settings Objekt aus der Datei weg. Beispiel:
{ "status": "disabled" }
Nachdem Sie eine JSON-Datei mit den anzuwendenden Einstellungen erstellt haben, führen Sie den put-table-record-expiration-configuration Befehl aus. Geben Sie für den table-arn Parameter den Amazon-Ressourcennamen (ARN) der Tabelle an. Geben Sie für den value Parameter den Namen der Datei an, in der die Einstellungen gespeichert sind.
Mit dem folgenden Befehl werden beispielsweise die Einstellungen für das Ablaufen von Datensätzen für eine Tabelle aktualisiert. Die Einstellungen werden in einer Datei mit dem Namen angegeben.record-expiration-config.json
aws s3tables put-table-record-expiration-configuration \ --table-arn arn:aws:s3tables:us-east-1:123456789012:bucket/amzn-s3-demo-table-bucket/table/amzn-s3-demo-table\ --valuefile://./record-expiration-config.json
Um das vorherige Beispiel zu verwenden, ersetzen Sie die durch Ihre eigenen Informationen.user input
placeholders
Überwachen des Ablaufs von Datensätzen für eine Tabelle
Um den Status und die Ergebnisse von Vorgängen zum Ablaufen von Datensätzen für Ihre S3-Tabellen zu überwachen, verwenden Sie den GetTableRecordExpirationJobStatusVorgang oder, falls Sie den verwenden AWS CLI, führen Sie den get-table-record-expiration-job-statusBefehl aus. Geben Sie in Ihrer Anfrage den Amazon-Ressourcennamen (ARN) der Tabelle an.
Mit dem folgenden AWS CLI Befehl wird beispielsweise der Status von Vorgängen zum Ablaufen von Datensätzen für eine bestimmte Tabelle in einem Tabellen-Bucket abgerufen. Wenn Sie dieses Beispiel verwenden möchten, ersetzen Sie die (Platzhalter für Benutzereingaben) durch Ihre Informationen.user input placeholders
aws s3tables get-table-record-expiration-job-status \ --table-arn arn:aws:s3tables:us-east-1:123456789012:bucket/amzn-s3-demo-table-bucket/table/amzn-s3-demo-table
Wenn Ihre Anfrage erfolgreich ist, erhalten Sie eine Antwort mit Informationen, z. B. wann Amazon S3 zuletzt Vorgänge zum Ablaufen von Datensätzen für die Tabelle ausgeführt hat, und den Status dieser Ausführung. Wenn die letzte Ausführung erfolgreich war, enthält die Antwort auch Verarbeitungsmetriken, z. B. die Anzahl der Datendateien und Datensätze, die entfernt wurden, und die Gesamtgröße der entfernten Daten. Wenn bei der letzten Ausführung Fehler aufgetreten sind, enthält die Antwort eine Fehlermeldung, in der beschrieben wird, warum die Ausführung fehlgeschlagen ist.
Überlegungen
Beachten Sie bei der Konfiguration und Verwaltung der Einstellungen für das Ablaufen von Datensätzen für Ihre AWS verwalteten S3-Tabellen Folgendes:
-
Das Ablaufen von Datensätzen ist nur für bestimmte AWS verwaltete Tabellen verfügbar AWS-Services, die mit Amazon S3 Storage Lens und Amazon SageMaker Catalog erstellt wurden. Darüber hinaus ist der Ablauf von Datensätzen nur für einzelne Tabellen und nicht für ganze Tabellen-Buckets verfügbar.
-
Um zu bestimmen, wann Datensätze ablaufen, verwendet Amazon S3 bestimmte Zeitstempel in den Tabellen. Diese Zeitstempel geben an, wann die Daten erstellt wurden, nicht wann Amazon S3 die Datensätze in eine Tabelle aufgenommen hat. Die verwendete Zeitstempelspalte hängt vom Service ab, der die Tabelle veröffentlicht: für S3 Storage Lens-Metriken das
report_timeFeld und für Amazon SageMaker Catalog-Metadaten dassnapshot_timeFeld. Sie können nicht angeben, welches Feld verwendet werden soll, da die Tabellen von AWS verwaltet werden. -
Wenn es beim Export von Daten in eine Tabelle zu Verzögerungen kommt, kann es sein, dass Datensätze früher als erwartet ablaufen. Aus diesem Grund empfehlen wir, mögliche Verzögerungen bei der Datenaufnahme zu berücksichtigen, indem Sie in den Ablaufeinstellungen für Ihre Tabellen einen Puffer zur Aufbewahrungsdauer hinzufügen.
-
Datensätze laufen ab und werden innerhalb von 24 bis 48 Stunden entfernt, nachdem sie für den Ablauf in Frage kommen. Amazon S3 läuft nicht ab und entfernt Datensätze sofort, nachdem sie für den Ablauf in Frage kommen.
-
Datensätze können nicht wiederhergestellt werden, nachdem sie abgelaufen sind und entfernt wurden.