Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bewährte Methoden
Wir empfehlen die folgenden bewährten Methoden für den Zugriff auf archivierte Daten:
-
Für große Archivdatensätze empfehlen wir, zusätzlich zu den Daten AWS Glue Glue-Tabellen zu erstellen, damit sie mit Abfrage-Engines wie Athena und Amazon Redshift gelesen werden können. Sowohl Athena als auch Amazon Redshift bieten eine horizontale Skalierung der Abfrageleistung. Sie verwenden auch ein pay-per-query Modell, das in einem einmaligen Abfrageszenario kostengünstig ist. Darüber hinaus verfügt Amazon Redshift über Advanced Query Accelerator (AQUA) -Engines unter der Haube, die die Leseleistung ohne zusätzliche Kosten beschleunigen.
-
Archivierte Daten, die regelmäßig in Amazon S3 ausgelagert werden, sollten nicht als Heap-Dump gespeichert werden. Stattdessen sollten sie als neue Partition gespeichert werden. Eine Datumspartition unterteilt Daten in Datumsdimensionen (z. B.
year=<value>/month=<value>/day=<value>). Dies ist in zwei Situationen äußerst vorteilhaft:-
Wenn AWS Glue Glue-Tabellen von AWS Glue Glue-Crawlern erstellt werden, agieren diese Partitionen als Pseudospalten. Dies verbessert die Leseleistung, indem die gescannten Daten auf die Partitionen in der Bereichsabfrage beschränkt werden.
-
Dies hilft bei einem S3 Glacier-Wiederherstellungsvorgang, wenn Sie nur eine Teilmenge des Objekts als S3 Standard wiederherstellen.
-
-
AWS Glue Glue-Crawler sind von großem Nutzen, wenn archivierte Daten, die in Amazon S3 gespeichert sind, physisch partitioniert werden. Jedes Mal, wenn diese Daten als neue Präfixpartition ausgelagert werden, scannt der Crawler nur die neue Partition und aktualisiert die Metadaten für diese Partition. Wenn sich das Schema der Tabelle ändert, werden diese Änderungen in Metadaten auf Partitionsebene erfasst.