Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Zusammenfassung der Migrationsoptionen
In dieser Tabelle sind die wichtigsten Merkmale und Überlegungen für jede Migrationsoption zusammengefasst.
Merkmal |
Migration vor Ort |
Migration vor Ort |
Vollständige Datenmigration |
---|---|---|---|
Verbesserungen des Datenlayouts im Rahmen des Migrationsprozesses |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Unterstützte Dateiformate |
Parquet, Avro, ORC |
Parkett, Avro, ORC |
Parkett, Avro, ORC, JSON, CSV |
Ersatz der Quelltabelle durch eine Iceberg-Tabelle |
(erstellt eine neue Tabelle, aber mit zusätzlichen Schritten können Sie die Quelltabelle ersetzen) |
(erstellt eine Backup-Tabelle und ersetzt die Quelltabelle durch eine Iceberg-Tabelle) |
(erstellt eine neue Tabelle) |
Auswirkung auf die Quelltabelle |
|||
|
Korrumpiert die Quelltabelle |
Korrumpiert die Backup-Tabelle |
Sicher, Quelle nicht betroffen |
Auswirkung auf den Eisberg-Tisch |
|||
|
Korrumpiert die Iceberg-Tabelle |
Korrumpiert die Eisberg-Tabelle |
Keine Auswirkungen auf die Iceberg-Tabelle |
|
In der neuen Tabelle nicht sichtbar (Partition muss mit integriert werden |
Auf der neuen Tabelle nicht sichtbar (Partition muss mit integriert werden |
Auf der neuen Tabelle nicht sichtbar (Ich brauche |
Kosten |
Niedrig |
Niedrig |
Höher (vollständige Datenumschreibung) |
Geschwindigkeit der Migration |
Schnell |
Schnell |
Langsamer |
Kann für die Migration zu Amazon S3 S3-Tabellen verwendet werden |
|
|
|
Erfordert manuelles DDL |
(Schema und Partitionen werden aus der Quelltabelle kopiert) |
(Schema und Partitionen werden aus der Quelltabelle kopiert) |
Wenn Sie CTAS verwenden, müssen Sie nur die Partitionierung angeben |
Beste Verwendung |
Schnelle Migration ohne Umschreiben von Daten, sodass Hive und Iceberg für Tests oder schrittweise Umstellung side-by-side verwendet werden können. |
Ersetzen einer Hive-Tabelle an Ort und Stelle, ohne Daten neu zu schreiben, wenn eine sofortige Umstellung akzeptabel ist. |
Vollständige Iceberg-Optimierung mit Datenumschreibung. Ideal für die Neugestaltung von Partitionen oder Schemas oder für die Verbesserung von Layout und Leistung. Immer empfehlenswert, wenn möglich. |