Ottimizzazione di conservazione degli snapshot
La funzionalità di conservazione degli snapshot di Apache Iceberg consente agli utenti di effettuare query sui dati storici in momenti specifici e ripristinare le modifiche indesiderate alle tabelle. Nel catalogo dati AWS Glue, la configurazione per la conservazione degli snapshot controlla per quanto tempo questi snapshot (versioni dei dati della tabella) vengono mantenuti prima che scadano e vengano rimossi. Ciò aiuta a gestire i costi di archiviazione e il sovraccarico dei metadati rimuovendo automaticamente gli snapshot meno recenti in base a un periodo di conservazione configurato o al numero massimo di snapshot da conservare.
È possibile configurare il periodo di conservazione in giorni e il numero massimo di snapshot da mantenere per una tabella. AWS Glue rimuove gli snapshot meno recenti del periodo di conservazione specificato dai metadati della tabella, mantenendo gli snapshot più recenti fino al limite configurato. Dopo aver rimosso gli snapshot precedenti dai metadati, AWS Glue elimina i file di dati e metadati corrispondenti a cui non fanno più riferimento gli snapshot scaduti. In questo modo, è possibile effettuare query temporali solo fino ai restanti snapshot conservati, recuperando al contempo lo spazio di archiviazione utilizzato dai dati degli snapshot scaduti.