Integrazione Zero-ETL di DynamoDB con Amazon Redshift

L’integrazione Zero-ETL di Amazon DynamoDB con Amazon Redshift consente un’analisi fluida dei dati DynamoDB senza codice. Questa funzionalità completamente gestita replica automaticamente le tabelle DynamoDB in un database Amazon Redshift in modo che gli utenti possano eseguire query e analisi SQL sui propri dati DynamoDB senza dover configurare complessi processi ETL. L’integrazione funziona replicando i dati dalla tabella DynamoDB al database Amazon Redshift.

Per configurare l’integrazione, è sufficiente specificare una tabella DynamoDB come origine e un database Amazon Redshift come destinazione. All’attivazione, l’integrazione esporta la tabella DynamoDB completa per popolare il database Amazon Redshift. Il tempo richiesto per il completamento di questo processo iniziale dipende dalle dimensioni della tabella DynamoDB. L’integrazione Zero-ETL replica quindi in modo incrementale gli aggiornamenti da DynamoDB ad Amazon Redshift ogni 15 – 30 minuti utilizzando le esportazioni incrementali di DynamoDB. Ciò significa che i dati DynamoDB replicati in Amazon Redshift vengono aggiornati automaticamente.

Una volta terminata la configurazione, gli utenti possono analizzare i dati DynamoDB in Amazon Redshift tramite client e strumenti SQL standard, senza influire sulle prestazioni delle tabelle DynamoDB. Eliminando il complesso processo ETL, questa integrazione Zero-ETL offre un modo semplice e veloce per ottenere approfondimenti da DynamoDB attraverso le funzionalità di analisi e machine learning di Amazon Redshift.

Argomenti

Prerequisiti per creare un’integrazione Zero-ETL di DynamoDB con Amazon Redshift

Prima di procedere all’integrazione è necessario creare la tabella DynamoDB di origine e il cluster Amazon Redshift di destinazione. Queste informazioni sono trattate in Fase 1: configurare una tabella DynamoDB di origine e Fase 2: creare un data warehouse Amazon Redshift.
Un'integrazione zero-ETL tra Amazon DynamoDB e Amazon Redshift richiede che la tabella DynamoDB di origine abbia il ripristino (PITR) abilitato. Point-in-time

Per le policy basate sulle risorse, l'integrazione zero-ETL richiede una policy basata sulle risorse collegata direttamente alla tabella DynamoDB. Questa policy in linea concede al servizio Amazon Redshift l'autorizzazione ad accedere ai dati della tabella per la replica. Per ulteriori informazioni sulle politiche basate sulle risorse per DynamoDB, vedere Utilizzo delle politiche basate sulle risorse per DynamoDB.

Se crei l'integrazione in cui la tabella DynamoDB e il data warehouse Amazon Redshift si trovano nello stesso account, puoi utilizzare l'opzione Fix it for me durante la fase di creazione dell'integrazione per applicare automaticamente le politiche di risorse richieste sia a DynamoDB che ad Amazon Redshift.

Se crei un'integrazione in cui la tabella DynamoDB e il data warehouse Amazon Redshift si trovano in account AWS diversi, dovrai applicare manualmente la seguente politica delle risorse sulla tabella DynamoDB.

Potrebbe anche essere necessario configurare la policy basata su risorse sul proprio data warehouse Amazon Redshift. Per ulteriori informazioni, consulta Configurazione dell’autorizzazione usando l’API Amazon Redshift.

Identity-based Per le politiche:

L’utente che crea l’integrazione necessita di una policy basata su identità che autorizzi le seguenti azioni: GetResourcePolicy, PutResourcePolicy e UpdateContinuousBackups.

Nota

I seguenti esempi di policy mostreranno la risorsa come arn:aws:redshift{-serverless}. Questo esempio dimostra che l’ARN può essere arn:aws:redshift o arn:aws:redshift-serverless a seconda del fatto che il namespace sia un cluster Amazon Redshift o un namespace Amazon Redshift serverless.

L’utente responsabile della configurazione del namespace Amazon Redshift di destinazione necessita di una policy basata su identità che autorizzi le seguenti azioni: PutResourcePolicy, DeleteResourcePolicy e GetResourcePolicy.

Autorizzazioni della chiave di crittografia

Se la tabella DynamoDB di origine è crittografata tramite una chiave AWS KMS gestita dal cliente, sarà necessario aggiungere la seguente policy alla propria chiave KMS. Questa policy consente ad Amazon Redshift di poter esportare dati dalla tabella crittografata attraverso la chiave KMS.


{
    "Sid": "AllowRedshiftDecryptSourceTable",
    "Effect": "Allow",
    "Principal": {
        "Service": [
            "redshift.amazonaws.com"
        ]
    },
    "Action": "kms:Decrypt",
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "aws:SourceAccount": "<account>"
        },
        "ArnEquals": {
            "aws:SourceArn": "arn:aws:redshift:<region>:<account>:integration:*"
        }
    }
}

È anche possibile seguire la procedura riportata nella Getting started with zero-ETL integrations nella Guida alla gestione di Amazon Redshift per configurare le autorizzazioni del namespace Amazon Redshift.

Limitazioni dell’utilizzo delle integrazioni Zero-ETL di DynamoDB con Amazon Redshift

Le seguenti limitazioni generali si applicano alla versione corrente di questa integrazione e potrebbero cambiare nelle versioni successive.

Nota

Oltre alle limitazioni riportate di seguito, consulta anche le considerazioni generali sull’utilizzo delle integrazioni Zero-ETL (vedi Considerations when using zero-ETL integrations with Amazon Redshift nella Guida alla gestione di Amazon Redshift).

La tabella DynamoDB e il cluster Amazon Redshift devono trovarsi nella stessa Regione.
La tabella DynamoDB di origine deve essere crittografata con una chiave o Amazon-owned . Customer-managed AWS KMS La crittografia gestita da Amazon non è supportata per la tabella DynamoDB di origine.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Cross-account considerazioni sull'integrazione con CMK

Creazione di integrazioni Zero-ETL di DynamoDB