Cluster con provisioning di Amazon Redshift - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuovi Python a UDFs partire dal 1° novembre 2025. Se vuoi usare Python UDFs, crea la UDFs data precedente a quella data. Python esistente UDFs continuerà a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cluster con provisioning di Amazon Redshift

Un data warehouse Amazon Redshift è costituito da un insieme di risorse di calcolo denominate nodi, strutturate in un gruppo denominato cluster. Ciascun cluster esegue un motore Amazon Redshift e contiene uno o più database.

Nota

Al momento è disponibile il motore Amazon Redshift versione 1.0. Tuttavia, poiché il motore viene costantemente aggiornato, è possibile che siano disponibili più versioni del motore Amazon Redshift.

Cluster e nodi in Amazon Redshift

Un cluster Amazon Redshift è costituito da nodi. Ogni cluster include un nodo principale e uno o più nodi di calcolo. Il nodo principale riceve le query dalle applicazioni client, analizza le query e quindi genera i piani di esecuzione delle query. Il nodo principale coordina quindi l'esecuzione parallela di questi piani con i nodi di calcolo e aggrega i risultati intermedi da tali nodi. Restituisce infine i risultati alle applicazioni client.

I nodi di calcolo eseguono i piani di esecuzione delle query e si scambiano i dati necessari per elaborare tali query. I risultati intermedi vengono quindi inviati al nodo principale per l'aggregazione prima di essere reinviati alle applicazioni client. Per ulteriori informazioni sui nodi principali e sui nodi di calcolo, consultare Architettura del sistema di data warehouse nella Guida per gli amministratori di database di Amazon Redshift.

Nota

Quando si crea un cluster nella console Amazon Redshift (https://console.aws.amazon.com/redshiftv2/), è possibile ottenere un suggerimento sulla configurazione del cluster in base alla dimensione dei dati e alle caratteristiche della query. Per utilizzare questo calcolatore di dimensionamento, ricercare Aiutami a scegliere nella console nelle regioni AWS che supportano i tipi di nodo RA3. Per ulteriori informazioni, consultare Creazione di un cluster.

Quando si avvia un cluster, una delle opzioni da specificare è il tipo di nodo. Il tipo di nodo determina la CPU, la RAM, la capacità di storage e il tipo di unità di storage per ciascun nodo.

Amazon Redshift offre diversi tipi di nodo per accogliere i carichi di lavoro. Consigliamo di scegliere RA3 o DC2 a seconda delle prestazioni necessarie, delle dimensioni dei dati e della relativa crescita prevista.

I nodi RA3 con storage gestito consentono di ottimizzare il data warehouse dimensionando e pagando le capacità di calcolo e storage gestito separatamente. Con RA3, basta scegliere il numero di nodi in base alle prestazioni necessarie e verrà fatturato solo lo storage gestito utilizzato. Dimensiona il cluster RA3 in base della quantità di dati elaborata quotidianamente. Puoi avviare i cluster che utilizzano i tipi di nodo RA3 in un virtual private cloud (VPC). Per ulteriori informazioni, consulta Creazione di un cluster con provisioning Redshift o un gruppo di lavoro Amazon Redshift serverless in un VPC.

L'archiviazione gestita di Amazon Redshift utilizza SSD di grandi dimensioni e ad alte prestazioni in ogni nodo RA3 per un'archiviazione locale rapida e Amazon S3 per l'archiviazione durevole a lungo termine. Se i dati in un nodo crescono superando la dimensione degli SSD locali, l'archiviazione gestita di Amazon Redshift trasferisce automaticamente tali dati su Amazon S3. A prescindere che i dati si trovino in SSD a elevate prestazioni o in Amazon S3, la tariffa pagata per l'archiviazione gestita di Amazon Redshift non cambia e rimane bassa. Per i carichi di lavoro che richiedono un’archiviazione crescente, l’archiviazione gestita consente di scalare automaticamente la capacità di archiviazione del data warehouse separatamente dai nodi di calcolo.

I nodi DC2 consentono di creare data warehouse per calcoli intensivi con storage SSD locale incluso. Puoi scegliere il numero di nodi di cui hai bisogno in base alla dimensione dei dati e ai requisiti di prestazioni. I nodi DC2 archiviano i dati a livello locale per garantire prestazioni elevate e, al crescere delle dimensioni dei dati, puoi aggiungere altri nodi di calcolo per aumentare la capacità di storage del cluster. Nel caso di set di dati inferiori a 1 TB (compressi), consigliamo i nodi DC2, così da avere prestazioni ottimali con prezzi minimi. Se prevedi una crescita dei dati, ti consigliamo di utilizzare i nodi RA3, in modo da poter dimensionare il calcolo e lo storage in modo indipendente per ottenere prezzi e prestazioni ottimali. Puoi avviare i cluster che utilizzano i tipi di nodo DC2 in un VPC (virtual private cloud). Per ulteriori informazioni, consulta Creazione di un cluster con provisioning Redshift o un gruppo di lavoro Amazon Redshift serverless in un VPC.

I tipi di nodo sono disponibili in diverse dimensioni. Le dimensioni e il numero dei nodi determinano lo storage totale di un cluster. Per ulteriori informazioni, consultare Dettagli relativi ai tipi di nodo.

Alcuni tipi di nodo consentono un solo nodo (a nodo singolo) o due o più nodi (a più nodi). Il numero minimo di nodi per i cluster di alcuni tipi di nodo è due. In un cluster a nodo singolo, il nodo condivide le funzionalità del nodo principale e del nodo di calcolo. I cluster a nodo singolo non sono consigliati per l'esecuzione di carichi di lavoro di produzione. In un cluster a più nodi, il nodo principale è distinto dai nodi di calcolo. Il tipo del nodo principale è identico a quello dei nodi di calcolo. Paghi solo per i nodi di calcolo.

Amazon Redshift applica quote alle risorse per ogni account AWS in ogni regione AWS. Una quota limita il numero di risorse che l'account può creare per un determinato tipo di risorsa, ad esempio nodi o snapshot, all'interno di una regione AWS. Per ulteriori informazioni sulle quote predefinite valide per le risorse Amazon Redshift, consulta Quote e limiti in Amazon Redshift.

Il costo del cluster dipende dalla regione AWS, dal tipo di nodo, dal numero di nodi e se i nodi sono stati riservati in anticipo. Per ulteriori informazioni sui costi dei nodi, consultare la pagina dei prezzi di Amazon Redshift.

Dettagli relativi ai tipi di nodo

Nelle tabelle seguenti sono riepilogate le specifiche dei nodi per ogni tipo e dimensione di nodo. Le intestazioni delle tabelle hanno i seguenti significati:

  • vCPU è il numero di CPU virtuali per ogni nodo.

  • RAM è la quantità di memoria, espressa in gibibyte (GiB), per ogni nodo.

  • Sezioni di default per nodo è il numero di sezioni in cui un nodo di calcolo viene partizionato quando un cluster viene creato o ridimensionato con ridimensionamento classico.

    Il numero di sezioni per nodo potrebbe cambiare se al cluster viene applicato il ridimensionamento elastico. Tuttavia, il numero totale di sezioni in tutti i nodi di calcolo nel cluster rimane lo stesso dopo il ridimensionamento elastico.

    Quando si crea un cluster con l'operazione di ripristino da snapshot, il numero di sezioni del cluster risultante potrebbe cambiare rispetto al cluster originale se si modifica il tipo di nodo.

  • Storage è la capacità e il tipo di storage per ogni nodo.

  • L'intervallo di nodi è il numero minimo e massimo di nodi supportato da Amazon Redshift per il tipo e la dimensione del nodo.

    Nota

    Potrebbero essere applicate limitazioni che riducono il numero di nodi e che dipendono dalla quota applicata al tuo account AWS nella regione AWS selezionata. Per ulteriori informazioni sulle quote predefinite valide per le risorse Amazon Redshift, consulta Quote e limiti in Amazon Redshift.

  • La capacità totale è la capacità di archiviazione totale per il cluster se distribuisci il numero massimo di nodi specificati nell'intervallo di nodi.

La tabella seguente descrive le specifiche per i nodi RA3.

Tipo di nodo VPCU RAM (GiB) Sezioni predefinite per nodo Limite dell'archiviazione gestita per nodo 1 Intervallo di nodi con creazione cluster Capacità totale di archiviazione gestita 2
ra3.large (nodo singolo) 2 16 2 1 TB 1 1 TB3
ra3.large (multinodo) 2 16 2 8 TB 2-16 128 TB
ra3.xlplus (nodo singolo) 4 32 2 4 TB 1 4 TB3
ra3.xlplus (multinodo) 4 32 2 32 TB 2–3244 1024 TB4
ra3.4xlarge 12 96 4 128 TB 2–3255 8192 TB5
ra3.16xlarge 48 384 16 128 TB 2-128 16.384 TB4

1 Il limite di l'archiviazione gestita per Amazon Redshift. Questo è un limite non modificabile.

2 Il limite di archiviazione gestita totale è il numero massimo di nodi per il limite di archiviazione gestita per nodo.

3 Per ridimensionare un cluster a nodo singolo su più nodi, è supportato solo il ridimensionamento classico.

4 È possibile creare un cluster con il tipo di nodo ra3.xlplus (multinodo) contenente un massimo di 32 nodi. Per i cluster a più nodi, è possibile ridimensionare con il ridimensionamento elastico fino a un massimo di 32 nodi.

5 È possibile creare cluster con il tipo di nodo ra3.4xlarge contenente un massimo di 32 nodi. È possibile ridimensionarlo con un ridimensionamento elastico fino a un massimo di 64 nodi.

La tabella seguente descrive le specifiche per i nodi di calcolo ad alta densità.

Tipo di nodo VPCU RAM (GiB) Sezioni predefinite per nodo Archiviazione per nodo Intervallo di nodi Capacità totale
dc2.large 2 15 2 160 GB (NVMe-SSD) 1-32 5.12 TB
dc2.8xlarge 32 244 16 2,56 TB (NVMe-SSD) 2-128 326 TB
Nota

I tipi di nodi di archiviazione ad alta densità (DS2) non sono più disponibili.

Nomi precedenti dei tipi di nodo

Nelle versioni precedenti di Amazon Redshift alcuni tipi di nodo hanno nomi diversi. I nomi precedenti possono essere utilizzati nell'API Amazon Redshift e nella AWS CLI. Tuttavia, ti consigliamo di aggiornare gli script che fanno riferimento a tali nomi in modo che utilizzino invece i nomi correnti. I nomi correnti e i rispettivi nomi precedenti sono riportati di seguito.

Nome corrente Nomi precedenti
ds2.xlarge ds1.xlarge, dw.hs1.xlarge, dw1.xlarge
ds2.8xlarge ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge
dc1.large dw2.large
dc1.8xlarge dw2.8xlarge

Determinazione del numero di nodi

Dal momento che Amazon Redshift distribuisce ed esegue le query in parallelo tra tutti i nodi di calcolo di un cluster, è possibile ottimizzare le prestazioni delle query mediante l'aggiunta di nodi al cluster. Quando esegui un cluster che include almeno due nodi di calcolo, viene sempre eseguito il mirroring dei dati di ciascun nodo sui dischi di un altro nodo per ridurre il rischio di perdita dei dati.

È possibile monitorare le prestazioni delle query nella console Amazon Redshift e con i parametri di Amazon CloudWatch. Puoi inoltre aggiungere o rimuovere nodi in base alle esigenze per ottenere l'equilibrio tra prezzo e prestazioni per il cluster. Quando si richiede un nodo aggiuntivo, Amazon Redshift gestisce tutti i dettagli relativi a distribuzione, bilanciamento del carico e manutenzione dei dati. Per ulteriori informazioni sulle prestazioni dei cluster, consultare Monitoraggio delle prestazioni del cluster Amazon Redshift.

Nodi riservati sono ideali per carichi di lavoro in ambienti di produzione a stato costante, poiché i costi sono molto inferiori rispetto ai prezzi on demand. Puoi acquistare nodi riservati dopo l'esecuzione di qualche prova e proof of concept per convalidare la configurazione di produzione. Per ulteriori informazioni, consultare Nodi riservati.

La sospensione di un cluster comporta anche la sospensione della fatturazione on demand durante il periodo in cui il cluster è sospeso. Durante questo tempo di pausa, si paga per lo storage di backup. In questo modo non sarà necessario pianificare né acquistare in anticipo capacità del data warehouse e sarà possibile gestire ambienti di sviluppo o di test a costi ridotti.

Per informazioni sui prezzi dei nodi on demand e riservati, consultare Prezzi di Amazon Redshift.

Usare EC2 per creare il cluster

I cluster Amazon Redshift vengono eseguiti in istanze Amazon EC2 configurate per il tipo di nodo Amazon Redshift e le dimensioni selezionati. Per ulteriori informazioni su queste piattaforme di rete, consulta Piattaforme supportate nella Guida per l’utente di Amazon EC2.

Nota

Per evitare problemi di connessione tra gli strumenti client SQL e il database Amazon Redshift, consigliamo di eseguire una delle due operazioni seguenti. Puoi configurare una regola in entrata che autorizzi gli host a negoziare le dimensioni dei pacchetti. In alternativa, è possibile disabilitare i frame jumbo TCP/IP impostando l'unità massima di trasmissione (MTU) su 1500 sull'interfaccia di rete (NIC) delle istanze Amazon EC2. Per ulteriori informazioni su questi approcci, consultare Query bloccate e talvolta impossibilitate a raggiungere il cluster.

Amazon Virtual Private Cloud (Amazon VPC)

Quando utilizzi Amazon VPC, il cluster viene eseguito in un cloud privato virtuale (VPC) logicamente isolato dall’account AWS specifico. Se esegui il provisioning del cluster con Amazon VPC, controlli l’accesso al cluster associando uno o più gruppi di sicurezza del VPC al cluster. Per ulteriori informazioni, consultare Gruppi di sicurezza per il VPC nella Guida per l'utente di Amazon VPC.

Per creare un cluster in un VPC, è necessario creare innanzitutto un gruppo di sottoreti del cluster Amazon Redshift immettendo le informazioni sulla sottorete del VPC in uso, quindi fornendo il gruppo di sottoreti all'avvio del cluster. Per ulteriori informazioni, consultare Sottoreti per le risorse Redshift.

Per ulteriori informazioni su Amazon Virtual Private Cloud (Amazon VPC), consultare la pagina dei dettagli del prodotto di Amazon VPC.

Allarme predefinito dello spazio su disco

Quando si crea un cluster Amazon Redshift, se si desidera è possibile configurare un allarme Amazon CloudWatch per monitorare la percentuale media dello spazio su disco utilizzato da tutti i nodi del cluster. Questo allarme viene definito allarme predefinito dello spazio su disco.

Questo tipo di allarme ha lo scopo di monitorare la capacità di storage del cluster. Puoi configurare questo allarme in base alle specifiche esigenze del data warehouse in uso. Ad esempio, puoi utilizzare l'avviso come indicatore per l'eventuale necessità di dimensionare il cluster. Puoi decidere di eseguire il dimensionamento utilizzando un tipo di nodo diverso, aggiungendo nodi oppure acquistando nodi prenotati da utilizzare nelle espansioni future.

L'allarme predefinito dello spazio su disco viene attivato quando l'utilizzo del disco raggiunge o supera una percentuale specificata per un determinato numero di volte e con una durata specificata. Per impostazione predefinita, questo allarme viene attivato quando la percentuale specificata viene raggiunta per cinque minuti o più oppure viene superata per la stessa durata di tempo. Puoi modificare i valori predefiniti dopo aver avviato il cluster.

Quando viene attivato l'allarme CloudWatch, Amazon Simple Notification Service (Amazon SNS) invia una notifica ai destinatari specificati per avvertirli che la soglia percentuale è stata raggiunta. Amazon SNS utilizza un argomento per specificare i destinatari e il messaggio inviato in una notifica. È possibile utilizzare un argomento Amazon SNS esistente. In caso contrario, viene creato un argomento in base alle impostazioni specificate all'avvio del cluster. Puoi modificare l'argomento dell'allarme corrente dopo aver avviato il cluster. Per ulteriori informazioni sulla creazione di argomenti Amazon SNS, consultare in Nozioni di base di Amazon Simple Notification Service.

Dopo aver avviato il cluster, puoi visualizzare e modificare l'allarme nella finestra Status (Stato) del cluster, nell'area CloudWatch Alarms (Allarmi CloudWatch). Il nome è percentage-disk-space-used-default-<stringa>. È possibile aprire l'allarme per visualizzare l'argomento Amazon SNS associato e modificare le impostazioni dell'allarme. Se non è stato selezionato un argomento Amazon SNS esistente da utilizzare, l'argomento creato automaticamente viene denominato <nomecluster>-default-alarms (<destinatario>), ad esempio examplecluster-default-alarms (notify@example.com).

Per ulteriori informazioni sulla configurazione e modifica dell'allarme predefinito dello spazio su disco, consultare Creazione di un cluster e Creazione di un allarme dello spazio su disco.

Nota

Se elimini il cluster, l'allarme associato non verrà eliminato, ma non verrà mai attivato. Se non è più necessario, è possibile eliminare l'allarme utilizzando la console CloudWatch.

Stato del cluster

Lo stato del cluster indica lo stato corrente del cluster. La tabella seguente fornisce una descrizione di ciascuno stato del cluster.

Stato Descrizione
available Il cluster è in esecuzione e disponibile.
available, prep-for-resize Il cluster viene preparato per il ridimensionamento elastico. Il cluster è in esecuzione ed è disponibile per query in lettura e scrittura, anche se le operazioni del cluster, come la creazione di uno snapshot, non sono disponibili.
available, resize-cleanup Un'operazione di ridimensionamento elastico sta completando il trasferimento dati sui nuovi nodi del cluster. Il cluster è in esecuzione ed è disponibile per query in lettura e scrittura, anche se le operazioni del cluster, come la creazione di uno snapshot, non sono disponibili.
cancelling-resize L'operazione di dimensionamento viene annullata.
creating Amazon Redshift sta creando il cluster. Per ulteriori informazioni, consultare Creazione di un cluster.
deleting Amazon Redshift sta eliminando il cluster. Per ulteriori informazioni, consulta Arresto ed eliminazione di un cluster.
final-snapshot Amazon Redshift sta creando uno snapshot finale del cluster prima di eliminarlo. Per ulteriori informazioni, consulta Arresto ed eliminazione di un cluster.
hardware-failure

Nel cluster si è verificato un errore a livello di hardware.

Se si tratta di un cluster a nodo singolo, il nodo non può essere sostituito. Per recuperare il cluster, ripristina uno snapshot. Per ulteriori informazioni, consultare Snapshot e backup di Amazon Redshift.

incompatible-hsm Amazon Redshift non può connettersi al modulo di sicurezza hardware (HSM, Hardware Security Module). Controlla la configurazione HSM tra il cluster e HSM. Per ulteriori informazioni, consultare Crittografia tramite moduli di sicurezza hardware.
incompatible-network Si è verificato un problema nella configurazione della rete sottostante. Verifica che il VPC in cui hai avviato il cluster esista e che le relative impostazioni siano corrette. Per ulteriori informazioni, consultare Risorse Redshift in un VPC.
incompatible-parameters Si è verificato un problema con uno o più valori di parametro nel gruppo di parametri associato e il valore o i valori di parametro non possono essere applicati. Modificare il gruppo di parametri e aggiorna i valori non validi. Per ulteriori informazioni, consultare Gruppi di parametri di Amazon Redshift..
incompatible-restore Si è verificato un problema durante il ripristino del cluster dallo snapshot. Prova a ripristinare di nuovo il cluster con uno snapshot diverso. Per ulteriori informazioni, consultare Snapshot e backup di Amazon Redshift.
modifying Amazon Redshift sta applicando le modifiche al cluster. Per ulteriori informazioni, consultare Modifica di un cluster.
paused Il cluster è in pausa. Per ulteriori informazioni, consultare Sospensione e ripresa di un cluster.
rebooting Amazon Redshift sta riavviando il cluster. Per ulteriori informazioni, consultare Riavvio di un cluster.
renaming Amazon Redshift sta applicando un nuovo nome al cluster. Per ulteriori informazioni, consultare Ridenominazione di un cluster.
resizing Amazon Redshift sta ridimensionando il cluster. Per ulteriori informazioni, consultare Ridimensionamento di un cluster.
rotating-keys Amazon Redshift sta ruotando le chiavi di crittografia del cluster. Per ulteriori informazioni, consultare Rotazione delle chiavi di crittografia.
storage-full Il cluster ha raggiunto la relativa capacità di storage. Ridimensiona il cluster aggiungendo nodi o scegliendo una dimensione di nodo diversa. Per ulteriori informazioni, consulta Ridimensionamento di un cluster.
updating-hsm Amazon Redshift sta aggiornando la configurazione HSM.