Dati relativi alle prestazioni in Amazon Redshift - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Dati relativi alle prestazioni in Amazon Redshift

Grazie ai parametri CloudWatch per Amazon Redshift, è possibile ottenere informazioni sull'integrità e le prestazioni del cluster e visualizzare le informazioni a livello dei nodi. Quando utilizzi tali parametri, considera che a ogni parametro sono associate una o più dimensioni. Queste dimensioni indicano a cosa si applica il parametro, ovvero l'ambito del parametro. Amazon Redshift ha le seguenti due dimensioni:

  • I parametri con la dimensione NodeID sono quelli che forniscono dati di prestazioni per i nodi di un cluster. Questo set di parametri include nodi principali e di calcolo. Esempi di questi parametri sono CPUUtilization, ReadIOPS, WriteIOPS.

  • I parametri con unicamente la dimensione ClusterIdentifier sono quelli che forniscono dati di prestazioni per i cluster. Esempi di questi parametri sono HealthStatus e MaintenanceMode.

    Nota

    In alcuni casi, un parametro specifico ai cluster rappresenta un'aggregazione del comportamento dei nodi. In questi casi, presta attenzione all'interpretazione del valore del parametro in quanto il comportamento del nodo principale viene aggregato a quello del nodo di calcolo.

Per informazioni sui parametri e gli allarmi CloudWatch, consultare Concetti di Amazon CloudWatch nella Guida per l'utente di Amazon CloudWatch.

Per un'ulteriore descrizione dei parametri CloudWatch per Amazon Redshift, consultare le sezioni seguenti.

Parametri di Amazon Redshift

Lo spazio dei nomi AWS/Redshift include i parametri descritti di seguito. Salvo diversa indicazione, i parametri vengono raccolti a intervalli di 1 minuto.

Parametro Descrizione
CommitQueueLength

Il numero di transazioni in attesa di eseguire il commit in un dato momento.

Unità: numero

Dimensioni: ClusterIdentifier

ConcurrencyScalingActiveClusters

Il numero di cluster di dimensionamento simultaneo che elaborano attivamente le query in qualsiasi momento.

Unità: numero

Dimensioni: ClusterIdentifier

ConcurrencyScalingSeconds

Il numero di secondi impiegati dai cluster di dimensionamento simultaneo con attività di elaborazione di query attiva.

Unità: numero

Dimensioni: ClusterIdentifier

CPUUtilization

La percentuale di utilizzo della CPU. Per i cluster, questo parametro rappresenta un'aggregazione dei valori di utilizzo della CPU di tutti i nodi (singolo e calcolo).

Unità: percentuale

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

DatabaseConnections

Il numero di connessioni di database a un cluster.

Unità: numero

Dimensioni: ClusterIdentifier

HealthStatus

Indica lo stato del cluster. Il cluster si connette al proprio database ed esegue una semplice query ogni minuto. Se è in grado di eseguire questa operazione correttamente, il cluster è considerato integro. In caso contrario, il cluster non è integro. Uno stato non integro può verificarsi quando il database del cluster è sovraccaricato eccessivamente oppure se si verifica un problema di configurazione con un database sul cluster.

Nota

In Amazon CloudWatch, questo parametro è riportato come 1 o 0, mentre nella console Amazon Redshift è visualizzato con le parole HEALTHY o UNHEALTHY per praticità. Quando questo parametro è visualizzato nella console Amazon Redshift, le medie di campionamento vengono ignorate e viene visualizzato solo HEALTHY o UNHEALTHY. In Amazon CloudWatch, i valori diversi da 1 e 0 possono verificarsi a causa di problemi con il campionamento. Qualsiasi valore inferiore a 1 per HealthStatus è segnalato come 0 (UNHEALTHY).

Unità: conteggio (1/0) (HEALTHY/UNHEALTHY nella console Amazon Redshift)

Dimensioni: ClusterIdentifier

MaintenanceMode

Indica se il cluster è in modalità di manutenzione.

Nota

In Amazon CloudWatch, questo parametro è riportato come 1 o 0, mentre nella console Amazon Redshift è visualizzato con le parole ON o OFF per praticità. Quando questo parametro è visualizzato nella console Amazon Redshift, le medie di campionamento vengono ignorate e viene visualizzato solo ON o OFF. In Amazon CloudWatch, i valori diversi da 1 e 0 possono verificarsi a causa di problemi con il campionamento. Qualsiasi valore maggiore di 0 per MaintenanceMode è segnalato come 1 (ON).

Unità: conteggio (1/0) (ON/OFF nella console Amazon Redshift)

Dimensioni: ClusterIdentifier

MaxConfiguredConcurrencyScalingClusters

Numero massimo di cluster di dimensionamento simultaneo configurati dal gruppo di parametri. Per ulteriori informazioni, consultare Gruppi di parametri di Amazon Redshift..

Unità: numero

Dimensioni: ClusterIdentifier

NetworkReceiveThroughput

La velocità alla quale il nodo o il cluster riceve i dati.

Unità: byte/s (MB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

NetworkTransmitThroughput

La velocità alla quale il nodo o il cluster scrive i dati.

Unità: byte/s (MB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

PercentageDiskSpaceUsed

La percentuale di spazio su disco utilizzata.

Unità: percentuale

Dimensioni: ClusterIdentifier

Dimensioni: ClusterIdentifier, NodeID

QueriesCompletedPerSecond

Numero medio di query eseguite al secondo. Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, latency

Dimensioni: ClusterIdentifier, wlmid

QueryDuration

Il tempo medio necessario per il completamento di una query. Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: microsecondi

Dimensioni: ClusterIdentifier, NodeID, latency

Dimensioni: ClusterIdentifier, latency

Dimensioni: ClusterIdentifier, NodeID, wlmid

QueryRuntimeBreakdown

Il tempo totale impiegato dalle query in esecuzione per fase di query. Segnalato in intervalli di 5 minuti.

Unità: millisecondi

Dimensioni: ClusterIdentifier, NodeID, stage

Dimensioni: ClusterIdentifier, stage

ReadIOPS

Il numero medio di operazioni di lettura del disco al secondo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

ReadLatency

La quantità di tempo media che occorre per effettuare operazioni I/O di lettura del disco.

Unità: secondi

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

ReadThroughput

Il numero medio di byte letti dal disco al secondo.

Unità: byte (GB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

RedshiftManagedStorageTotalCapacity

Capacità totale di archiviazione gestita.

Unità: megabyte

Dimensioni: ClusterIdentifier

TotalTableCount

Il numero di tabelle utente aperte in un particolare momento. Questo totale non include le tabelle di Amazon Redshift Spectrum.

Unità: numero

Dimensioni: ClusterIdentifier

WLMQueueLength

Il numero di query in attesa di entrare in una coda Workload Management (WLM).

Unità: numero

Dimensioni: ClusterIdentifier, service class

Dimensioni: ClusterIdentifier, QueueName

WLMQueueWaitTime

Tempo totale trascorso dalle query in attesa nella coda workload management (WLM) Segnalato in intervalli di 5 minuti.

Unità: millisecondi

Dimensioni: ClusterIdentifier, QueryPriority

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WLMQueriesCompletedPerSecond

Numero medio di query eseguite al secondo per una coda Workload Management (WLM). Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WLMQueryDuration

Durata media temporale per il completamento di una query per una coda Workload Management (WLM). Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: microsecondi

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WLMRunningQueries

Il numero di query in esecuzione sia dal cluster principale che da quello di dimensionamento simultaneo per coda WLM.

Unità: numero

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WriteIOPS

Il numero medio di operazioni di scrittura al secondo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

WriteLatency

La quantità di tempo media che occorre per effettuare operazioni I/O di scrittura sul disco.

Unità: secondi

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

WriteThroughput

Il numero medio di byte scritti sul disco al secondo.

Unità: byte (GB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

SchemaQuota

La quota configurata per uno schema.

Unità: megabyte

Dimensioni: ClusterIdentifier, Database, Schema

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di interruzione: schema eliminato o quota rimossa

NumExceededSchemaQuotas

Il numero di schemi con quote superate.

Unità: numero

Dimensioni: ClusterIdentifier

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di arresto: N/D

StorageUsed

Il disco o lo spazio di archiviazione utilizzato da uno schema.

Unità: megabyte

Dimensioni: ClusterIdentifier, Database, Schema

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di interruzione: schema eliminato o quota rimossa

PercentageQuotaUsed

La percentuale di spazio su disco o di archiviazione utilizzato rispetto alla quota dello schema configurata.

Unità: percentuale

Dimensioni: ClusterIdentifier, Database, Schema

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di interruzione: schema eliminato o quota rimossa

UsageLimitAvailable

A seconda di FeatureType, UsageLimitAvailable restituisce quanto segue:

  • Se FeatureType è CONCURRENCY_SCALING, UsageLimitAvailable restituisce la quantità di tempo totale che può essere utilizzata dal dimensionamento simultaneo con incrementi di un minuto.

  • Se FeatureType è CROSS_REGION_DATASHARING, UsageLimitAvailable restituisce la quantità totale di dati analizzati con incrementi di un TB.

  • Se FeatureType è SPECTRUM, UsageLimitAvailable restituisce la quantità totale di dati analizzati con incrementi di un TB.

Unità: minuti o TB

Dimensioni: ClusterIdentifier, FeatureType, UsageLimitId

UsageLimitConsumed

A seconda di FeatureType, UsageLimitConsumed restituisce quanto segue:

  • Se FeatureType è CONCURRENCY_SCALING, UsageLimitAvailable restituisce la quantità di tempo totale utilizzata dal dimensionamento simultaneo con incrementi di un minuto.

  • Se FeatureType è CROSS_REGION_DATASHARING, UsageLimitAvailable restituisce la quantità totale di dati analizzati con incrementi di un TB.

  • Se FeatureType è SPECTRUM, UsageLimitAvailable restituisce la quantità totale di dati analizzati con incrementi di un TB.

Unità: minuti o TB

Dimensioni: ClusterIdentifier, FeatureType, UsageLimitId

Dimensioni per i parametri di Amazon Redshift

I dati Amazon Redshift possono essere filtrati insieme alle dimensioni nella seguente tabella.

Dimensione Descrizione
latency

I valori possibili sono i seguenti:

  • breve: meno di 10 secondi

  • media: tra 10 secondi e 10 minuti

  • lunga: più di 10 minuti

NodeID

Filtra i dati richiesti che sono specifici dei nodi di un cluster. NodeID è "Leader", "Shared" o "Compute-N", dove N è 0, 1, ... per il numero di nodi nel cluster. "Shared" significa che il cluster ha solo un nodo, ovvero che il nodo principale e il nodo di calcolo sono combinati.

I parametri di CPUUtilization, NetworkTransmitThroughput e ReadIOPS vengono indicati solo per il nodo principale e i nodi di calcolo. Altri parametri che utilizzano la dimensione NodeId vengono indicati solo per i nodi di calcolo.

ClusterIdentifier

Filtra i dati richiesti che sono specifici del cluster. I parametri specifici dei cluster includono HealthStatus, MaintenanceMode e DatabaseConnections. I parametri generali per questa dimensione (ad esempio ReadIOPS) che sono anche parametri dei nodi rappresentano un'aggregazione dei dati dei parametri dei nodi. Presta attenzione nell'interpretare questi parametri in quanto aggregano il comportamento di nodi principali e nodi di calcolo.

service class

L'identificatore per una classe di servizio WLM.

stage

Le fasi dell'esecuzione per una query. I valori possibili sono i seguenti:

  • QueryPlanning: tempo trascorso per l'analisi e l'ottimizzazione delle dichiarazioni SQL.

  • QueryWaiting: tempo trascorso in attesa nella coda WLM.

  • QueryExecutingRead: tempo trascorso per l'esecuzione delle query di lettura.

  • QueryExecutingInsert: tempo trascorso per l'esecuzione di query di inserimento.

  • QueryExecutingDelete: tempo trascorso per l'esecuzione di query di eliminazione

  • QueryExecutingUpdate: tempo trascorso per l'esecuzione di query di aggiornamento.

  • QueryExecutingCtas: tempo trascorso per l'esecuzione di query crea tabella come.

  • QueryExecutingUnload: tempo trascorso per l'esecuzione di query di scaricamento.

  • QueryExecutingCopy: tempo trascorso per l'esecuzione di query di copia.

  • QueryCommit: tempo trascorso per eseguire il commit.

wlmid

Identificatore per una coda di gestione dei carichi di lavoro.

QueryPriority

La priorità della query. I valori possibili sono CRITICAL, HIGHEST, HIGH, NORMAL, LOW e LOWEST.

QueueName

Nome della coda di gestione del carico di lavoro.

FeatureType

La funzionalità è vincolata da un limite di utilizzo. I valori possibili sono CONCURRENCY_SCALING, CROSS_REGION_DATASHARING e SPECTRUM.

UsageLimitId

L'identificatore di un limite di utilizzo.

Dati di prestazioni di query e caricamento di Amazon Redshift

Oltre ai parametri CloudWatch, Amazon Redshift fornisce dati relativi alle prestazioni di query e caricamenti. Questi dati ti consentono di comprendere la relazione tra le prestazioni dei database e i parametri dei cluster. Ad esempio, se si verifica un picco nella CPU di un cluster, questo è indicato sul grafico della CPU del cluster e puoi quindi determinare le query che erano in esecuzione in quel momento. Al contrario, se esamini una specifica query, i dati dei parametri (come la CPU) sono visualizzati in contesto di modo che sia possibile comprendere l'impatto della query sui parametri del cluster.

I dati relativi alle prestazioni di query e caricamenti non sono pubblicati come parametri CloudWatch e possono essere visualizzati solo nella console Amazon Redshift. I dati relativi alle prestazioni di query e caricamenti sono generati a partire dalle query sulle tabelle di sistema del database (per ulteriori informazioni, consultare Riferimento delle tabelle di sistema nella Guida per gli sviluppatori di Amazon Redshift). Puoi anche generare query di prestazioni di database personalizzate, ma ti consigliamo di cominciare con i dati di prestazioni di query e di caricamento presentati nella console. Per ulteriori informazioni sulla misurazione e il monitoraggio delle prestazioni dei database, consultare Gestione delle prestazioni nella Guida per gli sviluppatori di Amazon Redshift.

La tabella seguente descrive i diversi aspetti dei dati di query e di caricamento accessibili nella console Amazon Redshift.

Dati di query/caricamento Descrizione
Riepilogo delle query

Un elenco di query in un determinato periodo di tempo. L'elenco può essere ordinato in base a valori come ID, tempo di esecuzione e stato della query. Visualizzare questi dati nella scheda Monitoraggio della query della pagina dei dettagli del cluster.

Dettagli della query

Fornisce dettagli su una determinata query, tra cui:

  • Proprietà della query come ID, tipo, cluster su cui la query è stata eseguita e tempo di esecuzione.

  • Dettagli come lo stato della query e il numero di errori.

  • L'istruzione SQL che è stata eseguita.

  • Un piano explain, se disponibile.

  • Dati sulle prestazioni del cluster durante l'esecuzione della query (per ulteriori informazioni, consultare Visualizzazione dei dati della cronologia delle query).

Riepilogo del caricamento

Elenca tutti i caricamenti in un determinato periodo di tempo. L'elenco può essere ordinato in base a valori come ID, tempo di esecuzione e stato della query. Visualizzare questi dati nella scheda Monitoraggio della query della pagina dei dettagli del cluster.

Dettagli del caricamento

Fornisce dettagli su una determinata operazione di caricamento, tra cui:

  • Proprietà del caricamento come ID, tipo, cluster su cui la query è stata eseguita e tempo di esecuzione.

  • Dettagli come lo stato del caricamento e il numero di errori.

  • L'istruzione SQL che è stata eseguita.

  • Un elenco di file caricati.

  • Dati sulle prestazioni del cluster durante l'operazione di caricamento (per ulteriori informazioni, consultare Visualizzazione dei dati della cronologia delle query).