SVL_S3QUERY_SUMMARY

Utilizzate la vista SVL_S3QUERY_SUMMARY per ottenere un riepilogo di tutte le query sul data lake che sono state eseguite sul sistema. SVL_S3QUERY_SUMMARY aggrega i dettagli da SVL_S3QUERY a livello di segmento.

SVL_S3QUERY_SUMMARY è visibile a tutti gli utenti. Gli utenti con privilegi avanzati visualizzano tutte le righe; gli utenti regolari visualizzano solo i propri dati. Per ulteriori informazioni, consulta Visibilità dei dati nelle tabelle e nelle viste di sistema.

Alcuni o tutti i dati di questa tabella sono definiti anche nella vista di monitoraggio SYS SYS_EXTERNAL_QUERY_DETAIL. I dati nella vista di monitoraggio SYS sono formattati in modo da essere più facili da usare e comprendere. Ti consigliamo di utilizzare la vista di monitoraggio SYS per le query.

Per SVCS_S3QUERY_SUMMART, consultare SVCS_S3QUERY_SUMMARY.

Colonne di tabella

Nome della colonna	Tipo di dati	Description
userid	intero	L'ID dell'utente che ha generato quella determinata voce.
query	intero	L'ID di query. È possibile utilizzare questo valore per unire varie altre tabelle e visualizzazioni di sistema.
xid	bigint	L'ID transazione.
pid	intero	L'ID di processo.
segment	intero	Il numero di segmento. Una query consiste in più segmenti e ogni segmento consiste in una o più fasi.
step	intero	La fase di query eseguita.
starttime	timestamp	Orario in UTC in cui la query ha iniziato l'esecuzione.
endtime	timestamp	Orario in UTC in cui è stata completata la query.
elapsed	intero	Il periodo di tempo in cui la query è stata eseguita (in microsecondi).
aborted	intero	Se la query è stata interrotta dal sistema o annullata dall'utente, questa colonna contiene `1`. Se la query è stata completata, questa colonna contiene `0`.
external_table_name	char(136)	Il formato interno del nome esterno della tabella per la scansione della tabella esterna.
file_format	character(16)	Il formato del file dei dati della tabella esterna.
is_partitioned	char(1)	Se true (`t`), questo valore della colonna indica che la tabella esterna è partizionata.
is_rrscan	char(1)	Se true (`t`), questo valore della colonna indica che è stata applicata una scansione a intervallo limitato.
is_nested	char(1)	Se true (`t`), questo valore della colonna indica che viene eseguito l'accesso al tipo di dati della colonna nidificata.
s3_scanned_rows	bigint	Il numero di righe di cui è stata eseguita la scansione da Amazon S3 e che sono state inviate al livello Redshift Spectrum. Nei cluster con provisioning RG, questo è il numero totale di righe scansionate direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro.
s3_scanned_bytes	bigint	Il numero di byte di cui è stata eseguita la scansione da Amazon S3 e che sono stati inviati al livello Redshift Spectrum sulla base di dati compressi. Nei cluster con provisioning RG, questo è il numero totale di byte scansionati direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro.
s3query_returned_rows	bigint	Il numero di righe restituite dal livello Redshift Spectrum al cluster. Nei cluster con provisioning RG, questo è il numero totale di righe restituite dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro.
s3query_returned_bytes	bigint	Il numero di byte restituiti dal livello Redshift Spectrum al cluster. Una grande quantità di dati restituiti a Amazon Redshift può influire sulle prestazioni di sistema. Nei cluster con provisioning RG, questo è il numero totale di byte restituiti dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro.
files	intero	Il numero di file che sono stati elaborati per questa query del data lake. Un piccolo numero di file limita i vantaggi dell'elaborazione parallela.
files_max	intero	Il numero massimo di file elaborati in una sezione.
files_avg	intero	Il numero medio di file elaborati in una sezione.
splits	int	Il numero di suddivisioni elaborate per questo segmento. Il numero di suddivisioni elaborate in questa sezione. Con file di dati di grandi dimensioni che possono essere suddivisi, per esempio file di dimensioni superiori a circa 512 MB, Redshift Spectrum cerca di dividere i file in più richieste S3 per l'elaborazione parallela.
splits_max	int	Il numero massimo di suddivisioni elaborate in questa sezione.
splits_avg	int	Il numero medio di suddivisioni elaborate in questa sezione.
total_split_size	bigint	La dimensione totale di tutte le suddivisioni elaborate.
max_split_size	bigint	La dimensione massima di suddivisione elaborata, in byte.
avg_split_size	bigint	La dimensione media di suddivisione elaborata, in byte.
total_retries	intero	Il numero totale di tentativi per un singolo file elaborato. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. `STL_S3CLIENT`
max_retries	intero	Il numero massimo di tentativi per qualsiasi dei file elaborati. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. `STL_S3CLIENT`
max_request_duration	intero	La durata massima di una singola richiesta di file (in microsecondi). Le query con un'esecuzione lunga possono indicare un collo di bottiglia. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
avg_request_duration	double precision	La durata media delle richieste di file (in microsecondi). Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
max_request_parallelism	intero	Il numero massimo di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
avg_request_parallelism	double precision	Il numero medio di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
total_slowdown_count	bigint	Il numero totale di richieste Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
max_slowdown_count	intero	Il numero massimo di richieste di Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna in una sezione. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.

Query di esempio

L'esempio seguente dà i dettagli della fase di scansione per l'ultima query completata.


select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files 
from svl_s3query_summary 
where query = pg_last_query_id() 
order by query,segment;

query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

SVL_S3QUERY

SVL_S3RETRIES