SVCS_S3QUERY_SUMMARY

Utilizzate la vista SVCS_S3QUERY_SUMMARY per ottenere un riepilogo di tutte le query sul data lake che sono state eseguite sul sistema. Un segmento può eseguire una scansione della tabella esterna.

Nota

Le visualizzazioni di sistema con il prefisso SVCS forniscono i dettagli relativi alle query nei cluster principale e di dimensionamento della simultaneità. Le visualizzazioni sono simili a quelle con il prefisso SVL, tranne per il fatto che le visualizzazioni SVL forniscono informazioni solo per le query eseguite nel cluster principale.

SVCS_S3QUERY_SUMMARY è visibile a tutti gli utenti. Gli utenti con privilegi avanzati visualizzano tutte le righe; gli utenti regolari visualizzano solo i propri dati. Per ulteriori informazioni, consulta Visibilità dei dati nelle tabelle e nelle viste di sistema.

Per informazioni su SVL_S3QUERY, consultare SVL_S3QUERY.

Colonne di tabella

Nome della colonna	Tipo di dati	Description
userid	intero	L'ID dell'utente che ha generato quella determinata voce.
query	intero	L'ID di query. È possibile utilizzare questo valore per unire varie altre tabelle e visualizzazioni di sistema.
xid	bigint	L'ID transazione.
pid	intero	L'ID di processo.
segment	intero	Il numero di segmento. Una query consiste in più segmenti e ogni segmento consiste in una o più fasi.
step	intero	La fase di query eseguita.
starttime	timestamp	L'ora in UTC in cui è iniziata l'esecuzione della query Redshift Spectrum in questo segmento. Un segmento può avere una scansione della tabella esterna.
endtime	timestamp	L'ora in UTC in cui è terminata l'esecuzione della query Redshift Spectrum in questo segmento. Un segmento può avere una scansione della tabella esterna.
elapsed	intero	Il tempo impiegato per l'esecuzione della query Redshift Spectrum in questo segmento (in microsecondi).
aborted	intero	Se la query è stata interrotta dal sistema o annullata dall'utente, questa colonna contiene `1`. Se la query è stata completata, questa colonna contiene `0`.
external_table_name	char(136)	Il formato interno del nome esterno della tabella per la scansione della tabella esterna.
file_format	character(16)	Il formato del file dei dati della tabella esterna.
is_partitioned	char(1)	Se true (`t`), questo valore della colonna indica che la tabella esterna è partizionata.
is_rrscan	char(1)	Se true (`t`), questo valore della colonna indica che è stata applicata una scansione a intervallo limitato.
is_nested	varchar(1)	Se true (`t`), questo valore della colonna indica che viene eseguito l'accesso al tipo di dati della colonna nidificata.
s3_scanned_rows	bigint	Il numero di righe di cui è stata eseguita la scansione da Amazon S3 e che sono state inviate al livello Redshift Spectrum. Nei cluster con provisioning RG, questo è il numero totale di righe scansionate direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro.
s3_scanned_bytes	bigint	Il numero di byte di cui è stata eseguita la scansione da Amazon S3 e che sono stati inviati al livello Redshift Spectrum sulla base di dati compressi. Nei cluster con provisioning RG, questo è il numero totale di byte scansionati direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro.
s3query_returned_rows	bigint	Il numero di righe restituite dal livello Redshift Spectrum al cluster. Nei cluster con provisioning RG, questo è il numero totale di righe restituite dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro.
s3query_returned_bytes	bigint	Il numero di byte restituiti dal livello Redshift Spectrum al cluster. Una grande quantità di dati restituiti a Amazon Redshift può influire sulle prestazioni di sistema. Nei cluster con provisioning RG, questo è il numero totale di byte restituiti dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro.
files	intero	Il numero di file che sono stati elaborati per questa query del data lake. Un piccolo numero di file limita i vantaggi dell'elaborazione parallela.
files_max	intero	Il numero massimo di file elaborati su una sezione.
files_avg	intero	Il numero medio di file elaborati su una sezione.
splits	bigint	Il numero di suddivisioni elaborate per questo segmento. Il numero di suddivisioni elaborate in questa sezione. Con file di dati di grandi dimensioni che possono essere suddivisi, per esempio file di dimensioni superiori a circa 512 MB, Redshift Spectrum cerca di dividere i file in più richieste S3 per l'elaborazione parallela.
splits_max	intero	Il numero massimo di suddivisioni elaborate in questa sezione.
splits_avg	bigint	Il numero medio di suddivisioni elaborate in questa sezione.
total_split_size	bigint	La dimensione totale di tutte le suddivisioni elaborate.
max_split_size	bigint	La dimensione massima di suddivisione elaborata, in byte.
avg_split_size	bigint	La dimensione media di suddivisione elaborata, in byte.
total_retries	bigint	Il numero totale di tentativi per la query Redshift Spectrum in questo segmento. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. `STL_S3CLIENT`
max_retries	intero	Il numero massimo di tentativi per un singolo file elaborato. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. `STL_S3CLIENT`
max_request_duration	bigint	La durata massima di una singola richiesta di file (in microsecondi). Le query con un'esecuzione lunga possono indicare un collo di bottiglia. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
avg_request_duration	bigint	La durata media delle richieste di file (in microsecondi). Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
max_request_parallelism	intero	Il numero massimo di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
avg_request_parallelism	double precision	Il numero medio di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
total_slowdown_count	bigint	Il numero totale di richieste Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.
max_slowdown_count	intero	Il numero massimo di richieste di Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna in una sezione. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1.

Query di esempio

L'esempio seguente dà i dettagli della fase di scansione per l'ultima query eseguita.


select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files 
from svcs_s3query_summary 
where query = pg_last_query_id() 
order by query,segment;

query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------               
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

SVCS_S3PARTITION_SUMMARY

SVCS_STREAM_SEGS