Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dalla Patch 198. Le UDF Python esistenti continueranno a funzionare fino al 30 giugno 2026. Per ulteriori informazioni, consulta il post del blog
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
SVCS_S3QUERY_SUMMARY
Utilizzate la vista SVCS_S3QUERY_SUMMARY per ottenere un riepilogo di tutte le query sul data lake che sono state eseguite sul sistema. Un segmento può eseguire una scansione della tabella esterna.
Nota
Le visualizzazioni di sistema con il prefisso SVCS forniscono i dettagli relativi alle query nei cluster principale e di dimensionamento della simultaneità. Le visualizzazioni sono simili a quelle con il prefisso SVL, tranne per il fatto che le visualizzazioni SVL forniscono informazioni solo per le query eseguite nel cluster principale.
SVCS_S3QUERY_SUMMARY è visibile a tutti gli utenti. Gli utenti con privilegi avanzati visualizzano tutte le righe; gli utenti regolari visualizzano solo i propri dati. Per ulteriori informazioni, consulta Visibilità dei dati nelle tabelle e nelle viste di sistema.
Per informazioni su SVL_S3QUERY, consultare SVL_S3QUERY.
Colonne di tabella
| Nome della colonna | Tipo di dati | Description |
|---|---|---|
| userid | intero | L'ID dell'utente che ha generato quella determinata voce. |
| query | intero | L'ID di query. È possibile utilizzare questo valore per unire varie altre tabelle e visualizzazioni di sistema. |
| xid | bigint | L'ID transazione. |
| pid | intero | L'ID di processo. |
| segment | intero | Il numero di segmento. Una query consiste in più segmenti e ogni segmento consiste in una o più fasi. |
| step | intero | La fase di query eseguita. |
| starttime | timestamp | L'ora in UTC in cui è iniziata l'esecuzione della query Redshift Spectrum in questo segmento. Un segmento può avere una scansione della tabella esterna. |
| endtime | timestamp | L'ora in UTC in cui è terminata l'esecuzione della query Redshift Spectrum in questo segmento. Un segmento può avere una scansione della tabella esterna. |
| elapsed | intero | Il tempo impiegato per l'esecuzione della query Redshift Spectrum in questo segmento (in microsecondi). |
| aborted | intero | Se la query è stata interrotta dal sistema o annullata dall'utente, questa colonna contiene 1. Se la query è stata completata, questa colonna contiene 0. |
| external_table_name | char(136) | Il formato interno del nome esterno della tabella per la scansione della tabella esterna. |
| file_format | character(16) | Il formato del file dei dati della tabella esterna. |
| is_partitioned | char(1) | Se true (t), questo valore della colonna indica che la tabella esterna è partizionata. |
| is_rrscan | char(1) | Se true (t), questo valore della colonna indica che è stata applicata una scansione a intervallo limitato. |
| is_nested | varchar(1) | Se true (t), questo valore della colonna indica che viene eseguito l'accesso al tipo di dati della colonna nidificata. |
| s3_scanned_rows | bigint | Il numero di righe di cui è stata eseguita la scansione da Amazon S3 e che sono state inviate al livello Redshift Spectrum. Nei cluster con provisioning RG, questo è il numero totale di righe scansionate direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro. |
| s3_scanned_bytes | bigint | Il numero di byte di cui è stata eseguita la scansione da Amazon S3 e che sono stati inviati al livello Redshift Spectrum sulla base di dati compressi. Nei cluster con provisioning RG, questo è il numero totale di byte scansionati direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro. |
| s3query_returned_rows | bigint | Il numero di righe restituite dal livello Redshift Spectrum al cluster. Nei cluster con provisioning RG, questo è il numero totale di righe restituite dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro. |
| s3query_returned_bytes | bigint | Il numero di byte restituiti dal livello Redshift Spectrum al cluster. Una grande quantità di dati restituiti a Amazon Redshift può influire sulle prestazioni di sistema. Nei cluster con provisioning RG, questo è il numero totale di byte restituiti dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro. |
| files | intero | Il numero di file che sono stati elaborati per questa query del data lake. Un piccolo numero di file limita i vantaggi dell'elaborazione parallela. |
| files_max | intero | Il numero massimo di file elaborati su una sezione. |
| files_avg | intero | Il numero medio di file elaborati su una sezione. |
| splits | bigint | Il numero di suddivisioni elaborate per questo segmento. Il numero di suddivisioni elaborate in questa sezione. Con file di dati di grandi dimensioni che possono essere suddivisi, per esempio file di dimensioni superiori a circa 512 MB, Redshift Spectrum cerca di dividere i file in più richieste S3 per l'elaborazione parallela. |
| splits_max | intero | Il numero massimo di suddivisioni elaborate in questa sezione. |
| splits_avg | bigint | Il numero medio di suddivisioni elaborate in questa sezione. |
| total_split_size | bigint | La dimensione totale di tutte le suddivisioni elaborate. |
| max_split_size | bigint | La dimensione massima di suddivisione elaborata, in byte. |
| avg_split_size | bigint | La dimensione media di suddivisione elaborata, in byte. |
| total_retries | bigint | Il numero totale di tentativi per la query Redshift Spectrum in questo segmento. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. STL_S3CLIENT |
| max_retries | intero | Il numero massimo di tentativi per un singolo file elaborato. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. STL_S3CLIENT |
| max_request_duration | bigint | La durata massima di una singola richiesta di file (in microsecondi). Le query con un'esecuzione lunga possono indicare un collo di bottiglia. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| avg_request_duration | bigint | La durata media delle richieste di file (in microsecondi). Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| max_request_parallelism | intero | Il numero massimo di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| avg_request_parallelism | double precision | Il numero medio di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| total_slowdown_count | bigint | Il numero totale di richieste Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| max_slowdown_count | intero | Il numero massimo di richieste di Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna in una sezione. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
Query di esempio
L'esempio seguente dà i dettagli della fase di scansione per l'ultima query eseguita.
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0