Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dalla Patch 198. Le UDF Python esistenti continueranno a funzionare fino al 30 giugno 2026. Per ulteriori informazioni, consulta il post del blog
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
SVL_S3QUERY_SUMMARY
Utilizzate la vista SVL_S3QUERY_SUMMARY per ottenere un riepilogo di tutte le query sul data lake che sono state eseguite sul sistema. SVL_S3QUERY_SUMMARY aggrega i dettagli da SVL_S3QUERY a livello di segmento.
SVL_S3QUERY_SUMMARY è visibile a tutti gli utenti. Gli utenti con privilegi avanzati visualizzano tutte le righe; gli utenti regolari visualizzano solo i propri dati. Per ulteriori informazioni, consulta Visibilità dei dati nelle tabelle e nelle viste di sistema.
Alcuni o tutti i dati di questa tabella sono definiti anche nella vista di monitoraggio SYS SYS_EXTERNAL_QUERY_DETAIL. I dati nella vista di monitoraggio SYS sono formattati in modo da essere più facili da usare e comprendere. Ti consigliamo di utilizzare la vista di monitoraggio SYS per le query.
Per SVCS_S3QUERY_SUMMART, consultare SVCS_S3QUERY_SUMMARY.
Colonne di tabella
| Nome della colonna | Tipo di dati | Description |
|---|---|---|
| userid | intero | L'ID dell'utente che ha generato quella determinata voce. |
| query | intero | L'ID di query. È possibile utilizzare questo valore per unire varie altre tabelle e visualizzazioni di sistema. |
| xid | bigint | L'ID transazione. |
| pid | intero | L'ID di processo. |
| segment | intero | Il numero di segmento. Una query consiste in più segmenti e ogni segmento consiste in una o più fasi. |
| step | intero | La fase di query eseguita. |
| starttime | timestamp | Orario in UTC in cui la query ha iniziato l'esecuzione. |
| endtime | timestamp | Orario in UTC in cui è stata completata la query. |
| elapsed | intero | Il periodo di tempo in cui la query è stata eseguita (in microsecondi). |
| aborted | intero | Se la query è stata interrotta dal sistema o annullata dall'utente, questa colonna contiene 1. Se la query è stata completata, questa colonna contiene 0. |
| external_table_name | char(136) | Il formato interno del nome esterno della tabella per la scansione della tabella esterna. |
| file_format | character(16) | Il formato del file dei dati della tabella esterna. |
| is_partitioned | char(1) | Se true (t), questo valore della colonna indica che la tabella esterna è partizionata. |
| is_rrscan | char(1) | Se true (t), questo valore della colonna indica che è stata applicata una scansione a intervallo limitato. |
| is_nested | char(1) | Se true (t), questo valore della colonna indica che viene eseguito l'accesso al tipo di dati della colonna nidificata. |
| s3_scanned_rows | bigint | Il numero di righe di cui è stata eseguita la scansione da Amazon S3 e che sono state inviate al livello Redshift Spectrum. Nei cluster con provisioning RG, questo è il numero totale di righe scansionate direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro. |
| s3_scanned_bytes | bigint | Il numero di byte di cui è stata eseguita la scansione da Amazon S3 e che sono stati inviati al livello Redshift Spectrum sulla base di dati compressi. Nei cluster con provisioning RG, questo è il numero totale di byte scansionati direttamente da Amazon S3 dal lettore nativo del cluster su tutte le slice, prima del push down del filtro. |
| s3query_returned_rows | bigint | Il numero di righe restituite dal livello Redshift Spectrum al cluster. Nei cluster con provisioning RG, questo è il numero totale di righe restituite dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro. |
| s3query_returned_bytes | bigint | Il numero di byte restituiti dal livello Redshift Spectrum al cluster. Una grande quantità di dati restituiti a Amazon Redshift può influire sulle prestazioni di sistema. Nei cluster con provisioning RG, questo è il numero totale di byte restituiti dal lettore nativo del cluster su tutte le slice, dopo il pushdown del filtro. |
| files | intero | Il numero di file che sono stati elaborati per questa query del data lake. Un piccolo numero di file limita i vantaggi dell'elaborazione parallela. |
| files_max | intero | Il numero massimo di file elaborati in una sezione. |
| files_avg | intero | Il numero medio di file elaborati in una sezione. |
| splits | int | Il numero di suddivisioni elaborate per questo segmento. Il numero di suddivisioni elaborate in questa sezione. Con file di dati di grandi dimensioni che possono essere suddivisi, per esempio file di dimensioni superiori a circa 512 MB, Redshift Spectrum cerca di dividere i file in più richieste S3 per l'elaborazione parallela. |
| splits_max | int | Il numero massimo di suddivisioni elaborate in questa sezione. |
| splits_avg | int | Il numero medio di suddivisioni elaborate in questa sezione. |
| total_split_size | bigint | La dimensione totale di tutte le suddivisioni elaborate. |
| max_split_size | bigint | La dimensione massima di suddivisione elaborata, in byte. |
| avg_split_size | bigint | La dimensione media di suddivisione elaborata, in byte. |
| total_retries | intero | Il numero totale di tentativi per un singolo file elaborato. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. STL_S3CLIENT |
| max_retries | intero | Il numero massimo di tentativi per qualsiasi dei file elaborati. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. Per i nuovi tentativi del client Amazon S3 su RG, vedi. STL_S3CLIENT |
| max_request_duration | intero | La durata massima di una singola richiesta di file (in microsecondi). Le query con un'esecuzione lunga possono indicare un collo di bottiglia. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| avg_request_duration | double precision | La durata media delle richieste di file (in microsecondi). Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| max_request_parallelism | intero | Il numero massimo di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| avg_request_parallelism | double precision | Il numero medio di richieste parallele in una sezione per questa query Redshift Spectrum. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| total_slowdown_count | bigint | Il numero totale di richieste Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
| max_slowdown_count | intero | Il numero massimo di richieste di Amazon S3 con un errore di rallentamento verificatosi durante la scansione della tabella esterna in una sezione. Nei cluster di tipo nodo RG, questa colonna è obsoleta e contiene -1. |
Query di esempio
L'esempio seguente dà i dettagli della fase di scansione per l'ultima query completata.
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0