View a markdown version of this page

SVL_S3QUERY_SUMMARY - Amazon Redshift

Amazon Redshift dejará de admitir la creación de nuevas UDF de Python a partir del parche 198. Las UDF de Python existentes seguirán funcionando hasta el 30 de junio de 2026. Para obtener más información, consulte la publicación del blog.

SVL_S3QUERY_SUMMARY

Use la vista SVL_S3QUERY_SUMMARY para obtener un resumen de todas las consultas de lago de datos que se han ejecutado en el sistema. SVL_S3QUERY_SUMMARY agrega detalles de la vista SVL_S3QUERY a nivel segmento.

SVL_S3QUERY_SUMMARY es visible para todos los usuarios. Los superusuarios pueden ver todas las filas; los usuarios normales solo pueden ver sus datos. Para obtener más información, consulte Visibilidad de datos en las tablas y vistas de sistema.

Algunos o todos los datos de esta tabla también están en la vista de monitoreo SYS SYS_EXTERNAL_QUERY_DETAIL. Los datos de la vista de monitoreo SYS están formateados para que sean más fáciles de usar y entender. Se recomienda utilizar la vista de monitoreo SYS para las consultas.

Para obtener más información sobre SVCS_S3QUERY_SUMMARY, consulte SVCS_S3QUERY_SUMMARY.

Columnas de la tabla

Nombre de la columna Tipo de datos: Descripción
userid entero ID del usuario que generó la entrada dada.
consulta entero El ID de la consulta. Puede usar este valor para combinar distintas vistas y tablas del sistema.
xid bigint El ID de la transacción.
pid entero El ID del proceso.
segment entero El número del segmento. Una consulta consta de distintos segmentos y cada segmento consta de uno o más pasos.
paso entero El paso de la consulta que se ejecutó.
starttime marca de tiempo Hora en UTC en que comenzó a ejecutarse la consulta.
endtime marca de tiempo Hora en UTC en que se completó la consulta.
elapsed entero Tiempo que demoró la consulta en ejecutarse (en microsegundos).
aborted entero Si el sistema detuvo la consulta o el usuario la canceló, esta columna tendrá el valor 1. Si la consulta se ejecutó hasta su finalización, esta columna tendrá el valor 0.
external_table_name char (136) El formato interno del nombre del nombre externo de la tabla para el examen de la tabla externa.
file_format character(16) El formato de archivo de los datos de la tabla externa.
is_partitioned char(1) Si es true (t), el valor de esta columna indica que la tabla externa está particionada.
is_rrscan char (1) Si es true (t), el valor de esta columna indica que se aplicó un examen de rango restringido.
is_nested char(1) Si es true (t), el valor de esta columna indica que se obtuvo acceso al tipo de datos de la columna anidada.
s3_scanned_rows bigint La cantidad de filas examinadas desde Amazon S3 y enviadas a la capa de Redshift Spectrum. En los clústeres con aprovisionamiento de RG, este es el número total de filas que el lector nativo del clúster analiza directamente desde Amazon S3 en todos los sectores, antes de la aplicación del filtro.
s3_scanned_bytes bigint La cantidad de bytes examinados desde Amazon S3 y enviados a la capa de Redshift Spectrum, según los datos comprimidos. En los clústeres con aprovisionamiento de RG, este es el número total de bytes que el lector nativo del clúster analiza directamente desde Amazon S3 en todos los sectores, antes de la aplicación del filtro.
s3query_returned_rows bigint La cantidad de filas devueltas desde la capa Redshift Spectrum hasta el clúster. En los clústeres con aprovisionamiento de RG, este es el número total de filas devueltas por el lector nativo del clúster en todos los sectores tras la aplicación del filtro.
s3query_returned_bytes bigint La cantidad de bytes devueltos desde la capa Redshift Spectrum hasta el clúster. Una gran cantidad de datos devueltos a Amazon Redshift podría afectar el rendimiento del sistema. En los clústeres con aprovisionamiento de RG, este es el número total de bytes devueltos por el lector nativo del clúster en todos los sectores tras la aplicación del filtro.
files entero La cantidad de archivos que fueron procesados por esta consulta de lago de datos. Una pequeña cantidad de archivos limita los beneficios del procesamiento en paralelo.
files_max entero Cantidad total de archivos procesados en un sector.
files_avg entero Cantidad media de archivos procesados en un sector.
splits int Número de divisiones procesadas para este segmento. Número de divisiones procesadas en este sector. En el caso de los archivos de datos divisibles de gran tamaño (por ejemplo, archivos que superan los 512 MB), Redshift Spectrum intenta dividir los archivos en varias solicitudes de S3 para procesarlos en paralelo.
splits_max int Número máximo de divisiones procesadas en este sector.
splits_avg int Número medio de divisiones procesadas en este sector.
total_split_size bigint Tamaño total de todas las divisiones procesadas.
max_split_size bigint Tamaño máximo en bytes de las divisiones procesadas.
avg_split_size bigint Tamaño medio en bytes de las divisiones procesadas.
total_retries entero Cantidad total de reintentos para un archivo individual procesado. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. Para obtener información sobre los reintentos del cliente de Amazon S3 en RG, consulte STL_S3CLIENT.
max_retries entero Cantidad máxima de reintentos para cualquiera de los archivos procesados. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. Para obtener información sobre los reintentos del cliente de Amazon S3 en RG, consulte STL_S3CLIENT.
max_request_duration entero La duración máxima de una solicitud de un archivo individual (en microsegundos). Si las consultas tienen demasiado tiempo de ejecución, esto podría deberse a un cuello de botella. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
avg_request_duration double precision La duración media de las solicitudes de archivo (en microsegundos). En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
max_request_parallelism entero La cantidad máxima de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
avg_request_parallelism double precision La cantidad promedio de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
total_slowdown_count bigint La cantidad total de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
max_slowdown_count entero La cantidad máxima de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa en un sector. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.

Consulta de ejemplo

En el siguiente ejemplo, se obtienen los detalles del paso de análisis para la última consulta completada.

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0