View a markdown version of this page

SVCS_S3QUERY_SUMMARY - Amazon Redshift

Amazon Redshift dejará de admitir la creación de nuevas UDF de Python a partir del parche 198. Las UDF de Python existentes seguirán funcionando hasta el 30 de junio de 2026. Para obtener más información, consulte la publicación del blog.

SVCS_S3QUERY_SUMMARY

Use la vista SVCS_S3QUERY_SUMMARY para obtener un resumen de todas las consultas de lago de datos que se han ejecutado en el sistema. Un segmento puede realizar un análisis de tablas externas.

nota

Las vistas del sistema con el prefijo SVCS proporcionan información sobre las consultas de los clústeres principal y de escalado de simultaneidad. Las vistas son similares a las vista con el prefijo SVL, con la salvedad de que las vistas SVL solo proporcionan información para las consultas ejecutadas en el clúster principal.

Todos los usuarios pueden ver SVCS_S3QUERY_SUMMARY. Los superusuarios pueden ver todas las filas; los usuarios normales solo pueden ver sus datos. Para obtener más información, consulte Visibilidad de datos en las tablas y vistas de sistema.

Para obtener más información sobre SVL_S3QUERY, consulte SVL_S3QUERY.

Columnas de la tabla

Nombre de la columna Tipo de datos: Descripción
userid entero ID del usuario que generó la entrada dada.
consulta entero El ID de la consulta. Puede usar este valor para combinar distintas vistas y tablas del sistema.
xid bigint El ID de la transacción.
pid entero El ID del proceso.
segment entero El número del segmento. Una consulta consta de distintos segmentos y cada segmento consta de uno o más pasos.
paso entero El paso de la consulta que se ejecutó.
starttime marca de tiempo La hora en UTC a la que comenzó a ejecutarse la consulta de Redshift Spectrum en este segmento. Un segmento puede tener un análisis de tablas externas.
endtime marca de tiempo La hora en UTC a la que terminó de ejecutarse la consulta de Redshift Spectrum en este segmento. Un segmento puede tener un análisis de tablas externas.
elapsed entero El tiempo que tardó la consulta de Redshift Spectrum en ejecutarse en este segmento (en microsegundos).
aborted entero Si el sistema detuvo la consulta o el usuario la canceló, esta columna tendrá el valor 1. Si la consulta se ejecutó hasta su finalización, esta columna tendrá el valor 0.
external_table_name char (136) El formato interno del nombre del nombre externo de la tabla para el examen de la tabla externa.
file_format character(16) El formato de archivo de los datos de la tabla externa.
is_partitioned char(1) Si es true (t), el valor de esta columna indica que la tabla externa está particionada.
is_rrscan char (1) Si es true (t), el valor de esta columna indica que se aplicó un examen de rango restringido.
is_nested varchar(1) Si es true (t), el valor de esta columna indica que se obtuvo acceso al tipo de datos de la columna anidada.
s3_scanned_rows bigint La cantidad de filas examinadas desde Amazon S3 y enviadas a la capa de Redshift Spectrum. En los clústeres con aprovisionamiento de RG, este es el número total de filas que el lector nativo del clúster analiza directamente desde Amazon S3 en todos los sectores, antes de la aplicación del filtro.
s3_scanned_bytes bigint La cantidad de bytes examinados desde Amazon S3 y enviados a la capa de Redshift Spectrum, según los datos comprimidos. En los clústeres con aprovisionamiento de RG, este es el número total de bytes que el lector nativo del clúster analiza directamente desde Amazon S3 en todos los sectores, antes de la aplicación del filtro.
s3query_returned_rows bigint La cantidad de filas devueltas desde la capa Redshift Spectrum hasta el clúster. En los clústeres con aprovisionamiento de RG, este es el número total de filas devueltas por el lector nativo del clúster en todos los sectores tras la aplicación del filtro.
s3query_returned_bytes bigint La cantidad de bytes devueltos desde la capa Redshift Spectrum hasta el clúster. Una gran cantidad de datos devueltos a Amazon Redshift podría afectar el rendimiento del sistema. En los clústeres con aprovisionamiento de RG, este es el número total de bytes devueltos por el lector nativo del clúster en todos los sectores tras la aplicación del filtro.
files entero La cantidad de archivos que fueron procesados por esta consulta de lago de datos. Una pequeña cantidad de archivos limita los beneficios del procesamiento en paralelo.
files_max entero Cantidad total de archivos procesados en un sector.
files_avg entero Cantidad promedio de archivos procesados en un sector.
splits bigint Número de divisiones procesadas para este segmento. Número de divisiones procesadas en este sector. En el caso de los archivos de datos divisibles de gran tamaño (por ejemplo, archivos que superan los 512 MB), Redshift Spectrum intenta dividir los archivos en varias solicitudes de S3 para procesarlos en paralelo.
splits_max entero Número máximo de divisiones procesadas en este sector.
splits_avg bigint Número medio de divisiones procesadas en este sector.
total_split_size bigint Tamaño total de todas las divisiones procesadas.
max_split_size bigint Tamaño máximo en bytes de las divisiones procesadas.
avg_split_size bigint Tamaño medio en bytes de las divisiones procesadas.
total_retries bigint La cantidad total de reintentos de la consulta de Redshift Spectrum en este segmento. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. Para obtener información sobre los reintentos del cliente de Amazon S3 en RG, consulte STL_S3CLIENT.
max_retries entero Cantidad máxima de reintentos para un archivo individual procesado. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. Para obtener información sobre los reintentos del cliente de Amazon S3 en RG, consulte STL_S3CLIENT.
max_request_duration bigint La duración máxima de una solicitud de un archivo individual (en microsegundos). Si las consultas tienen demasiado tiempo de ejecución, esto podría deberse a un cuello de botella. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
avg_request_duration bigint La duración media de las solicitudes de archivo (en microsegundos). En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
max_request_parallelism entero La cantidad máxima de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
avg_request_parallelism double precision La cantidad promedio de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
total_slowdown_count bigint La cantidad total de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.
max_slowdown_count entero La cantidad máxima de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa en un sector. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1.

Consulta de ejemplo

En el siguiente ejemplo, se obtienen los detalles del paso de examen para la última consulta ejecutada.

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------               
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0