Amazon Redshift dejará de admitir la creación de nuevas UDF de Python a partir del parche 198. Las UDF de Python existentes seguirán funcionando hasta el 30 de junio de 2026. Para obtener más información, consulte la publicación del blog
SVCS_S3QUERY_SUMMARY
Use la vista SVCS_S3QUERY_SUMMARY para obtener un resumen de todas las consultas de lago de datos que se han ejecutado en el sistema. Un segmento puede realizar un análisis de tablas externas.
nota
Las vistas del sistema con el prefijo SVCS proporcionan información sobre las consultas de los clústeres principal y de escalado de simultaneidad. Las vistas son similares a las vista con el prefijo SVL, con la salvedad de que las vistas SVL solo proporcionan información para las consultas ejecutadas en el clúster principal.
Todos los usuarios pueden ver SVCS_S3QUERY_SUMMARY. Los superusuarios pueden ver todas las filas; los usuarios normales solo pueden ver sus datos. Para obtener más información, consulte Visibilidad de datos en las tablas y vistas de sistema.
Para obtener más información sobre SVL_S3QUERY, consulte SVL_S3QUERY.
Columnas de la tabla
| Nombre de la columna | Tipo de datos: | Descripción |
|---|---|---|
| userid | entero | ID del usuario que generó la entrada dada. |
| consulta | entero | El ID de la consulta. Puede usar este valor para combinar distintas vistas y tablas del sistema. |
| xid | bigint | El ID de la transacción. |
| pid | entero | El ID del proceso. |
| segment | entero | El número del segmento. Una consulta consta de distintos segmentos y cada segmento consta de uno o más pasos. |
| paso | entero | El paso de la consulta que se ejecutó. |
| starttime | marca de tiempo | La hora en UTC a la que comenzó a ejecutarse la consulta de Redshift Spectrum en este segmento. Un segmento puede tener un análisis de tablas externas. |
| endtime | marca de tiempo | La hora en UTC a la que terminó de ejecutarse la consulta de Redshift Spectrum en este segmento. Un segmento puede tener un análisis de tablas externas. |
| elapsed | entero | El tiempo que tardó la consulta de Redshift Spectrum en ejecutarse en este segmento (en microsegundos). |
| aborted | entero | Si el sistema detuvo la consulta o el usuario la canceló, esta columna tendrá el valor 1. Si la consulta se ejecutó hasta su finalización, esta columna tendrá el valor 0. |
| external_table_name | char (136) | El formato interno del nombre del nombre externo de la tabla para el examen de la tabla externa. |
| file_format | character(16) | El formato de archivo de los datos de la tabla externa. |
| is_partitioned | char(1) | Si es true (t), el valor de esta columna indica que la tabla externa está particionada. |
| is_rrscan | char (1) | Si es true (t), el valor de esta columna indica que se aplicó un examen de rango restringido. |
| is_nested | varchar(1) | Si es true (t), el valor de esta columna indica que se obtuvo acceso al tipo de datos de la columna anidada. |
| s3_scanned_rows | bigint | La cantidad de filas examinadas desde Amazon S3 y enviadas a la capa de Redshift Spectrum. En los clústeres con aprovisionamiento de RG, este es el número total de filas que el lector nativo del clúster analiza directamente desde Amazon S3 en todos los sectores, antes de la aplicación del filtro. |
| s3_scanned_bytes | bigint | La cantidad de bytes examinados desde Amazon S3 y enviados a la capa de Redshift Spectrum, según los datos comprimidos. En los clústeres con aprovisionamiento de RG, este es el número total de bytes que el lector nativo del clúster analiza directamente desde Amazon S3 en todos los sectores, antes de la aplicación del filtro. |
| s3query_returned_rows | bigint | La cantidad de filas devueltas desde la capa Redshift Spectrum hasta el clúster. En los clústeres con aprovisionamiento de RG, este es el número total de filas devueltas por el lector nativo del clúster en todos los sectores tras la aplicación del filtro. |
| s3query_returned_bytes | bigint | La cantidad de bytes devueltos desde la capa Redshift Spectrum hasta el clúster. Una gran cantidad de datos devueltos a Amazon Redshift podría afectar el rendimiento del sistema. En los clústeres con aprovisionamiento de RG, este es el número total de bytes devueltos por el lector nativo del clúster en todos los sectores tras la aplicación del filtro. |
| files | entero | La cantidad de archivos que fueron procesados por esta consulta de lago de datos. Una pequeña cantidad de archivos limita los beneficios del procesamiento en paralelo. |
| files_max | entero | Cantidad total de archivos procesados en un sector. |
| files_avg | entero | Cantidad promedio de archivos procesados en un sector. |
| splits | bigint | Número de divisiones procesadas para este segmento. Número de divisiones procesadas en este sector. En el caso de los archivos de datos divisibles de gran tamaño (por ejemplo, archivos que superan los 512 MB), Redshift Spectrum intenta dividir los archivos en varias solicitudes de S3 para procesarlos en paralelo. |
| splits_max | entero | Número máximo de divisiones procesadas en este sector. |
| splits_avg | bigint | Número medio de divisiones procesadas en este sector. |
| total_split_size | bigint | Tamaño total de todas las divisiones procesadas. |
| max_split_size | bigint | Tamaño máximo en bytes de las divisiones procesadas. |
| avg_split_size | bigint | Tamaño medio en bytes de las divisiones procesadas. |
| total_retries | bigint | La cantidad total de reintentos de la consulta de Redshift Spectrum en este segmento. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. Para obtener información sobre los reintentos del cliente de Amazon S3 en RG, consulte STL_S3CLIENT. |
| max_retries | entero | Cantidad máxima de reintentos para un archivo individual procesado. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. Para obtener información sobre los reintentos del cliente de Amazon S3 en RG, consulte STL_S3CLIENT. |
| max_request_duration | bigint | La duración máxima de una solicitud de un archivo individual (en microsegundos). Si las consultas tienen demasiado tiempo de ejecución, esto podría deberse a un cuello de botella. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. |
| avg_request_duration | bigint | La duración media de las solicitudes de archivo (en microsegundos). En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. |
| max_request_parallelism | entero | La cantidad máxima de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. |
| avg_request_parallelism | double precision | La cantidad promedio de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. |
| total_slowdown_count | bigint | La cantidad total de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. |
| max_slowdown_count | entero | La cantidad máxima de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa en un sector. En los clústeres de tipo de nodo RG, esta columna está obsoleta y contiene -1. |
Consulta de ejemplo
En el siguiente ejemplo, se obtienen los detalles del paso de examen para la última consulta ejecutada.
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0