Consultas

Con Timestream for Live Analytics, puede almacenar y analizar fácilmente métricas para datos de sensores para DevOps aplicaciones de IoT y datos de telemetría industrial para el mantenimiento de equipos, así como muchos otros casos de uso. El motor de consultas adaptativo y diseñado específicamente de Timestream para Live Analytics le permite acceder a los datos en todos los niveles de almacenamiento mediante una sola instrucción de SQL. Accede a los datos de todos los niveles de almacenamiento y los combina de forma transparente sin necesidad de especificar la ubicación de los datos. Puede usar SQL para consultar datos en Timestream para Live Analytics recupere datos de serie temporal de una o más tablas. Puede acceder a la información de metadatos de las bases de datos y las tablas. SQL de Timestream para Live Analytics también admite funciones integradas para el análisis de series temporales. Puede consultar la referencia del Referencia del lenguaje de consulta para obtener detalles adicionales.

Timestream para Live Analytics está diseñado para tener una arquitectura de ingesta, almacenamiento y consulta de datos totalmente disociada, en la que cada componente puede escalarse de forma independiente de los demás componentes (lo que le permite ofrecer una escala prácticamente infinita para las necesidades de una aplicación). Esto significa que Timestream para Live Analytics no se interrumpe cuando las aplicaciones envían cientos de terabytes de datos al día o ejecutan millones de consultas para procesar cantidades pequeñas o grandes de datos. A medida que los datos aumentan con el tiempo, la latencia de las consultas en Timestream para Live Analytics permanece prácticamente inalterada. Esto se debe a que la arquitectura de consultas de Timestream para Live Analytics puede aprovechar enormes cantidades de paralelismo para procesar volúmenes de datos más grandes y escalar de forma automática para adaptarse a las necesidades de rendimiento de las consultas de una aplicación.

Modelo de datos

Timestream admite dos modelos de datos para las consultas: el modelo plano y el modelo de serie temporal.

nota

Los datos de Timestream se almacenan mediante el modelo plano y es el modelo predeterminado para consultar datos. El modelo de series temporales es un concepto de tiempo de consulta y se utiliza para el análisis de serie temporal.

Modelo plano
Modelo de serie temporal

Modelo plano

El modelo plano es el modelo de datos predeterminado de Timestream para las consultas. Representa datos de serie temporal en formato tabular. Los nombres de las dimensiones, el tiempo, los nombres de las medidas y los valores de las medidas aparecen como columnas. Cada fila de la tabla es un punto de datos atómicos que corresponde a una medición en un momento específico dentro de una serie temporal. Las columnas, las tablas y las bases de datos de Timestream tienen algunas restricciones de nomenclatura. Estos se describen en Límites de los servicios.

La siguiente tabla muestra un ejemplo ilustrativo de cómo Timestream almacena los datos que representan la utilización de la CPU, la utilización de la memoria y la actividad de la red de las instancias de EC2, cuando los datos se envían como un registro de medida única. En este caso, las dimensiones son la región, la zona de disponibilidad, la nube privada virtual y los identificadores las instancias de EC2. Las medidas son el uso de la CPU, el uso de la memoria y los datos de red entrantes para las instancias de EC2. Las columnas región, zona de disponibilidad, vpc e instance_id contienen los valores de las dimensiones. La columna time contiene la marca de tiempo de cada registro. La columna measure_name contiene los nombres de las medidas representadas por cpu-utilization, memory_utilization y network_bytes_in. Las columnas measure_value::double contienen las mediciones emitidas como dobles (por ejemplo, la utilización de la CPU y la utilización de la memoria). La columna measure_value::bigint contiene las medidas emitidas como números enteros, por ejemplo, los datos de red entrantes.

Time	region	az	vpc	instance_id	measure_name	measure_value::double	measure_value::bigint
2019-12-04 19:00:00.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	cpu_utilization	35,0	null
2019-12-04 19:00:01.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	cpu_utilization	38,2	null
2019-12-04 19:00:02.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	cpu_utilization	45,3	null
2019-12-04 19:00:00.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	54,9	null
2019-12-04 19:00:01.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	42,6	null
2019-12-04 19:00:02.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	memory_utilization	3.3	null
2019-12-04 19:00:00.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	network_bytes	34.400	null
2019-12-04 19:00:01.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	network_bytes	1500	null
2019-12-04 19:00:02.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	network_bytes	6000	null

Time	region	az	vpc	instance_id	measure_name	cpu_utilization	memory_utilization	network_bytes
2019-12-04 19:00:00.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	métricas	35,0	54,9	34.400
2019-12-04 19:00:01.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	métricas	38,2	42,6	1500
2019-12-04 19:00:02.000000000	us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	métricas	45,3	3.3	6600

Modelo de serie temporal

El modelo de series temporales es un constructo de tiempo de consulta y se utiliza para el análisis de serie temporal. Representa los datos como una secuencia ordenada de pares (tiempo, valor de medición). Timestream admite funciones de serie temporal, como la interpolación, para que pueda cubrir los vacíos en los datos. Para utilizar estas funciones, debe convertir los datos al modelo de serie temporal mediante funciones como create_time_series. Consulte Referencia del lenguaje de consulta para obtener más detalles.

Utilizando el ejemplo anterior de la instancia de EC2, aquí están los datos de uso de la CPU expresados como una serie temporal.

region	az	vpc	instance_id	cpu_utilization
us-east-1	us-east-1d	vpc-1a2b3c4d	i-1234567890abcdef0	[{time: 2019-12-04 19:00:00.000000000, value: 35}, {time: 2019-12-04 19:00:01.000000000, value: 38.2}, {time: 2019-12-04 19:00:02.000000000, value: 45.3}]

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Almacenamiento

Consultas programadas