Para obtener capacidades similares a las de Amazon Timestream, considere Amazon Timestream LiveAnalytics para InfluxDB. Ofrece una ingesta de datos simplificada y tiempos de respuesta a las consultas en milisegundos de un solo dígito para realizar análisis en tiempo real. Obtenga más información aquí.
Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Consultas
Con Timestream para Live Analytics, puede almacenar y analizar con facilidad las métricas para DevOps, datos de sensores para aplicaciones de IoT y datos de telemetría industrial para el mantenimiento de equipos. El motor de consultas adaptativo y diseñado específicamente de Timestream para Live Analytics le permite acceder a los datos en todos los niveles de almacenamiento mediante una sola instrucción de SQL. Accede a los datos de todos los niveles de almacenamiento y los combina de forma transparente sin necesidad de especificar la ubicación de los datos. Puede usar SQL para consultar datos en Timestream para Live Analytics recupere datos de serie temporal de una o más tablas. Puede acceder a la información de metadatos de las bases de datos y las tablas. SQL de Timestream para Live Analytics también admite funciones integradas para el análisis de series temporales. Puede consultar la referencia del Referencia del lenguaje de consulta para obtener detalles adicionales.
Timestream para Live Analytics está diseñado para tener una arquitectura de ingesta, almacenamiento y consulta de datos totalmente disociada, en la que cada componente puede escalarse de forma independiente de los demás componentes (lo que le permite ofrecer una escala prácticamente infinita para las necesidades de una aplicación). Esto significa que Timestream para Live Analytics no se interrumpe cuando las aplicaciones envían cientos de terabytes de datos al día o ejecutan millones de consultas para procesar cantidades pequeñas o grandes de datos. A medida que los datos aumentan con el tiempo, la latencia de las consultas en Timestream para Live Analytics permanece prácticamente inalterada. Esto se debe a que la arquitectura de consultas de Timestream para Live Analytics puede aprovechar enormes cantidades de paralelismo para procesar volúmenes de datos más grandes y escalar de forma automática para adaptarse a las necesidades de rendimiento de las consultas de una aplicación.
Modelo de datos
Timestream admite dos modelos de datos para las consultas: el modelo plano y el modelo de serie temporal.
nota
Los datos de Timestream se almacenan mediante el modelo plano y es el modelo predeterminado para consultar datos. El modelo de series temporales es un concepto de tiempo de consulta y se utiliza para el análisis de serie temporal.
Modelo plano
El modelo plano es el modelo de datos predeterminado de Timestream para las consultas. Representa datos de serie temporal en formato tabular. Los nombres de las dimensiones, el tiempo, los nombres de las medidas y los valores de las medidas aparecen como columnas. Cada fila de la tabla es un punto de datos atómicos que corresponde a una medición en un momento específico dentro de una serie temporal. Las columnas, las tablas y las bases de datos de Timestream tienen algunas restricciones de nomenclatura. Estos se describen en Límites de los servicios.
La siguiente tabla muestra un ejemplo ilustrativo de cómo Timestream almacena los datos que representan la utilización de la CPU, la utilización de la memoria y la actividad de la red de las instancias de EC2, cuando los datos se envían como un registro de medida única. En este caso, las dimensiones son la región, la zona de disponibilidad, la nube privada virtual y los identificadores las instancias de EC2. Las medidas son el uso de la CPU, el uso de la memoria y los datos de red entrantes para las instancias de EC2. Las columnas región, zona de disponibilidad, vpc e instance_id contienen los valores de las dimensiones. La columna time contiene la marca de tiempo de cada registro. La columna measure_name contiene los nombres de las medidas representadas por cpu-utilization, memory_utilization y network_bytes_in. Las columnas measure_value::double contienen las mediciones emitidas como dobles (por ejemplo, la utilización de la CPU y la utilización de la memoria). La columna measure_value::bigint contiene las medidas emitidas como números enteros, por ejemplo, los datos de red entrantes.
| Time | region | az | vpc | instance_id | measure_name | measure_value::double | measure_value::bigint |
|---|---|---|---|---|---|---|---|
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
35,0 |
null |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
38,2 |
null |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
45,3 |
null |
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
54,9 |
null |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
42,6 |
null |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
33,3 |
null |
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
34 400 |
null |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
1500 |
null |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
6000 |
null |
La siguiente tabla muestra un ejemplo ilustrativo de cómo Timestream almacena los datos que representan la utilización de la CPU, la utilización de la memoria y la actividad de la red de las instancias de EC2, cuando los datos se envían como un registro de múltiples medidas.
| Time | region | az | vpc | instance_id | measure_name | cpu_utilization | memory_utilization | network_bytes |
|---|---|---|---|---|---|---|---|---|
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
35,0 |
54,9 |
34 400 |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
38,2 |
42,6 |
1500 |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
45,3 |
33,3 |
6600 |
Modelo de serie temporal
El modelo de series temporales es un constructo de tiempo de consulta y se utiliza para el análisis de serie temporal. Representa los datos como una secuencia ordenada de pares (tiempo, valor de medición). Timestream admite funciones de serie temporal, como la interpolación, para que pueda cubrir los vacíos en los datos. Para utilizar estas funciones, debe convertir los datos al modelo de serie temporal mediante funciones como create_time_series. Consulte Referencia del lenguaje de consulta para obtener más detalles.
Utilizando el ejemplo anterior de la instancia de EC2, aquí están los datos de uso de la CPU expresados como una serie temporal.
| region | az | vpc | instance_id | cpu_utilization |
|---|---|---|---|---|
|
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
[{time: 2019-12-04 19:00:00.000000000, value: 35}, {time: 2019-12-04 19:00:01.000000000, value: 38.2}, {time: 2019-12-04 19:00:02.000000000, value: 45.3}] |