Comparando uma consulta em uma tabela base com uma consulta de resultados de consultas agendadas - Amazon Timestream

Para recursos semelhantes aos do Amazon Timestream para, considere o Amazon Timestream LiveAnalytics para InfluxDB. Ele oferece ingestão de dados simplificada e tempos de resposta de consulta de um dígito em milissegundos para análises em tempo real. Saiba mais aqui.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Comparando uma consulta em uma tabela base com uma consulta de resultados de consultas agendadas

Neste exemplo de consulta do Timestream, empregamos o esquema, ilustrações de consultas e resultados subsequentes, a fim de comparar uma consulta em uma tabela base com uma consulta em uma tabela derivada de resultados obtidos por meio de consultas programadas. Através de uma consulta agendada devidamente elaborada, é possível gerar uma tabela derivada que apresente um número reduzido de registros e outras peculiaridades, possibilitando consultas mais ágeis em comparação à tabela base original.

Para assistir a um vídeo que descreve esse cenário, consulte Melhore o desempenho das consultas e reduza os custos usando consultas agendadas no Amazon Timestream para LiveAnalytics

Para este cenário, você pode usar o exemplo a seguir.

  • Region – us-east-1

  • Tabela base"clickstream"."shopping"

  • Tabela derivada"clickstream"."aggregate"

Tabela base

A seguir, é descrito o esquema da tabela base.

Coluna Tipo Tipo de atributo do Timestream para LiveAnalytics

canal

varchar

MULTI

descrição

varchar

MULTI

evento

varchar

DIMENSÃO

ip_address

varchar

DIMENSÃO

measure_name

varchar

MEASURE_NAME

produto

varchar

MULTI

product_id

varchar

MULTI

quantidade

double

MULTI

consulta

varchar

MULTI

session_id

varchar

DIMENSÃO

user_group

varchar

DIMENSÃO

user_id

varchar

DIMENSÃO

A seguir, são descritas as medidas para a tabela base. Uma tabela base se refere a uma tabela no Timestream na qual a consulta agendada é executada.

  • measure_namemetrics

  • dados — vários

  • dimensões:

    [ ( user_group, varchar ),( user_id, varchar ),( session_id, varchar ),( ip_address, varchar ),( event, varchar ) ]

Consulta em uma tabela base

Veja a seguir uma consulta ad-hoc que reúne contagens por um agregado de 5 minutos em um determinado intervalo de tempo.

SELECT BIN(time, 5m) as time, channel, product_id, SUM(quantity) as product_quantity FROM "clickstream"."shopping" WHERE BIN(time, 5m) BETWEEN '2023-05-11 10:10:00.000000000' AND '2023-05-11 10:30:00.000000000' AND channel = 'Social media' and product_id = '431412' GROUP BY BIN(time, 5m),channel,product_id

Resultado:

duration:1.745 sec
Bytes scanned: 29.89 MB
Query Id: AEBQEANMHG7MHHBHCKJ3BSOE3QUGIDBGWCCP5I6J6YUW5CVJZ2M3JCJ27QRMM7A
Row count:5

Consulta programada

Veja a seguir uma consulta agendada que é executada a cada 5 minutos.

SELECT BIN(time, 5m) as time, channel as measure_name, product_id, product, SUM(quantity) as product_quantity FROM "clickstream"."shopping" WHERE time BETWEEN BIN(@scheduled_runtime, 5m) - 10m AND BIN(@scheduled_runtime, 5m) - 5m AND channel = 'Social media' GROUP BY BIN(time, 5m), channel, product_id, product

Consulta em uma tabela derivada

Veja a seguir uma consulta ad-hoc em uma tabela derivada. Uma tabela derivada se refere a uma tabela Timestream que contém os resultados de uma consulta agendada.

SELECT time, measure_name, product_id,product_quantity FROM "clickstream"."aggregate" WHERE time BETWEEN '2023-05-11 10:10:00.000000000' AND '2023-05-11 10:30:00.000000000' AND measure_name = 'Social media' and product_id = '431412'

Resultado:

duration: 0.2960 sec
Bytes scanned: 235.00 B
QueryID: AEBQEANMHHAAQU4FFTT6CFM6UYXTL4SMLZV22MFP4KV2Z7IRVOPLOMLDD6BR33Q
Row count: 5

Comparação

Veja a seguir uma comparação dos resultados de uma consulta em uma tabela base com uma consulta em uma tabela derivada. A mesma consulta em uma tabela derivada, que apresenta resultados agregados por meio de uma consulta programada, é finalizada de forma mais eficiente, consumindo uma quantidade reduzida de bytes escaneados.

Esses resultados mostram o valor de usar consultas agendadas para agregar dados para consultas mais rápidas.

Consulta na tabela base Consulta na tabela derivada

Duração

1,745 seg

0,2960 seg

Bytes escaneados

29,89 MB

235 bytes

Número de linhas

5

5