Para recursos semelhantes aos do Amazon Timestream para, considere o Amazon Timestream LiveAnalytics para InfluxDB. Ele oferece ingestão de dados simplificada e tempos de resposta de consulta de um dígito em milissegundos para análises em tempo real. Saiba mais aqui.
As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Consultas
Com o Timestream para Live Analytics, você pode facilmente armazenar e analisar métricas para DevOps, dados de sensores para aplicativos de IoT e dados de telemetria industrial para manutenção de equipamentos, além de muitos outros casos de uso. O mecanismo de consulta adaptável e criado especificamente no Timestream para Live Analytics permite que você acesse dados em vários níveis de armazenamento usando uma única declaração SQL. Ele acessa e combina dados de forma transparente em todos os níveis de armazenamento sem exigir que você especifique a localização dos dados. Você pode usar o SQL para consultar dados no Timestream para Live Analytics para recuperar dados de séries temporais de uma ou mais tabelas. Você pode acessar as informações de metadados para bancos de dados e tabelas. O SQL do Timestream para Live Analytics também oferece suporte a funções integradas para análise de séries temporais. Para obter detalhes adicionais, consulte a referência Referência da linguagem de consulta.
O Timestream para Live Analytics foi projetado para ter uma arquitetura de ingestão de dados, armazenamento e consulta totalmente dissociada, na qual cada componente pode ser escalado independentemente de outros componentes (permitindo que ele ofereça uma escala praticamente infinita para as necessidades de um aplicativo). Isso significa que o Timestream para Live Analytics não “entorna” quando seus aplicativos enviam centenas de terabytes de dados por dia ou executam milhões de consultas processando pequenas ou grandes quantidades de dados. À medida que seus dados crescem com o tempo, a latência da consulta no Timestream para Live Analytics permanece praticamente inalterada. Isso ocorre porque a arquitetura de consulta Timestream para Live Analytics consegue aproveitar grandes quantidades de paralelismo para processar volumes de dados maiores e escalar automaticamente para atender às necessidades de throughput de consultas de um aplicativo.
Modelo de dados
O Timestream oferece suporte a dois modelos de dados para consultas: o modelo plano e o modelo de série temporal.
nota
Os dados no Timestream são armazenados usando o modelo plano, que é o modelo padrão para consultar dados. O modelo de séries temporais é um conceito de tempo de consulta e é usado para análise de séries temporais.
Modelo plano
O modelo plano é o modelo de dados padrão do Timestream para consultas. Ele representa dados de séries temporais em formato tabular. Os nomes das dimensões, a hora, os nomes das medidas e os valores das medidas aparecem como colunas. Cada linha na tabela é um ponto de dados atômico correspondente a uma medição em um momento específico dentro de uma série temporal. Bancos de dados, tabelas e colunas do Timestream têm algumas restrições de nomenclatura. Elas estão descritas em Limites do serviço.
A tabela abaixo mostra um exemplo ilustrativo de como o Timestream armazena dados que representam a utilização da CPU, a utilização da memória e a atividade de rede das instâncias do EC2, quando os dados são enviados como um registro de medida única. Nesse caso, as dimensões são a região, a zona de disponibilidade, a nuvem privada virtual e os IDs de instância das instâncias do EC2. As medidas são a utilização da CPU, a utilização da memória e os dados de rede recebidos para as instâncias do EC2. As colunas region, az, vpc e instance_id contêm os valores da dimensão. A coluna time contém a data e hora de cada registro. A coluna measure_name contém os nomes das medidas representadas por cpu-utilization, memory_utilization e network_bytes_in. As colunas measure_value::double contêm medições emitidas como duplas (por exemplo, utilização da CPU e utilização da memória). A coluna measure_value::bigint contém medidas emitidas como números inteiros, por exemplo, os dados de entrada da rede.
| Tempo | região | az | vpc | instance_id | nome_medida | valor_medida::duplo | valor_medida::bigint |
|---|---|---|---|---|---|---|---|
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
35.0 |
nulo |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
38.2 |
nulo |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
45.3 |
nulo |
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
54.9 |
nulo |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
42.6 |
nulo |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
33,3 |
nulo |
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
34.400 |
nulo |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
1.500 |
nulo |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
6.000 |
nulo |
A tabela abaixo mostra um exemplo ilustrativo de como o Timestream armazena dados que representam a utilização da CPU, a utilização da memória e a atividade de rede das instâncias do EC2, quando os dados são enviados como um registro de várias medidas.
| Tempo | região | az | vpc | instance_id | nome_medida | cpu_utilization | memory_utilization | network_bytes |
|---|---|---|---|---|---|---|---|---|
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
35.0 |
54.9 |
34.400 |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
38.2 |
42.6 |
1.500 |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
métricas |
45.3 |
33,3 |
6.600 |
Modelo de série temporal
O modelo de séries temporais é uma construção de tempo de consulta usada para análise de séries temporais. Ele representa os dados como uma sequência ordenada de pares (tempo, valor da medida). O Timestream suporta funções de séries temporais, como interpolação, para permitir que você preencha as lacunas em seus dados. Para usar essas funções, você deve converter seus dados no modelo de série temporal usando funções como create_time_series. Para obter mais detalhes, consulte Referência da linguagem de consulta.
Usando o exemplo anterior da instância do EC2, aqui estão os dados de utilização da CPU expressos como uma série temporal.
| região | az | vpc | instance_id | cpu_utilization |
|---|---|---|---|---|
|
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
[{time: 2019-12-04 19:00:00.000000000, value: 35}, {time: 2019-12-04 19:00:01.000000000, value: 38.2}, {time: 2019-12-04 19:00:02.000000000, value: 45.3}] |