Timestream para InfluxDB como destino

O Amazon Timestream for InfluxDB é um serviço gerenciado de banco de dados de séries temporais que usa APIs InfluxDB de código aberto para AWS aplicativos em tempo real. Ele oferece facilidade na configuração, operação e escalabilidade, fornecendo consultas com tempos de resposta de um dígito em milissegundos.

A primeira etapa para determinar se o Timestream for InfluxDB é um alvo de migração apropriado para seu caso de uso é determinar a cardinalidade do seu Timestream for table. LiveAnalytics Desenvolvemos um script que calcula a cardinalidade da tabela no Timestream para. LiveAnalytics Esse cálculo atende a dois propósitos:

Verificar se a cardinalidade está abaixo de 10 milhões, o que ajudará a determinar se o Timestream para InfluxDB pode lidar com seu caso de uso.
Ajudar você a decidir qual tipo de instância Timestream para InfluxDB usar.

A cardinalidade no InfluxDB é o número de medições, tags e combinações de teclas de campo exclusivas em um bucket do InfluxDB. Consulte a documentação do Timestream para InfluxDB sobre gerenciamento de cardinalidade para entender como exceder os limites recomendados pode degradar o desempenho da consulta e aumentar o consumo de memória. Compare seus padrões de consulta previstos com amostras de dados representativas antes de finalizar sua seleção de instância para garantir que suas consultas continuem funcionando após a migração. Preste atenção às consultas de agregação que consomem muita memória e que podem se comportar de forma diferente do que no Timestream for. LiveAnalytics Ao migrar do Timestream para LiveAnalytics, selecione cuidadosamente suas especificações de instância do InfluxDB com base na cardinalidade do seu conjunto de dados, pois isso afeta diretamente o desempenho e a necessidade de recursos. Recomendamos considerar outros destinos se sua cardinalidade de dados for superior a 10 milhões.

Visão geral do script de cálculo de cardinalidade

O script de cálculo de cardinalidade calcula a cardinalidade de um Timestream para a tabela. LiveAnalytics Se a cardinalidade for inferior a 10 milhões, o script recomenda um tipo de instância do Timestream para InfluxDB. Usando o mapeamento de esquema padrão, a cardinalidade é calculada pelo cálculo do total de combinações exclusivas de dimensões e do nome da medida. Escolher as tags de protocolo de linha corretas (equivalentes às dimensões no Timestream for LiveAnalytics) ajuda você a indexar automaticamente seus dados e filtrá-los de forma eficiente usando tags. O script também oferece a opção de excluir dimensões específicas ao calcular a cardinalidade. Se aplicável ao seu caso, ou seja, se você não estiver usando determinadas dimensões para filtrar dados em consultas SQL (especificamente não as usando como predicados), você poderá excluir essas dimensões do cálculo de cardinalidade. Posteriormente, você pode ingeri-los como campos (equivalentes às medidas no Timestream for LiveAnalytics) nas próximas etapas da migração.

Pré-requisitos e instalação

Consulte a seção de Pré-requisitos e instalação no README do script de cardinalidade.

Uso básico

Para determinar a cardinalidade de uma tabela (example_table) no banco de dados example_database, o script pode ser usado da seguinte forma:

exemplo


python3 cardinality.py \
    --table-name example_table \
    --database-name example_database

Isso produz o seguinte resultado:


Cardinality of "example_database"."example_table": 160
Your recommended Timestream for InfluxDB type is: db.influx.medium

Recomendações

O script verifica automaticamente a tabela inteira para calcular a cardinalidade e, ao mesmo tempo, oferece opções de filtro de tempo para a execução ideal da consulta. Sugerimos a implementação de filtros de tempo quando seus dados envolverem dimensões consistentes e ao analisar variações de dimensões distintas em toda a tabela produzir resultados semelhantes aos da análise de intervalos de tempo específicos. Essa abordagem garante a execução eficiente da consulta.

Para obter mais informações, consulte README do script de cardinalidade.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Exportando dados do Timestream para o Amazon S3

Ingestão de dados do Amazon S3 para automação do Timestream para InfluxDB