Para recursos semelhantes aos do Amazon Timestream para LiveAnalytics, considere o Amazon Timestream para InfluxDB. Ele oferece ingestão de dados simplificada e tempos de resposta de consulta de um dígito em milissegundos para análises em tempo real. Saiba mais aqui.
Usando o carregamento em lote com a AWS CLI
Configuração
Para começar a usar o carregamento em lote, siga estas etapas.
-
Instale AWS CLI usando as instruções em Acessar o Amazon Timestream para LiveAnalytics usando o AWS CLI.
-
Execute o comando a seguir para verificar se os comandos CLI do Timestream foram atualizados. Verifique se create-batch-load-task está na lista.
aws timestream-write help -
Prepare uma fonte de dados usando as instruções em Preparando um arquivo de dados de carregamento em lote.
-
Para criar banco de dados e tabela usando as instruções em Acessar o Amazon Timestream para LiveAnalytics usando o AWS CLI.
-
Criar um bucket do S3 para a saída do relatório. O bucket deve estar na mesma Região. Para ter informações sobre os buckets, consulte Criar, configurar e trabalhar com buckets do Amazon S3.
-
Crie uma tarefa de carregamento em lote. Para obter as etapas, consulte Criar uma tarefa de carregamento em lote.
-
Confirmar o status da tarefa. Para obter as etapas, consulte Descrever a tarefa de carregamento em lote.
Criar uma tarefa de carregamento em lote
Você pode criar uma tarefa de carregamento em lote com o comando create-batch-load-task. Ao criar uma tarefa de carregamento em lote usando a CLI, você pode usar um parâmetro JSON, cli-input-json, que permite agregar os parâmetros em um único fragmento JSON. Você também pode separar esses detalhes usando vários outros parâmetros, inclusive data-model-configuration, data-source-configuration, report-configuration, target-database-name e target-table-name.
Para obter um exemplo, consulte Criar exemplo de tarefa de carregamento em lote
Descrever a tarefa de carregamento em lote
Você pode recuperar uma descrição da tarefa de carregamento em lote da seguinte forma.
aws timestream-write describe-batch-load-task --task-id<value>
Veja a seguir uma resposta de exemplo.
{ "BatchLoadTaskDescription": { "TaskId": "<TaskId>", "DataSourceConfiguration": { "DataSourceS3Configuration": { "BucketName": "test-batch-load-west-2", "ObjectKeyPrefix": "sample.csv" }, "CsvConfiguration": {}, "DataFormat": "CSV" }, "ProgressReport": { "RecordsProcessed": 2, "RecordsIngested": 0, "FileParseFailures": 0, "RecordIngestionFailures": 2, "FileFailures": 0, "BytesIngested": 119 }, "ReportConfiguration": { "ReportS3Configuration": { "BucketName": "test-batch-load-west-2", "ObjectKeyPrefix": "<ObjectKeyPrefix>", "EncryptionOption": "SSE_S3" } }, "DataModelConfiguration": { "DataModel": { "TimeColumn": "timestamp", "TimeUnit": "SECONDS", "DimensionMappings": [ { "SourceColumn": "vehicle", "DestinationColumn": "vehicle" }, { "SourceColumn": "registration", "DestinationColumn": "license" } ], "MultiMeasureMappings": { "TargetMultiMeasureName": "test", "MultiMeasureAttributeMappings": [ { "SourceColumn": "wgt", "TargetMultiMeasureAttributeName": "weight", "MeasureValueType": "DOUBLE" }, { "SourceColumn": "spd", "TargetMultiMeasureAttributeName": "speed", "MeasureValueType": "DOUBLE" }, { "SourceColumn": "fuel", "TargetMultiMeasureAttributeName": "fuel", "MeasureValueType": "DOUBLE" }, { "SourceColumn": "miles", "TargetMultiMeasureAttributeName": "miles", "MeasureValueType": "DOUBLE" } ] } } }, "TargetDatabaseName": "BatchLoadExampleDatabase", "TargetTableName": "BatchLoadExampleTable", "TaskStatus": "FAILED", "RecordVersion": 1, "CreationTime": 1677167593.266, "LastUpdatedTime": 1677167602.38 } }
Listar tarefas de carregamento em lote
Você pode listar as tarefas de carregamento em lote da seguinte forma.
aws timestream-write list-batch-load-tasks
Uma saída é exibida da seguinte forma.
{ "BatchLoadTasks": [ { "TaskId": "<TaskId>", "TaskStatus": "FAILED", "DatabaseName": "BatchLoadExampleDatabase", "TableName": "BatchLoadExampleTable", "CreationTime": 1677167593.266, "LastUpdatedTime": 1677167602.38 } ] }
Retomar tarefa de carregamento em lote
Você pode retomar uma tarefa de carregamento em lote da seguinte forma.
aws timestream-write resume-batch-load-task --task-id<value>
Uma resposta pode indicar sucesso ou conter informações de erro.
Criar exemplo de tarefa de carregamento em lote
-
Crie um Timestream para o banco de dados LiveAnalytics chamado
BatchLoade uma tabela chamadaBatchLoadTest. Verifique e, se necessário, ajuste os valores paraMemoryStoreRetentionPeriodInHourseMagneticStoreRetentionPeriodInDays.aws timestream-write create-database --database-name BatchLoad \ aws timestream-write create-table --database-name BatchLoad \ --table-name BatchLoadTest \ --retention-properties "{\"MemoryStoreRetentionPeriodInHours\": 12, \"MagneticStoreRetentionPeriodInDays\": 100}" -
Usando o console, crie um bucket S3 e copie o arquivo
sample.csvpara esse local. Você pode baixar um exemplo de CSV em Amostra CSV. -
Usando o console, crie um bucket do S3 para o Timestream para LiveAnalytics para escrever um relatório se a tarefa de carregamento em lote for concluída com erros.
-
Crie uma tarefa de carregamento em lote. Certifique-se de substituir
$INPUT_BUCKETe$REPORT_BUCKETpelos buckets que você criou nas etapas anteriores.aws timestream-write create-batch-load-task \ --data-model-configuration "{\ \"DataModel\": {\ \"TimeColumn\": \"timestamp\",\ \"TimeUnit\": \"SECONDS\",\ \"DimensionMappings\": [\ {\ \"SourceColumn\": \"vehicle\"\ },\ {\ \"SourceColumn\": \"registration\",\ \"DestinationColumn\": \"license\"\ }\ ], \"MultiMeasureMappings\": {\ \"TargetMultiMeasureName\": \"mva_measure_name\",\ \"MultiMeasureAttributeMappings\": [\ {\ \"SourceColumn\": \"wgt\",\ \"TargetMultiMeasureAttributeName\": \"weight\",\ \"MeasureValueType\": \"DOUBLE\"\ },\ {\ \"SourceColumn\": \"spd\",\ \"TargetMultiMeasureAttributeName\": \"speed\",\ \"MeasureValueType\": \"DOUBLE\"\ },\ {\ \"SourceColumn\": \"fuel_consumption\",\ \"TargetMultiMeasureAttributeName\": \"fuel\",\ \"MeasureValueType\": \"DOUBLE\"\ },\ {\ \"SourceColumn\": \"miles\",\ \"MeasureValueType\": \"BIGINT\"\ }\ ]\ }\ }\ }" \ --data-source-configuration "{ \"DataSourceS3Configuration\": {\ \"BucketName\": \"$INPUT_BUCKET\",\ \"ObjectKeyPrefix\": \"$INPUT_OBJECT_KEY_PREFIX\" },\ \"DataFormat\": \"CSV\"\ }" \ --report-configuration "{\ \"ReportS3Configuration\": {\ \"BucketName\": \"$REPORT_BUCKET\",\ \"EncryptionOption\": \"SSE_S3\"\ }\ }" \ --target-database-name BatchLoad \ --target-table-name BatchLoadTestO comando anterior retorna a seguinte saída.
{ "TaskId": "TaskId" } -
Verifique o progresso da tarefa. Certifique-se de substituir
$TASK_IDpelo ID da tarefa que foi retornado na etapa anterior.aws timestream-write describe-batch-load-task --task-id$TASK_ID
Exemplo de saída
{ "BatchLoadTaskDescription": { "ProgressReport": { "BytesIngested": 1024, "RecordsIngested": 2, "FileFailures": 0, "RecordIngestionFailures": 0, "RecordsProcessed": 2, "FileParseFailures": 0 }, "DataModelConfiguration": { "DataModel": { "DimensionMappings": [ { "SourceColumn": "vehicle", "DestinationColumn": "vehicle" }, { "SourceColumn": "registration", "DestinationColumn": "license" } ], "TimeUnit": "SECONDS", "TimeColumn": "timestamp", "MultiMeasureMappings": { "MultiMeasureAttributeMappings": [ { "TargetMultiMeasureAttributeName": "weight", "SourceColumn": "wgt", "MeasureValueType": "DOUBLE" }, { "TargetMultiMeasureAttributeName": "speed", "SourceColumn": "spd", "MeasureValueType": "DOUBLE" }, { "TargetMultiMeasureAttributeName": "fuel", "SourceColumn": "fuel_consumption", "MeasureValueType": "DOUBLE" }, { "TargetMultiMeasureAttributeName": "miles", "SourceColumn": "miles", "MeasureValueType": "DOUBLE" } ], "TargetMultiMeasureName": "mva_measure_name" } } }, "TargetDatabaseName": "BatchLoad", "CreationTime": 1672960381.735, "TaskStatus": "SUCCEEDED", "RecordVersion": 1, "TaskId": "TaskId", "TargetTableName": "BatchLoadTest", "ReportConfiguration": { "ReportS3Configuration": { "EncryptionOption": "SSE_S3", "ObjectKeyPrefix": "ObjectKeyPrefix", "BucketName": "amzn-s3-demo-bucket" } }, "DataSourceConfiguration": { "DataSourceS3Configuration": { "ObjectKeyPrefix": "sample.csv", "BucketName": "amzn-s3-demo-source-bucket" }, "DataFormat": "CSV", "CsvConfiguration": {} }, "LastUpdatedTime": 1672960387.334 } }