Preparación de un archivo de datos de carga por lotes - Amazon Timestream

Para obtener capacidades similares a las de Amazon Timestream para LiveAnalytics, considere Amazon Timestream para InfluxDB. Ofrece una ingesta de datos simplificada y tiempos de respuesta a las consultas en milisegundos de un solo dígito para realizar análisis en tiempo real. Obtenga más información aquí.

Preparación de un archivo de datos de carga por lotes

Un archivo de datos de origen tiene valores separados por delimitadores. El término más específico, valores separados por comas (CSV) se usa de forma genérica. Los separadores de columnas válidos incluyen comas y barras verticales. Los registros se separan mediante líneas nuevas. Los archivos deben almacenarse en Amazon S3. Al crear una nueva tarea de carga por lotes, la ubicación de los datos de origen se especifica mediante un ARN para el archivo. Un archivo contiene encabezados. Una columna representa la marca de tiempo. Al menos otra columna representa una medida.

Los buckets de S3 que se usan con la carga por lotes deben estar en la misma región que la tabla Timestream para LiveAnalytics que se usa en la carga por lotes. No añada ni elimine archivos del bucket de S3 que se usa en la carga por lotes una vez que se haya enviado esta tarea. Para obtener más información acerca del trabajo con buckets de S3, consulte Introducción a Amazon S3.

nota

Los archivos CSV que generan algunas aplicaciones, como Excel, pueden contener una marca de orden de bytes (BOM) que entra en conflicto con la codificación esperada. En Timestream, las tareas de carga por lotes de LiveAnalytics que hacen referencia a un archivo CSV con una BOM generan un error cuando se procesan mediante programación. Para evitarlo, puede eliminar la BOM, que es un carácter invisible.

Por ejemplo, puede guardar el archivo desde una aplicación como Notepad++, que le permite especificar una nueva codificación. También puede usar una opción programática que lea la primera línea, elimine el carácter de la línea y escriba el nuevo valor sobre la primera línea del archivo.

Al guardar desde Excel, hay varias opciones de CSV. Guardar con una opción de CSV diferente puede evitar el problema descrito. Pero debería comprobar el resultado, ya que un cambio en la codificación puede afectar a algunos caracteres.

Parámetros de formato CSV

Se usan caracteres de escape cuando se representa un valor que, de otro modo, estaría reservado por los parámetros de formato. Por ejemplo, si el carácter de comilla es una comilla doble, para representarlo en los datos, coloque el carácter de escape antes de la comilla doble.

Para obtener información acerca de cuándo especificarlos al crear una tarea de carga por lotes, consulte Creación de una tarea de carga de lotes.

Parámetro Opciones
Separador de columnas (Coma [«,»] | Barra vertical [«|»] | Punto y coma [«;»] | Tabulador [«/t»] | Espacio en blanco [« »])
Carácter de escape none
Carácter de comilla Consola: (Comilla doble ["] | Comilla simple ['])
Valor nulo Espacio en blanco (« »)
Recorte de espacio en blanco Consola: (No | Sí)