Uso de la carga por lotes con la consola - Amazon Timestream

Para obtener capacidades similares a las de Amazon Timestream para LiveAnalytics, considere Amazon Timestream para InfluxDB. Ofrece una ingesta de datos simplificada y tiempos de respuesta a las consultas en milisegundos de un solo dígito para realizar análisis en tiempo real. Obtenga más información aquí.

Uso de la carga por lotes con la consola

Los siguientes son los pasos para usar la carga por lotes con la Consola de administración de AWS. Puede descargar un archivo CSV de muestra en CSV de muestra.

Acceso a la carga por lotes

Siga estos pasos para acceder a la carga por lotes mediante la Consola de administración de AWS.

  1. Abra la consola Amazon Timestream.

  2. En el panel de navegación, elija Herramientas de administración y, a continuación, elija Tareas de carga por lotes.

  3. Desde aquí, puede ver la lista de tareas de carga por lotes y profundizar en una tarea determinada para obtener más detalles. También puede crear y reanudar tareas.

Creación de una tarea de carga de lotes

Para crear un rol de tarea de carga por lotes mediante la Consola de administración de AWS, siga estos pasos.

  1. Abra la consola Amazon Timestream.

  2. En el panel de navegación, elija Herramientas de administración y, a continuación, elija Tareas de carga por lotes.

  3. Seleccione Crear tarea de carga por lotes.

  4. En Destino de importación, elija lo siguiente.

    Si es necesario, puede añadir una tabla desde este panel con el botón Crear tabla nueva.

  5. Desde Ubicación del origen de datos de S3 en Origen de datos, seleccione el bucket de S3 donde se almacenan los datos de origen. Use el botón Examinar S3 para ver los recursos de S3 a los que tiene acceso la cuenta activa de AWS o introduzca la URL de la ubicación de S3. El origen de datos debe encontrarse en la misma región.

  6. En Configuración de formato de archivo (sección ampliable), puede usar la configuración predeterminada para analizar los datos de entrada. También puede elegir la Configuración avanzada. Desde allí, puede elegir Parámetros del formato CSV y seleccionar los parámetros para analizar los datos de entrada. Para obtener más información sobre estos parámetros, consulte Parámetros de formato CSV.

  7. En Configurar mapeo de modelo de datos, configure el modelo de datos. Para obtener orientación adicional sobre el modelo de datos, consulte Mapeos de modelos de datos para carga por lotes

    • En Mapeo de modelo de datos, elija Entrada de configuración de mapeo y elija una de las siguientes opciones.

      • Creador visual: para mapear datos de forma visual, elija TargetMultiMeasureName o MeasureNameColumn. A continuación, desde Creador visual, mapee las columnas.

        El creador visual detecta y carga automáticamente los encabezados de las columnas de origen desde el archivo de origen de datos cuando se selecciona un único archivo CSV como origen de datos. Elija el atributo y el tipo de datos para crear el mapeo.

        Para obtener información sobre cómo usar el creador visual, consulte Uso del creador visual.

      • Editor JSON: un editor JSON de formato libre para configurar su modelo de datos. Elija esta opción si está familiarizado con Timestream para LiveAnalytics y desea crear mapeos avanzados de modelos de datos.

      • Archivo JSON de S3: seleccione un archivo de modelo JSON que haya almacenado en S3. Elija esta opción si ya ha configurado un modelo de datos y desea reusarlo para cargas de lotes adicionales.

  8. Desde Ubicación de registros de errores en S3 en Informe de registro de errores, seleccione la ubicación de S3 que se usará para informar de los errores. Para obtener información acerca de cómo usar esta acción, consulte Uso de informes de errores de carga por lotes.

  9. En Tipo de clave de cifrado, seleccione una de las opciones siguientes:

    • Clave administrada por Amazon S3 (SSE-S3): una clave de cifrado que Amazon S3 crea, administra y usa por usted.

    • AWS KMS key (SSE-KMS): clave de cifrado protegida por AWS Key Management Service (AWS KMS).

  10. Elija Siguiente.

  11. En la página Revisar y crear página, revise y edite la configuración y en caso de ser necesario.

    nota

    No puede cambiar la configuración de las tareas de carga por lotes una vez que se haya creado la tarea. Los tiempos de finalización de las tareas variarán en función de la cantidad de datos que se importen.

  12. Seleccione Crear tarea de carga por lotes.

Reanudación de una tarea de carga por lotes

Cuando selecciona una tarea de carga por lotes con el estado «Progreso detenido» y que aún se puede reanudar, se le solicitará que reanude la tarea. También hay un banner con el botón Reanudar tarea cuando vea los detalles de esas tareas. Las tareas que se pueden reanudar tienen una fecha de caducidad. Una vez caducada esa fecha, las tareas no se pueden reanudar.

Uso del creador visual

Puede usar el creador visual para mapear las columnas de datos de origen de uno o más archivos CSV almacenados en un bucket de S3, a las columnas de destino de una tabla de Timestream para LiveAnalytics.

nota

Su función necesitará el permiso SelectObjectContent para el archivo. Sin esto, tendrá que añadir y eliminar columnas manualmente.

Modo de carga automática de columnas de origen

Timestream para LiveAnalytics puede escanear automáticamente el archivo CSV de origen en busca de nombres de columnas si solo se especifica un bucket. Cuando no haya mapeos existentes, puede elegir Importar columnas de origen.

  1. Con la opción Creador visual seleccionada en los Ajustes de entrada de la configuración de mapeo, defina la entrada de hora de la marca de tiempo. Milliseconds es la configuración predeterminada.

  2. Haga clic en el botón Cargar columnas de origen para importar los encabezados de columna que se encuentran en el archivo de datos de origen. La tabla se rellenará con los nombres de los encabezados de las columnas de origen del archivo de origen de datos.

  3. Elija el Nombre de la columna de la tabla de destino, el Tipo de atributo de Timestream y el Tipo de datos para cada columna de origen.

    Para obtener más información sobre estas columnas y sus posibles valores, consulte Asignación de campos.

  4. Use la característica de arrastrar para rellenar para establecer el valor de varias columnas a la vez.

Agregue columnas de origen manualmente

Si usa un bucket o un prefijo CSV y no un solo CSV, puede añadir y eliminar mapeos de columnas desde el creador visual con los botones Añadir mapeo de columnas y Eliminar mapeo de columnas. También hay un botón para restablecer los mapeos.

Asignación de campos

  • Nombre de la columna de origen: el nombre de una columna del archivo de origen que representa una medida que se va a importar. Timestream para LiveAnalytics puede rellenar este valor automáticamente cuando se usa Importar columnas de origen.

  • Nombre de la columna de la tabla de destino: entrada opcional que indica el nombre de la columna de la medida en la tabla de destino.

  • Tipo de atributo de Timestream: el tipo de atributo de los datos de la columna de origen especificada, por ejemplo, DIMENSION.

    • TIMESTAMP: especifica cuándo se recopiló una medida.

    • MULTI: se representan varias medidas.

    • DIMENSION: metadatos de serie temporal.

    • MEASURE_NAME: para los registros de medida única, este es el nombre de la medida.

  • Tipo de datos: el tipo de columna de Timestream, por ejemplo, BOOLEAN.

    • BIGINT: entero de 64 bits.

    • BOOLEAN: los dos valores de verdad de la lógica: verdadero y falso.

    • DOUBLE: número de precisión variable de 64 bits.

    • TIMESTAMP: instancia temporal que usa el tiempo de precisión de nanosegundos en UTC y registra el tiempo transcurrido desde la época de Unix.