Prácticas recomendadas de carga por lotes - Amazon Timestream

Para obtener capacidades similares a las de Amazon Timestream, considere Amazon Timestream LiveAnalytics para InfluxDB. Ofrece una ingesta de datos simplificada y tiempos de respuesta a las consultas en milisegundos de un solo dígito para realizar análisis en tiempo real. Obtenga más información aquí.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Prácticas recomendadas de carga por lotes

La carga por lotes funciona mejor (alto rendimiento) cuando se cumplen las siguientes condiciones y recomendaciones:

  1. Los archivos CSV que se envían para su ingesta son pequeños, específicamente con un tamaño de archivo de 100 MB a 1 GB, para mejorar el paralelismo y la velocidad de ingesta.

  2. Evite introducir datos simultáneamente en la misma tabla (por ejemplo, mediante la operación de la WriteRecords API o una consulta programada) cuando la carga del lote esté en curso. Esto podría provocar limitaciones y la tarea de carga por lotes fallaría.

  3. No añada, modifique ni elimine archivos del bucket de S3 que se usa en la carga por lotes mientras esta tarea esté en ejecución.

  4. No elimine ni revoque los permisos de las tablas o el origen, ni denuncie los buckets de S3 que tengan tareas de carga por lotes programadas o en curso.

  5. Cuando ingiera datos con un conjunto de valores de dimensión de alta cardinalidad, siga las instrucciones que se indican en. Recomendaciones para la partición de registros de múltiples medidas

  6. Asegúrese de comprobar la exactitud de los datos mediante el envío de un archivo pequeño. Se le cobrará por cualquier dato que se envíe a la carga del lote, independientemente de si es correcto o no. Para obtener más información sobre los precios, consulte Precios de Amazon Timestream.

  7. No reanude una tarea de carga por lotes a menos que las ActiveMagneticStorePartitions sean inferiores a 250. Es posible que el trabajo se limite y falle. El envío de varios trabajos al mismo tiempo para la misma base de datos debería reducir el número.

A continuación, se indican las prácticas recomendadas para la consola:

  1. Use el generador solo para lograr un modelado de datos más simple que use solo un nombre de medida para los registros de medidas múltiples.

  2. Para un modelado de datos más complejo, use JSON. Por ejemplo, use JSON cuando use varios nombres de medidas al emplear registros de medidas múltiples.

Para obtener información adicional sobre las prácticas LiveAnalytics recomendadas, consulte. Prácticas recomendadas