View a markdown version of this page

Amazon EMR 7.6.0 - Notas de la versión de Hive - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon EMR 7.6.0 - Notas de la versión de Hive

Amazon EMR 7.6.0: cambios en la colmena

Tipo Description (Descripción)

Mejoras

Incorporación de la característica de listado rápido de prefijos de S3 para las tablas particionadas de ORC que no sean ACID

Característica

Añada compatibilidad con Magic Committers para las consultas de escritura de Hive en el sistema S3 AFile

Problemas conocidos

  • Para consultas de inserción de sobreescritura de Hive con Amazon S3 Express One Zone como ubicación de salida, establezca la configuración del sitio principal: fs.s3a.directory.operations.purge.uploads a false.

Amazon EMR 7.6.0: nuevas configuraciones

Clasificación Name Predeterminado Description (Descripción)

hive-site

hive.exec.fast.s3.partition.discovery.enabled

true

Determinación del uso de la detección rápida de particiones de S3 para el cálculo de divisiones. Esto habilita la lista basada en prefijos para los formatos de archivo compatibles: ORC. Tenga en cuenta que esta característica utiliza un parámetro de API de S3 que la clase de almacenamiento Express One Zone de S3 no admite. Cuando la utilice, desactive esta característica.

hive-site

hive.exec.fast.s3.partition.discovery.max.thread.threshold

128

El grado máximo de paralelismo para una detección rápida de particiones S3.

hive-site

hive.exec.fast.s3.partition.discovery.parallelism

10

El grado de paralelismo de una sola ejecución de detección rápida de particiones de S3. Esta configuración solo funciona si hive.exec.fast.s3.partition.discovery.enabled se establece en true

hive-site

hive.blobstore.output-committer.magic.track.commits.in.memory.enabled

true

Marque para seleccionar si Magic Committer y Hive deberían rastrear todas las confirmaciones pendientes en la memoria. El confirmador Magic tiene la opción de almacenar los datos de confirmación en la memoria, lo que puede acelerar la TaskCommit operación al realizar menos llamadas a S3. Esta configuración anula la configuración fs.s3a.committer.magic.track.commits.in.memory.enabled de Hadoop

hive-site

hive.blobstore.output-committer.dp.skip.task.staging.dir.creation

true

Marque para seleccionar si Magic Committer debería crear las rutas temporales de dp en la blobstore. Este indicador solo aplica si se rastrean las confirmaciones en la memoria cuando Hive usa Magic Committer a través de hive.blobstore.output-committer.magic.track.commits.in.memory.enabled. De forma predeterminada, se establece en true, pero solo surte efecto si hive.blobstore.output-committer.magic.track.commits.in.memory.enabled está habilitado y guarda las llamadas adicionales a S3 de las rutas de intentos de creación de tareas en blobstore.

hive-site

hive.blobstore.output-committer.magic.disable.fs.cache.for.llap

true

Marque para seleccionar si las cachés del sistema de archivos de blobstore se deben deshabilitar en los flujos de escritura de LLAP cuando se usa Magic Committer. Este indicador aparece cuando LLAP está habilitado y establecido en true de forma predeterminada.