Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Seguimiento de objetos de EMRFS mediante la vista consistente de Amazon S3
EMRFS crea una vista consistente de los objetos en Amazon S3 agregando información sobre estos objetos a los metadatos de EMRFS. EMRFS añade estas listas a sus metadatos cuando:
-
Un objeto escrito por EMRFS durante el transcurso de un trabajo de Amazon EMR.
-
Un objeto se sincroniza con o se importa a los metadatos de EMRFS utilizando la CLI de EMRFS.
Los objetos leídos por EMRFS no se añaden automáticamente a los metadatos. Cuando EMRFS elimina un objeto, su entrada permanece en los metadatos con el estado eliminado hasta que dicha entrada se purga utilizando la CLI de EMRFS. Para obtener más información sobre la CLI, consulte La Referencia de los comandos de la CLI de EMRFS. Para obtener más información sobre la eliminación de listados en los metadatos de EMRFS, consulte Metadatos de la vista consistente de EMRFS.
Por cada operación de Amazon S3, EMRFS comprueba los metadatos para obtener información sobre el conjunto de objetos en la vista consistente. Si EMRFS detecta que Amazon S3 es inconsistente durante una de estas operaciones, vuelve a intentar la operación, de acuerdo con los parámetros definidos en las propiedades de configuración de emrfs-site
. Cuando EMRFS agota los reintentos, genera una excepción ConsistencyException
o registra la excepción y continúa el flujo de trabajo. Para obtener más información acerca de la lógica de reintentos, consulte Lógica de reintentos. Puede encontrar ConsistencyExceptions
en sus registros, por ejemplo:
-
listStatus: ningún objeto de Amazon S3 para elemento de metadatos
/S3_bucket/dir/object
-
getFileStatus: La clave
dir/file
está presente en los metadatos, pero no en Amazon S3
Si elimina un objeto directamente desde Amazon S3 y se está realizando su seguimiento en la vista consistente de EMRFS, EMRFS trata dicho objeto como inconsistente, ya que sigue apareciendo en los metadatos como presente en Amazon S3. Si los metadatos dejan de estar sincronizados con los objetos cuyo seguimiento realiza EMRFS en Amazon S3, puede utilizar el subcomando sync de la CLI de EMRFS para restablecer el estado de los metadatos de Amazon S3. Para descubrir discrepancias entre los metadatos y Amazon S3, utilice el comando diff. Por último, EMRFS solo tiene una vista consistente de los objetos a los que se hace referencia en los metadatos; puede haber otros objetos en la misma ruta de Amazon S3 de los que no se está realizando seguimiento. Cuando EMRFS muestra un listado de los objetos de una ruta de Amazon S3, devuelve el superconjunto de los objetos a los que se hace seguimiento en los metadatos y de los que están en esa ruta de Amazon S3.