Prácticas recomendadas para File Gateway - AWS Storage Gateway

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Prácticas recomendadas para File Gateway

En esta sección se incluyen los siguientes temas, que proporcionan información sobre las prácticas recomendadas para trabajar con puertas de enlace, recursos compartidos de archivos, depósitos y datos. Le recomendamos que se familiarice con la información que se describe en esta sección e intente seguir estas directrices para evitar problemas con AWS Storage Gateway. Para obtener orientación adicional sobre diagnóstico y solución de problemas comunes que pueden surgir con la implementación, consulte Solución de problemas con la implementación de Storage Gateway.

Prácticas recomendadas: recuperación de los datos

Aunque es infrecuente, es posible que su gateway se enfrente a un error irrecuperable. Este error puede producir en la máquina virtual (VM), en la propia gateway, en el almacenamiento local o en otro lugar. Si se produce un error, le recomendamos que siga las instrucciones de la sección adecuada, a continuación, para recuperar los datos.

importante

Storage Gateway no admite la recuperación de una máquina virtual de puerta de enlace a partir de una instantánea creada por el hipervisor o desde la EC2 Amazon Machine Image (AMI) de Amazon. Si la MV de la gateway no funciona correctamente, active una nueva gateway y recupere los datos para esa gateway utilizando las instrucciones siguientes.

Recuperación de un cierre inesperado de una máquina virtual

Si la MV se cierra de forma inesperada, por ejemplo, durante un corte de suministro eléctrico, el acceso a la gateway dejará de ser posible. Cuando se restablezca el suministro eléctrico y la conectividad de red, volverá a ser posible el acceso a la gateway y empezará a funcionar normalmente. A continuación se muestran algunas de las acciones que puede llevar a cabo en ese momento para facilitar la recuperación de los datos:

  • Si una interrupción del suministro eléctrico provoca problemas de conectividad de red, puede solucionar el problema. Para obtener más información sobre cómo probar la conectividad de red, consulte Probar la conexión de red de la puerta de enlace.

Recuperación de los datos a partir de un disco de la caché que no funciona correctamente

Si el disco de la caché encuentra un error, le recomendamos que haga lo siguiente para recuperar los datos en función de la situación:

  • Si el error se produjo porque se retiró del host un disco de la caché, cierre la puerta de enlace, vuelva a agregar el disco y reinicie la puerta de enlace.

Recuperación de los datos de un centro de datos inaccesible

Si su puerta de enlace o centro de datos se vuelve inaccesible por algún motivo, puede recuperar los datos en otra puerta de enlace de un centro de datos diferente o recuperarlos en una puerta de enlace alojada en una EC2 instancia de Amazon. Si no tienes acceso a otro centro de datos, te recomendamos crear la puerta de enlace en una EC2 instancia de Amazon. Los pasos que siga dependerán del tipo de gateway cuyos datos intenta recuperar.

Para recuperar datos de una pasarela de archivos situada en un centro de datos inaccesible

En el caso de File Gateway, debe asignar un nuevo de archivos al bucket de Amazon S3 FSx que contiene los datos que desea recuperar.

  1. Cree y active un nuevo File Gateway en un EC2 host de Amazon. Para obtener más información, consulte Implemente un EC2 host de Amazon predeterminado para S3 File Gateway.

  2. Cree un nuevo en la EC2 pasarela que creó. Para obtener más información, consulte Crear un recurso compartido de archivos .

  3. Monte el compartidos en su cliente y asígnelo al bucket S3 FSx que contiene los datos que desea recuperar. Para obtener más información, consulte Montar y usar el recurso compartido de archivos .

Mejores prácticas: gestionar las cargas de varias partes

Al transferir archivos de gran tamaño, S3 File Gateway utiliza la función de carga multiparte de Amazon S3 para dividir los archivos en partes más pequeñas y transferirlos en paralelo para mejorar la eficiencia. Para obtener más información sobre la carga multiparte, consulte Carga y copia de objetos mediante la carga multiparte en la Guía del usuario de Amazon Simple Storage Service.

Si una carga de varias partes no se completa correctamente por algún motivo, la pasarela normalmente detiene la transferencia, elimina cualquier parte del archivo transferida parcialmente de Amazon S3 e intenta realizar la transferencia de nuevo. En raras ocasiones, como cuando un fallo de hardware o red impide que la puerta de enlace se limpie tras una carga multiparte fallida, es posible que partes del archivo parcialmente transferido permanezcan en Amazon S3, donde pueden incurrir en gastos de almacenamiento.

Como práctica recomendada para minimizar los costes de almacenamiento en Amazon S3 derivados de cargas incompletas de varias partes, recomendamos configurar una regla del ciclo de vida de los buckets de Amazon S3 que utilice la acción de la AbortIncompleteMultipartUpload API para detener automáticamente las transferencias fallidas y eliminar las partes de archivos asociadas después de un número de días designado. Para obtener instrucciones, consulte Configurar una configuración del ciclo de vida de un bucket para eliminar las cargas multiparte incompletas en la Guía del usuario de Amazon Simple Storage Service.

Prácticas recomendadas: descomprima los archivos comprimidos localmente antes de copiarlos en una puerta de enlace

Si intenta descomprimir un archivo comprimido que contiene miles de archivos mientras está almacenado en la puerta de enlace, es posible que se produzcan retrasos importantes relacionados con el rendimiento. El proceso de descomprimir un archivo que contiene una gran cantidad de archivos en cualquier tipo de recurso compartido de archivos de red implica por sí mismo un alto volumen de input/output operaciones, la manipulación de la caché de metadatos, la sobrecarga de la red y la latencia. Además, Storage Gateway no puede determinar cuándo se ha terminado de descomprimir cada archivo del archivo y puede empezar a cargar los archivos antes de que finalice el proceso, lo que afecta aún más al rendimiento. Estos problemas se agravan cuando los archivos del archivo son numerosos, pero de tamaño pequeño.

Como práctica recomendada, se recomienda transferir primero los archivos comprimidos desde la puerta de enlace a la máquina local, antes de descomprimirlos. Luego, si es necesario, puedes usar una herramienta como robocopy o rsync para volver a transferir los archivos descomprimidos a la puerta de enlace.

Conserve los atributos del archivo al copiar datos de Windows Server

Es posible copiar archivos a su puerta de enlace de archivos mediante el copy comando básico de Microsoft Windows, pero este comando copia solo los datos del archivo de forma predeterminada, omitiendo ciertos atributos del archivo, como los descriptores de seguridad. Si los archivos se copian en la puerta de enlace sin las restricciones de seguridad correspondientes ni la información de la lista de control de acceso discrecional (DACL), es posible que usuarios no autorizados puedan acceder a ellos.

Como práctica recomendada para conservar todos los atributos de los archivos y la información de seguridad al copiar archivos a la puerta de enlace de Microsoft Windows Server, se recomienda utilizar los xcopy comandos robocopy o, con los /o indicadores /copy:DS o, respectivamente. Para obtener más información, consulte robocopy y xcopy en la documentación de referencia de comandos de Microsoft Windows Server.

Prácticas recomendadas: dimensionar correctamente los discos de caché

Para obtener el mejor rendimiento, el tamaño total de la memoria caché del disco debe ser lo suficientemente grande como para cubrir el tamaño del conjunto de trabajo activo. En el caso de read/write cargas de trabajo mixtas y con un uso intensivo de lecturas, esto garantiza que se pueda conseguir un alto porcentaje de aciertos de caché en las lecturas, lo cual es deseable. Puede monitorizarlo mediante la CacheHitPercent métrica de su S3 File Gateway.

En el caso de cargas de trabajo de escritura intensiva (por ejemplo, para copias de seguridad y archivado), S3 File Gateway almacena en búfer las escrituras entrantes en la memoria caché del disco antes de copiar estos datos de forma asíncrona a Amazon S3. Debe asegurarse de tener suficiente capacidad de caché para almacenar en búfer los datos escritos. La CachePercentDirty métrica proporciona una indicación del porcentaje de la memoria caché del disco que aún no se ha conservado. AWS

Se recomiendan valores bajos CachePercentDirty de. Los valores que se acercan constantemente al 100% indican que S3 File Gateway no puede mantener el ritmo del tráfico de escritura entrante. Puede evitarlo aumentando la capacidad de caché en disco aprovisionada o aumentando el ancho de banda de red dedicado disponible desde S3 File Gateway a Amazon S3, o ambas opciones.

Para obtener más información sobre el tamaño del disco caché, consulte las prácticas recomendadas de tamaño de caché de Amazon S3 File Gateway en el canal oficial de Amazon Web Services YouTube .

Trabajar con varios recursos compartidos de archivos y buckets de Amazon S3

Al configurar un único bucket de Amazon S3 para permitir que varias puertas de enlace o recursos compartidos de archivos escriban en él, los resultados pueden ser impredecibles. Puede configurar sus buckets de dos maneras para evitar resultados impredecibles. Elija el método de configuración que mejor se adapte a su caso de uso entre las siguientes opciones:

  • Configure los depósitos de S3 para que solo un recurso compartido de archivos pueda escribir en cada depósito. Usa un recurso compartido de archivos diferente para escribir en cada depósito.

    Para ello, cree una política de bucket de S3 que deniegue todas las funciones excepto la que se utiliza para un recurso compartido de archivos específico para colocar o eliminar objetos en el bucket. Adjunta una política similar a cada depósito, especificando un recurso compartido de archivos diferente para escribir en cada depósito.

    El siguiente ejemplo de política deniega los permisos de escritura en el bucket de S3 a todos los roles, excepto al rol que creó el bucket. Las acciones s3:DeleteObject y s3:PutObject se deniegan a todos los roles excepto a "TestUser". La política es aplicable a todos los objetos del bucket "arn:aws:s3:::amzn-s3-demo-bucket/*".

    JSON
    { "Version":"2012-10-17", "Statement":[ { "Sid":"DenyMultiWrite", "Effect":"Deny", "Principal":"*", "Action":[ "s3:DeleteObject", "s3:PutObject" ], "Resource":"arn:aws:s3:::amzn-s3-demo-bucket/*", "Condition":{ "StringNotLike":{ "aws:userid":"TestUser:*" } } } ] }
  • Si desea que varios recursos compartidos de archivos escriban en el mismo bucket de Amazon S3, debe evitar que los recursos compartidos intenten escribir en los mismos objetos simultáneamente.

    Para ello, configure un prefijo de objeto único e independiente para cada recurso compartido de archivos. Esto significa que cada recurso compartido de archivos solo escribe en los objetos con el prefijo correspondiente y no escribe en los objetos que están asociados a los demás recursos compartidos de archivos de la implementación. El prefijo del objeto se configura en el campo del nombre del prefijo de S3 al crear un nuevo recurso compartido de archivos.

Limpie los recursos innecesarios

Como práctica recomendada, recomendamos limpiar los recursos de Storage Gateway para evitar cargos inesperados o innecesarios. Por ejemplo, si creó una puerta de enlace como ejercicio de demostración o prueba, considere eliminarla y su dispositivo virtual de la implementación. Utilice el siguiente procedimiento para limpiar los recursos.

Para eliminar los recursos innecesarios
  1. Si ya no piensa seguir utilizando una puerta de enlace, elimínela. Para obtener más información, consulte Eliminación de la puerta de enlace y eliminación de los recursos asociados.

  2. Elimine la máquina virtual de Storage Gateway desde el host en las instalaciones. Si has creado tu gateway en una EC2 instancia de Amazon, finaliza la instancia.