Solución de problemas: problemas con la puerta de enlace de archivo - AWS Storage Gateway

Amazon FSx File Gateway ya no está disponible para nuevos clientes. Los clientes actuales de FSx File Gateway pueden seguir utilizando el servicio con normalidad. Para obtener información sobre funciones similares a las de FSx File Gateway, visite esta entrada de blog.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas: problemas con la puerta de enlace de archivo

Puede configurar su File Gateway para escribir entradas de registro en un grupo de CloudWatch registros de Amazon. Si lo hace, recibirá notificaciones acerca del estado de la puerta de enlace y de los errores que esta detecta. Puede encontrar información sobre estas notificaciones de errores y estado en CloudWatch los registros.

En las siguientes secciones puede encontrar información que le ayudará a comprender la causa de cada notificación de estado y error y cómo solucionar los problemas.

Error: FileMissing

El error FileMissing es similar al error ObjectMissing y los pasos para resolverlo son idénticos. Puede producirse un FileMissing error cuando un escritor que no sea el File Gateway especificado elimina el archivo especificado de Amazon FSx. Cualquier carga posterior a Amazon FSx o cualquier recuperación del objeto FSx por parte de Amazon fallará.

Para resolver un error FileMissing
  1. Guarde la copia más reciente del archivo en el sistema de archivos local del cliente SMB (necesitará una copia del archivo en el paso 3).

  2. Elimine el archivo de la puerta de enlace de archivo utilizando el cliente SMB.

  3. Copia la última versión del archivo que guardaste en el paso 1 en Amazon FSx con tu cliente SMB. Haga esto mediante la puerta de enlace de archivo.

Error: FsxFileSystemAuthenticationFailure

Se puede producir un error FsxFileSystemAuthenticationFailure cuando las credenciales proporcionadas al asociar el sistema de archivos hayan caducado o se hayan revocado sus privilegios.

Para resolver un FsxFileSystemAuthenticationFailure error
  1. Asegúrese de que las credenciales proporcionadas en el momento de adjuntar el sistema de FSx archivos de Amazon siguen siendo válidas.

  2. Asegúrese de que el usuario dispone de todos los permisos necesarios, tal y como se describe en Adjuntar un sistema de archivos de Amazon FSx para Windows File Server.

Error: FsxFileSystemConnectionFailure

Puede aparecer un FsxFileSystemConnectionFailure error cuando no se puede acceder al FSx servidor de Amazon desde la máquina de puerta de enlace.

Para resolver un error FsxFileSystemConnectionFailure
  1. Asegúrese de que todas las reglas de firewall y VPC permitan la conexión entre la máquina de puerta de enlace y el servidor de Amazon FSx .

  2. Asegúrese de que el FSx servidor de Amazon esté funcionando.

Error: FsxFileSystemFull

Puede aparecer un FsxFileSystemFull error si no hay suficiente espacio libre en el disco en el sistema de FSx archivos de Amazon.

Para resolver un FsxFileSystemFull error
  • Aumente el espacio de almacenamiento del sistema de FSx archivos de Amazon.

Error: GatewayClockOutOfSync

Puede producirse un GatewayClockOutOfSync error cuando la puerta de enlace detecte una diferencia de 5 minutos o más entre la hora del sistema local y la hora notificada por los servidores de AWS Storage Gateway. Los problemas de sincronización del reloj pueden afectar negativamente a la conectividad entre la puerta de enlace y AWS. Si el reloj de la puerta de enlace no está sincronizado, pueden producirse errores de E/S en las conexiones NFS y SMB, y los usuarios de SMB podrían experimentar errores de autenticación.

Para resolver un GatewayClockOutOfSync error

Error: InvalidFileState

Se puede detectar un error InvalidFileState cuando un escritor que no sea la puerta de enlace especificada modifica el archivo especificado en el recurso compartido de archivos especificado. Como resultado, el estado del archivo en la puerta de enlace no coincide con su estado en Amazon FSx. Cualquier carga o recuperación posterior del archivo desde Amazon FSx podría fallar.

Para resolver un error InvalidFileState
  1. Guarde la copia más reciente del archivo en el sistema de archivos local del cliente SMB (necesitará una copia del archivo en el paso 4). Si la versión del archivo en Amazon FSx es la más reciente, descarga esa versión. Puedes hacerlo accediendo directamente al FSx recurso compartido de Amazon mediante cualquier cliente SMB.

  2. Elimina el archivo FSx directamente en Amazon.

  3. Elimine el archivo de la puerta de enlace utilizando el cliente SMB.

  4. Con tu cliente SMB, copia la última versión del archivo que guardaste en el paso 1, a través de File Gateway, a Amazon FSx.

Error: ObjectMissing

Puede producirse un ObjectMissing error cuando un escritor que no sea el File Gateway especificado elimina el archivo especificado de Amazon FSx. Cualquier carga posterior a Amazon FSx o cualquier recuperación del objeto FSx por parte de Amazon fallará.

Para resolver un error ObjectMissing
  1. Guarde la copia más reciente del archivo en el sistema de archivos local del cliente SMB (necesitará una copia del archivo en el paso 3).

  2. Elimine el archivo de la puerta de enlace de archivo utilizando el cliente SMB.

  3. Copia la última versión del archivo que guardaste en el paso 1 en Amazon FSx con tu cliente SMB. Haga esto mediante la puerta de enlace de archivo.

Error: DroppedNotifications

Es posible que aparezca un DroppedNotifications error en lugar de otros tipos de entradas de CloudWatch registro esperadas si el espacio de almacenamiento libre en el disco raíz de la puerta de enlace es inferior a 1 GB o si se generan más de 100 notificaciones de estado en un intervalo de 1 minuto. En estas circunstancias, la puerta de enlace deja de generar notificaciones de CloudWatch registro detalladas como medida de precaución.

Para resolver un error DroppedNotifications

  1. Compruebe la métrica Root Disk Usage de la pestaña Supervisión de la puerta de enlace en la consola de Storage Gateway para determinar si el espacio disponible en el disco raíz se está agotando.

  2. Aumente el tamaño del disco de almacenamiento raíz de la puerta de enlace si el espacio disponible es inferior a 1 GB. Consulte la documentación del hipervisor de la máquina virtual para obtener instrucciones.

    Para aumentar el tamaño del disco raíz de EC2 las pasarelas de Amazon, consulte Solicitar modificaciones a sus volúmenes de EBS en la Guía del usuario de Amazon Elastic Compute Cloud.

    nota

    No es posible aumentar el tamaño del disco raíz del dispositivo de hardware de AWS Storage Gateway.

  3. Reinicie la gateway.

Notificación: HardReboot

Puede recibir una notificación HardReboot cuando la MV de la gateway se reinicia de forma inesperada. Este reinicio se puede deber a una pérdida de potencia, un fallo de hardware u otro evento. En el VMware caso de las puertas de enlace, un restablecimiento realizado por vSphere High Availability Application Monitoring puede provocar este evento.

Cuando la puerta de enlace se ejecute en un entorno de este tipo, compruebe la presencia de la HealthCheckFailure notificación y consulte el registro de VMware eventos de la máquina virtual.

Notificación: reinicio

Puede recibir una notificación de reinicio cuando la MV de la gateway se reinicia. Puede reiniciar la VM de una puerta de enlace mediante la consola de gestión de hipervisor de VM o la consola de Storage Gateway. También puede llevar a cabo el reinicio de la gateway mediante el software de la gateway durante el ciclo de mantenimiento de la gateway.

Si la hora del reinicio se encuentra dentro de un periodo de 10 minutos desde la hora de inicio de mantenimiento configurada de la gateway, es probable que este reinicio sea un evento normal y no sea signo de ningún problema. Si el reinicio se produce significativamente fuera del periodo de mantenimiento, compruebe si la gateway se ha reiniciado de forma manual.

Solución de problemas: problemas relacionados con el dominio de Active Directory

FSx File Gateway no genera mensajes de registro específicos para problemas de dominio de Active Directory. Si tiene problemas para unir la puerta de enlace al dominio de Active Directory, haga lo siguiente:

  • Compruebe que la puerta de enlace no esté intentando utilizar un controlador de dominio de solo lectura (RODC) para unirse al dominio.

  • Compruebe que la puerta de enlace está configurada para utilizar los servidores DNS correctos.

    Por ejemplo, si intenta unir una instancia de Amazon EC2 Gateway a un Active Directory AWS administrado, compruebe que la opción de DHCP establecida para su EC2 VPC especifique los servidores DNS de Active Directory AWS administrados.

    Los servidores DNS que se configuran mediante el conjunto de opciones de DHCP de la VPC se proporcionan a todas las EC2 instancias de la VPC. Si quieres especificar un servidor DNS para una puerta de enlace individual, puedes hacerlo mediante la consola local de esa puerta de EC2 enlace.

    Para las puertas de enlace en las instalaciones, especifique un servidor DNS mediante la consola local de la máquina virtual.

  • Compruebe la conectividad de la red de la puerta de enlace ejecutando los siguientes comandos desde el símbolo del sistema de la consola local de la puerta de enlace. Sustituya las variables resaltadas por el nombre de dominio y las direcciones IP reales de la implementación.

    dig -d ExampleDomainName ncport -d ExampleDomainControllerIPAddress -p 445 ncport -d ExampleDomainControllerIPAddress -p 389
  • Compruebe que su cuenta de servicio de Active Directory tenga los permisos necesarios. Para obtener más información, consulte Requisitos de permiso de la cuenta de servicio de Active Directory.

  • Compruebe que la puerta de enlace se une a la unidad organizativa (UO) correcta.

    Al unirse a un dominio, se crea una cuenta de equipo de Active Directory en el contenedor predeterminado del equipo (que no es una unidad organizativa), con el ID de puerta de enlace de la puerta de enlace como nombre de cuenta (por ejemplo, SGW-1234ADE). No es posible personalizar el nombre de esta cuenta.

    Si su entorno de Active Directory tiene una unidad organizativa designada para los nuevos objetos de equipo, debe especificarla al unirse al dominio.

    Si encuentra errores de denegación de acceso al intentar unirse a la UO designada, póngase en contacto con el administrador del dominio de Active Directory. Es posible que el administrador necesite preparar la cuenta de equipo de la puerta de enlace antes de que pueda unirse al dominio. Para obtener más información, consulte ¿Cómo puedo solucionar problemas relacionados con la unión de la puerta de enlace de archivo de Storage Gateway a un dominio para la autenticación de Microsoft Active Directory? .

  • Compruebe que el nombre de host de la puerta de enlace se pueda resolver en el DNS ejecutando el siguiente comando desde el símbolo del sistema de la consola local de la puerta de enlace. Sustituya la variable resaltada por el nombre de host real de la puerta de enlace.

    dig -d ExampleHostName -r A

    Si configuró un nombre de host personalizado para la puerta de enlace, debe agregar manualmente un registro A de DNS que apunte a su dirección IP.

  • Compruebe que la latencia de la red entre la puerta de enlace y el controlador de dominio sea razonablemente baja. El tiempo de espera para la consulta de unión a un dominio puede agotarse si la puerta de enlace no recibe una respuesta del controlador de dominio en 20 segundos.

    Si une la puerta de enlace al dominio mediante el comando JoinDomainCLI, puede agregar el --timeout-in-seconds indicador para aumentar el tiempo de espera hasta un máximo de 3600 segundos.

  • Compruebe que el usuario de Active Directory que está utilizando para unir la puerta de enlace al dominio tenga los privilegios necesarios para hacerlo.

Solución de problemas: uso de métricas CloudWatch

A continuación, encontrará información sobre las acciones para abordar los problemas mediante el uso de CloudWatch las métricas de Amazon con Storage Gateway.

La puerta de enlace reacciona lentamente al examinar directorios

Si File Gateway reacciona con lentitud cuando ejecutas el ls comando o navegas por los directorios, comprueba las IndexEviction CloudWatch métricas IndexFetch y:

  • Si la IndexFetch métrica es superior a 0 cuando ejecuta un ls comando o navega por directorios, su File Gateway se inició sin información sobre el contenido del directorio afectado y tuvo que acceder al servidor de archivos de FSx para Windows. Los esfuerzos posteriores para mostrar el contenido de ese directorio deberían realizarse más rápidamente.

  • Si la métrica de IndexEviction es mayor que 0, significa que la puerta de enlace de archivo ha alcanzado el límite de lo que puede gestionar en la caché en ese momento. En este caso, la puerta de enlace de archivo tiene que liberar espacio de almacenamiento del directorio al que se ha accedido menos recientemente para crear un nuevo directorio. Si esto ocurre con frecuencia y hay un impacto en el rendimiento, póngase en contacto con Soporte.

    Analice Soporte el contenido del sistema de FSx archivos de Amazon relacionado y las recomendaciones para mejorar el rendimiento en función de su caso de uso.

La puerta de enlace no responde

Si la puerta de enlace de archivo no responde, realice las siguientes acciones:

  • Si se ha producido una actualización de software o un reinicio recientemente, compruebe la métrica IOWaitPercent. Esta métrica muestra el porcentaje de tiempo que la CPU está inactiva cuando hay una I/O solicitud de disco pendiente. En algunos casos, puede ser elevado (10 o más) y se puede producir después de que el servidor se haya reiniciado o actualizado. En estos casos, se puede producir un efecto embudo en la puerta de enlace de archivo a causa de un disco raíz lento, ya que reanuda la caché de índice en la RAM. Puede solucionar este problema mediante el uso de un disco físico más rápido para el disco raíz.

  • Si la métrica MemUsedBytes es igual o prácticamente igual que la métrica MemTotalBytes, la puerta de enlace de archivo se está ejecutando fuera de la RAM disponible. Asegúrese de que la puerta de enlace de archivo tenga el menos la RAM mínima requerida. Si ya la tiene, considere añadir más RAM a la puerta de enlace de archivo en función de la carga de trabajo y el caso de uso.

    Si el recurso compartido de archivos es SMB, el problema también podría deberse al número de clientes SMB conectados a dicho recurso. Para ver el número de clientes que están conectados en cualquier momento, compruebe la métrica SMBV(1/2/3)Sessions. Si hay muchos clientes conectados, es posible que necesite añadir más RAM a la puerta de enlace de archivo.

No ves los archivos en tu sistema de FSx archivos de Amazon

Si observas que los archivos de la pasarela no se reflejan en el sistema de FSx archivos de Amazon, comprueba la FilesFailingUpload métrica. Si la métrica indica que algunos archivos no se cargan correctamente, compruebe las notificaciones de estado. Cuando los archivos no se pueden cargar, la puerta de enlace genera una notificación de salud con más detalles sobre el problema.

No ves instantáneas antiguas en tu sistema de FSx archivos de Amazon

Algunas operaciones con archivos en la puerta de enlace de FSx archivos, como cambiar el nombre de las carpetas de nivel superior o los cambios de permisos, pueden provocar varias operaciones con archivos y provocar una gran I/O carga en el sistema de archivos del servidor FSx de archivos de Windows. Si el sistema de archivos no tiene suficientes recursos de rendimiento para su carga de trabajo, es posible que elimine las instantáneas, ya que da prioridad a la disponibilidad para la retención continua de instantáneas por I/O encima de la histórica.

En la FSx consola de Amazon, consulta la página Supervisión y rendimiento para ver si tu sistema de archivos está insuficientemente aprovisionado. Si es así, puede cambiar a un almacenamiento en SSD, aumentar la capacidad de rendimiento o aumentar las IOPS en SSD para gestionar su carga de trabajo.

Tu puerta de enlace tarda en transferir datos a Amazon FSx

Si su puerta de enlace de archivos tarda en transferir datos a Amazon FSx for Windows File Server, haga lo siguiente:

  • Si la CachePercentDirty métrica es 80 o superior, su File Gateway escribe los datos en el disco más rápido de lo que puede cargar los datos en Amazon FSx para Windows File Server. Considere la posibilidad de aumentar el ancho de banda para la carga desde su puerta de enlace de archivos, añadir uno o más discos de caché, ralentizar las escrituras del cliente o aumentar la capacidad de rendimiento del servidor de archivos Amazon FSx for Windows asociado.

  • Si la métrica CachePercentDirty es baja, compruebe la métrica IoWaitPercent. Si IoWaitPercent es mayor que 10, es posible que se produzca un efecto embudo en la puerta de enlace de archivo por la velocidad del disco en caché local. Recomendamos utilizar discos de disco de estado sólido (SSD) locales para la memoria caché, preferiblemente NVM Express ()NVMe. Si dichos discos no están disponibles, intente utilizar varios discos en caché desde discos físicos independientes para mejorar el rendimiento.

El trabajo de copia de seguridad de la puerta de enlace falla o se producen errores al escribir en la puerta de enlace

Si el trabajo de copia de seguridad de la puerta de enlace de archivo falla o se producen errores al escribir en la puerta de enlace de archivo, realice las siguientes acciones:

  • Si la métrica CachePercentDirty es del 90 por ciento o superior, la puerta de enlace de archivo no puede aceptar nuevas escrituras en el disco porque no hay suficiente espacio disponible en el disco de caché. Para ver la rapidez con la que File Gateway se carga en para Windows File Server, consulte la CloudBytesUploaded métrica. Compare esa métrica con la métrica WriteBytes, que muestra a qué velocidad escribe archivos el cliente en la puerta de enlace de archivo. Si el cliente SMB escribe en su puerta de enlace de archivos más rápido de lo que puede cargar en para Windows File Server, añada más discos de caché para cubrir como mínimo el tamaño del trabajo de copia de seguridad. También puede aumentar el ancho de banda de carga.

  • Si una copia de un archivo grande como un trabajo de copia de seguridad falla, pero la métrica CachePercentDirty es inferior al 80 por ciento, es posible que la puerta de enlace de archivo esté alcanzando el tiempo de espera de la sesión del lado del cliente. En el caso de SMB, puede aumentar este tiempo de espera mediante el comando. PowerShell Set-SmbClientConfiguration -SessionTimeout 300 Al ejecutar este comando, el tiempo de espera se establece en 300 segundos.