Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Habilite la deduplicación de datos en Amazon FSx
Descripción general de
La deduplicación de datos es una característica que le permite almacenar sus datos de manera más eficiente y con menos requisitos de capacidad. Implica buscar y eliminar la duplicación en los datos sin comprometer su fidelidad ni integridad. La deduplicación de datos utiliza la fragmentación y la compresión de archivos secundarios de tamaño variable, lo que ofrece ratios de optimización de 2:1 para servidores de archivos generales y de hasta 20:1 para datos de virtualización. La deduplicación de datos es mucho más eficaz que la compresión NTFS. La arquitectura de deduplicación incorpora resiliencia ante errores de hardware, pues cada dato y metadato se somete a una validación completa mediante sumas de verificación. Esta validación incluye comprobar la redundancia de los metadatos y de los fragmentos de datos a los que se accede con mayor frecuencia.
FSx para Windows File Server es totalmente compatible con la deduplicación de datos. Su uso puede suponer un ahorro medio del 50 % al 60 % en el caso de los recursos compartidos de archivos de uso general. En los recursos compartidos, los ahorros oscilan entre el 30 % y el 50 % en los documentos de usuario y entre el 70 % y el 80 % en los conjuntos de datos de desarrollo de software. Es importante comprender que el ahorro de almacenamiento que puede lograr con la deduplicación de datos depende de la naturaleza del conjunto de datos, incluida la cantidad de duplicados que existan entre los archivos. La deduplicación no es una buena opción si los datos almacenados son de naturaleza dinámica.
Impacto del costo
Para hacer frente al crecimiento del almacenamiento de datos en la empresa, los administradores unifican los servidores y hacen que el escalado de la capacidad y la optimización de los datos sean objetivos clave. La configuración predeterminada de la deduplicación de datos puede suponer un ahorro inmediato. Los administradores también pueden refinar la configuración para obtener beneficios adicionales. Por ejemplo, puede configurar la deduplicación para que se ejecute solo en determinados tipos de archivos o puede crear un cronograma de trabajo personalizado.
En términos generales, la deduplicación tiene tres tipos de tareas: optimización, recopilación de elementos no utilizados y limpieza. Tenga en cuenta que no se liberará espacio hasta que ponga en marcha un recopilación de elementos no utilizados después de la optimización. Puede programar el trabajo o ponerlo en marcha manualmente. Todos los ajustes disponibles al programar un trabajo de deduplicación de datos también están disponibles al iniciar un trabajo manualmente (excepto en el caso de los trabajos específicos de la programación).
A pesar de que la deduplicación solo supone un 25 por ciento de ahorro efectivo, Windows File Server supone un importante ahorro FSx de costes. Estos ahorros previstos se basan en una estimación
Recomendaciones de optimización de costos
La deduplicación activada FSx para los sistemas de archivos del servidor de archivos de Windows no está habilitada de forma predeterminada. Para habilitar la deduplicación mediante la administración remota activada PowerShell, debe ejecutar el Enable-FSxDedup comando y, a continuación, usarlo para establecer la configuración. Set-FSxDedupConfiguration Para obtener más información, consulte Administrar sistemas de archivos en la documentación del servidor FSx de archivos de Windows.
Para activar la deduplicación, use el comando siguiente:
PS C:\Users\Admin> Invoke-Command -ComputerNameamznfsxzzzzzzzz.corp.example.com-ConfigurationName FSxRemoteAdmin -ScriptBlock {Enable-FsxDedup }
Para comprobar la configuración de la deduplicación, use el comando siguiente:
Invoke-Command -ComputerNameamznfsxzzzzzzzz.corp.example.com-ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Tues,Wed,Sat -Start 09:00 -DurationHours 7 }
Al ejecutar el PowerShell Measure-DedupFileMetadata cmdlet, puede determinar cuánto espacio potencial de disco se puede recuperar en un volumen si elimina un grupo de carpetas, una sola carpeta o un solo archivo y, a continuación, ejecuta un trabajo de recolección de elementos no utilizados. En concreto, el valor DedupDistinctSize indica cuánto espacio se recupera si se eliminan esos archivos. Los archivos suelen tener fragmentos que se comparten en otras carpetas, por lo que el motor de deduplicación calcula qué fragmentos son únicos y se eliminarían tras un trabajo de recopilación de elementos no utilizados.
Las programaciones predeterminadas de los trabajos de deduplicación de datos están diseñadas para funcionar bien con las cargas de trabajo recomendadas y ser lo menos intrusivas posible (esto no incluye el trabajo de optimización de prioridades que se activa para el tipo de uso de copia de seguridad). Si las cargas de trabajo requieren recursos de gran tamaño, le recomendamos programar los trabajos para que se pongan en marcha únicamente durante las horas de inactividad o para reducir o aumentar la cantidad de recursos del sistema que puede consumir un trabajo de deduplicación de datos.
De forma predeterminada, la deduplicación de datos utiliza el 25 % de la memoria disponible. Sin embargo, esto se puede aumentar con -memory switch. En el caso de los trabajos de optimización, le recomendamos que establezca un rango entre 15 y 50. En el caso de los trabajos programados, puede utilizar un mayor consumo de memoria. Por ejemplo, con los trabajos de recopilación de elementos no utilizados y limpieza (que normalmente se programan para que se pongan en marcha fuera del horario laboral), puede establecer un consumo de memoria más alto (por ejemplo, 50).
Para obtener información adicional sobre la configuración de deduplicación de datos, consulte Reducir los costos de almacenamiento mediante la deduplicación de datos en la documentación del servidor de archivos FSx de Windows.
Recursos adicionales
-
Understanding Data Deduplication
(documentación de Microsoft) -
Reducir los costos de almacenamiento mediante la deduplicación de datos (FSx para ver la documentación del servidor de archivos de Windows)