Recopilación de requisitos para la migración - AWS DataSync

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Recopilación de requisitos para la migración

El primer paso en una migración de datos a gran escala requiere recopilar una variedad de información en la organización.

Esta información ayuda a crear un proceso de migración, que en el caso de migraciones a gran escala puede incluir múltiples transferencias y procedimientos de transición (realizados en oleadas) desde el origen hasta el almacenamiento de destino.

Comprender por qué se desea migrar

Antes de comenzar la migración hacia AWS, es necesario comprender con claridad por qué se migran los datos. Esto ayuda a abordar desafíos comunes de la migración, como cumplir plazos, administrar recursos y coordinar equipos.

Si se necesita ayuda para determinar las motivaciones de la migración, responda a las siguientes preguntas:

  • ¿Se busca liberar espacio de almacenamiento en las instalaciones?

  • ¿Se deben cumplir plazos de contratos de soporte de hardware?

  • ¿Se trata de una salida de un centro de datos?

  • ¿Cuál es el cronograma de la migración?

  • ¿Se transfieren datos desde otro almacenamiento en la nube?

  • ¿Se migran conjuntos de datos parciales o completos?

  • ¿La migración tiene fines de archivado?

  • ¿Las aplicaciones o los usuarios requieren acceso regular a estos datos?

Análisis de la logística

Aborde algunos aspectos logísticos básicos relacionados con el entorno de almacenamiento, la migración y la organización.

  1. Obtenga una comprensión básica de la infraestructura de almacenamiento de datos actual.

  2. Verifique si se necesita un agente de DataSync. Por ejemplo, se requiere un agente si la transferencia se realiza desde almacenamiento en las instalaciones.

  3. Si se necesita un agente, asegúrese de comprender los requisitos del agente:

    • Un agente se puede ejecutar como una máquina virtual (VM) en VMware ESXi, una máquina virtual basada en el kernel (KVM) de Linux o hipervisores de Microsoft Hyper-V. También puede implementar un agente como una instancia de Amazon EC2 dentro de AWS.

    • Las migraciones a gran escala suelen requerir un uso intensivo de memoria. Asegúrese de que el agente disponga de suficiente memoria RAM.

  4. Identifique a las partes interesadas clave de los equipos de dirección, redes, almacenamiento y TI que deben participar en la migración. Esto puede incluir:

    • Designe un líder de subproceso único dedicado al proyecto y a sus resultados.

    • Determine quién es responsable de la titularidad y la clasificación de los datos que se migran.

    • Identifique quién administra el origen y quién administrará finalmente el servicio de almacenamiento de AWS al que se migra.

    • Determine quién creará y administrará cualquier otro proceso relacionado con los datos una vez que estos se encuentren en AWS.

  5. Establezca canales de comunicación entre departamentos.

  6. Cree un plan de reversión para contingencias.

  7. Documente el proceso completo de migración, incluidas las oleadas, la validación y los procedimientos de transición. Use este recurso como manual de procedimientos para toda la migración. Actualizará este proceso a medida que se planifique e implemente la migración.

Revisión de los datos que se migran

Trabaje con los equipos de almacenamiento y de aplicaciones para analizar las características de los datos que se migran. Esta información ayuda a determinar una estrategia de migración que se pueda ejecutar con DataSync.

Determinación de los patrones de uso de los datos

  • En el caso de los datos de uso activo con modificaciones frecuentes, planifique varias oleadas de transferencias incrementales a fin de evitar interrupciones en las operaciones del negocio.

  • En el caso de los datos de solo lectura que se pueden considerar de archivo, es posible que no sea necesario planificar oleadas.

  • Si existe una combinación de patrones de uso de datos, planifique oleadas que migren estos distintos conjuntos de datos por separado. Por ejemplo, puede definir una oleada para los datos de archivo y dedicar el resto de las oleadas a la migración de los datos activos.

Identificación de la estructura y el diseño de los datos

  • Determine si los datos están organizados por periodos de tiempo (año, mes, día) u otros patrones.

  • Use esta estructura de organización para planificar las oleadas de la migración. Por ejemplo, puede migrar los datos de archivo correspondientes a un año completo durante una sola oleada.

Documentación de recursos compartidos y carpetas

  • Cree un inventario de los recursos compartidos y las carpetas (incluidos los recuentos de archivos u objetos de cada uno).

  • Identifique los recursos compartidos y las carpetas con conjuntos de datos activos. Es posible que estos requieran transferencias incrementales durante la migración.

  • Revise las cuotas de DataSync. Esto puede ayudarle a planificar cómo dividir el conjunto de datos al configurar DataSync.

Análisis de los tamaños de archivo

  • Se espera un mayor rendimiento de transferencia de datos para archivos de mayor tamaño (MB o GB) en comparación con archivos más pequeños (KB).

  • Si se trabaja con una gran cantidad de archivos pequeños, es previsible que haya más operaciones de metadatos en el sistema de almacenamiento y un menor rendimiento de datos. DataSync realiza estas operaciones al comparar y verificar las ubicaciones de origen y destino.

Identificación de los requisitos de almacenamiento

Para elegir un servicio de almacenamiento de AWS compatible para migrar los datos, es necesario evaluar las características y el rendimiento del sistema de almacenamiento de origen.

Esta información también puede ayudarle a programar las transferencias a fin de minimizar el impacto en las operaciones del negocio durante la migración.

Determinación de la compatibilidad del almacenamiento de origen

DataSync puede funcionar con una variedad de sistemas de almacenamiento que permiten el acceso mediante clientes NFS, SMB, HDFS y almacenamiento de objetos compatible con S3.

Si se migra desde almacenamiento en otra nube, verifique que DataSync pueda funcionar con ese proveedor. Para obtener una lista de ubicaciones de origen compatibles, consulte ¿Dónde puedo transferir mis datos con AWS DataSync?

Revisión de los requisitos de conservación de metadatos

DataSync puede conservar los metadatos de archivos u objetos durante una transferencia. La forma en que se conservan los metadatos depende de las ubicaciones de transferencia y de si dichas ubicaciones usan tipos de metadatos similares.

En algunos casos, DataSync requiere permisos adicionales para conservar los metadatos de archivos, como las listas de control de acceso discrecional (DACL) de NTFS.

Para obtener más información, consulte Comprenda cómo DataSync gestiona los metadatos de archivos y objetos.

Recopilación de métricas de rendimiento del almacenamiento de origen

Mida la línea base de operaciones de entrada/salida por segundo (IOPS) y el rendimiento del disco durante cargas de trabajo promedio y de pico en el almacenamiento de origen. La transferencia de datos añade sobrecarga de E/S tanto en los sistemas de almacenamiento de origen como en los de destino.

Compare estos datos de rendimiento con las especificaciones del sistema de almacenamiento para determinar los recursos de rendimiento disponibles.

Selección de un servicio de AWS de almacenamiento de destino

En este punto, es posible que ya tenga una idea de qué servicio de almacenamiento de AWS resulta adecuado para los datos. De lo contrario, los patrones de uso de los datos y el rendimiento del almacenamiento son dos aspectos clave que conviene considerar al tomar la decisión. Por ejemplo, puede considerar Amazon S3 si dispone de datos de archivo, y Amazon FSx o Amazon EFS para datos activos.

Para ayudarle a decidir el servicio de almacenamiento basado en objetos o archivos más adecuado para los datos, consulte Elección de un servicio de almacenamiento de AWS.

Determinación de los requisitos de red

Para migrar los datos con DataSync, es necesario establecer conexiones de red entre el almacenamiento de origen, el agente y AWS. También es necesario planificar suficiente ancho de banda de la red e infraestructura.

Trabaje con los ingenieros de red y los administradores de almacenamiento para identificar los siguientes requisitos de red.

Evaluación del ancho de banda de la red disponible

El ancho de banda de la red disponible influye en las velocidades de transferencia y en la duración total de la migración. Si la transferencia se realiza desde un sistema de almacenamiento en las instalaciones, realice lo siguiente:

  • Trabaje con el equipo de red para determinar el uso promedio y máximo del ancho de banda.

  • Identifique intervalos de tiempo en los que sea posible transferir datos y evitar interrupciones en las operaciones diarias. Esto permite definir cuándo se llevarán a cabo las oleadas de migración y las transiciones.

Puede controlar la cantidad de ancho de banda que utiliza DataSync. Para obtener más información, consulte Configuración de los límites de ancho de banda para la tarea de AWS DataSync.

Dado que las transferencias desde almacenamiento en otras nubes se suelen realizar a través de Internet público, por lo general existen menos restricciones y consideraciones de ancho de banda en este tipo de transferencias.

Consideración de opciones para conectar la red a AWS

Considere las siguientes opciones para establecer la conectividad de red para la transferencia con DataSync:

  • Direct Connect: revise los ejemplos de arquitectura y enrutamiento para el uso de Direct Connect con DataSync. Puede supervisar la actividad de Direct Connect mediante Amazon CloudWatch.

  • VPN: AWS Site-to-Site VPN ofrece hasta 1,25 Gbps de rendimiento por túnel.

  • Internet público: póngase en contacto con el proveedor de servicios de Internet para obtener datos de uso de red.

Selección de un punto de conexión de servicio para la comunicación del agente

Los agentes de DataSync usan puntos de conexión de servicio para comunicarse con el servicio DataSync. El tipo de punto de conexión que se utilice depende de la forma en que se establezca conexión entre la red y AWS

Planificación de una infraestructura de red suficiente

Para cada tarea de transferencia que se cree, DataSync genera y administra automáticamente la infraestructura de red necesaria para las transferencias de datos. Esta infraestructura se conoce como interfaces de red o interfaces de red elásticas, que son componentes de red lógicos dentro de una nube virtual privada (VPC) de Amazon y representan tarjetas de red virtuales. Para obtener más información, consulte la Guía del usuario de Amazon EC2.

Cada interfaz de red usa una única dirección IP en la subred de VPC de destino. Para asegurarse de contar con suficiente infraestructura de red para la migración, realice lo siguiente:

  • Anote el número de interfaces de red que DataSync creará para la ubicación de destino de DataSync.

  • Asegúrese de que la subred disponga de suficientes direcciones IP para las tareas de DataSync. Por ejemplo, una tarea que usa un agente requiere cuatro direcciones IP. Si se crean cuatro tareas para la migración, esto significa que se necesitan 16 direcciones IP disponibles en la subred.