Recopilación de requisitos para la migración - AWS DataSync

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Recopilación de requisitos para la migración

El primer paso en una migración de datos a gran escala requiere recopilar una variedad de información en la organización.

Esta información ayuda a crear un proceso de migración, que en el caso de migraciones a gran escala puede incluir múltiples transferencias y procedimientos de transición (realizados en oleadas) desde el origen hasta el almacenamiento de destino.

Comprender por qué se desea migrar

Antes de poder empezar a migrar a AWS, debe comprender claramente por qué está migrando sus datos. Esto ayuda a abordar desafíos comunes de la migración, como cumplir plazos, administrar recursos y coordinar equipos.

Si se necesita ayuda para determinar las motivaciones de la migración, responda a las siguientes preguntas:

  • ¿Se busca liberar espacio de almacenamiento en las instalaciones?

  • ¿Se deben cumplir plazos de contratos de soporte de hardware?

  • ¿Se trata de una salida de un centro de datos?

  • ¿Cuál es el cronograma de la migración?

  • ¿Se transfieren datos desde otro almacenamiento en la nube?

  • ¿Se migran conjuntos de datos parciales o completos?

  • ¿La migración tiene fines de archivado?

  • ¿Las aplicaciones o los usuarios requieren acceso regular a estos datos?

Análisis de la logística

Aborde algunos aspectos logísticos básicos relacionados con el entorno de almacenamiento, la migración y la organización.

  1. Obtenga una comprensión básica de la infraestructura de almacenamiento de datos actual.

  2. Compruebe si necesita un DataSync agente. Por ejemplo, se requiere un agente si la transferencia se realiza desde almacenamiento en las instalaciones.

  3. Si se necesita un agente, asegúrese de comprender los requisitos del agente:

    • Un agente se puede ejecutar como una máquina virtual (VM) en VMware ESXi, una máquina virtual basada en el kernel (KVM) de Linux o hipervisores de Microsoft Hyper-V. También puede implementar un agente como una instancia de Amazon EC2 dentro de AWS.

    • Las migraciones a gran escala suelen requerir un uso intensivo de memoria. Asegúrese de que el agente disponga de suficiente memoria RAM.

  4. Identifique a las partes interesadas clave de los equipos de dirección, redes, almacenamiento y TI que deben participar en la migración. Esto puede incluir:

    • Designe un líder de subproceso único dedicado al proyecto y a sus resultados.

    • Determine quién es responsable de la titularidad y la clasificación de los datos que se migran.

    • Identifique quién administra su fuente y quién administrará eventualmente el servicio AWS de almacenamiento al que está migrando.

    • Descubra quién creará y administrará cualquier otro proceso para sus datos una vez que estén disponibles. AWS

  5. Establezca canales de comunicación entre departamentos.

  6. Cree un plan de reversión para contingencias.

  7. Documente el proceso completo de migración, incluidas las oleadas, la validación y los procedimientos de transición. Use este recurso como manual de procedimientos para toda la migración. Actualizará este proceso a medida que se planifique e implemente la migración.

Revisión de los datos que se migran

Trabaje con los equipos de almacenamiento y de aplicaciones para analizar las características de los datos que se migran. Esta información le ayuda a determinar una estrategia de migración que pueda utilizar DataSync.

Determinación de los patrones de uso de los datos

  • En el caso de los datos de uso activo con modificaciones frecuentes, planifique varias oleadas de transferencias incrementales a fin de evitar interrupciones en las operaciones del negocio.

  • En el caso de los datos de solo lectura que se pueden considerar de archivo, es posible que no sea necesario planificar oleadas.

  • Si existe una combinación de patrones de uso de datos, planifique oleadas que migren estos distintos conjuntos de datos por separado. Por ejemplo, puede definir una oleada para los datos de archivo y dedicar el resto de las oleadas a la migración de los datos activos.

Identificación de la estructura y el diseño de los datos

  • Determine si los datos están organizados por periodos de tiempo (año, mes, día) u otros patrones.

  • Use esta estructura de organización para planificar las oleadas de la migración. Por ejemplo, puede migrar los datos de archivo correspondientes a un año completo durante una sola oleada.

Documentación de recursos compartidos y carpetas

  • Cree un inventario de los recursos compartidos y las carpetas (incluidos los recuentos de archivos u objetos de cada uno).

  • Identifique los recursos compartidos y las carpetas con conjuntos de datos activos. Es posible que estos requieran transferencias incrementales durante la migración.

  • Revise las DataSync cuotas. Esto puede ayudarle a planificar cómo particionar el conjunto de datos durante la configuración DataSync.

Análisis de los tamaños de archivo

  • Se espera un mayor rendimiento de transferencia de datos para archivos de mayor tamaño (MB o GB) en comparación con archivos más pequeños (KB).

  • Si trabaja con muchos archivos más pequeños, espere más operaciones de metadatos en su sistema de almacenamiento y un menor rendimiento de datos. DataSyncrealiza estas operaciones al comparar y verificar las ubicaciones de origen y destino.

Identificación de los requisitos de almacenamiento

Para elegir un servicio AWS de almacenamiento compatible para migrar sus datos, debe evaluar las características y el rendimiento del sistema de almacenamiento de origen.

Esta información también puede ayudarlo a programar las transferencias a fin de minimizar el impacto en las operaciones del negocio durante la migración.

Determinación de la compatibilidad del almacenamiento de origen

DataSync puede funcionar con una variedad de sistemas de almacenamiento que permiten el acceso a través de clientes de almacenamiento de objetos compatibles con NFS, SMB, HDFS y S3.

Si vas a migrar desde otro almacenamiento en la nube, comprueba que funcione con ese DataSync proveedor. Para obtener una lista de ubicaciones de origen compatibles, consulte ¿Dónde puedo transferir mis datos AWS DataSync?

Revisión de los requisitos de conservación de metadatos

DataSync puede conservar los metadatos de tus archivos u objetos durante una transferencia. La forma en que se conservan los metadatos depende de las ubicaciones de transferencia y de si dichas ubicaciones usan tipos de metadatos similares.

DataSync en algunos casos, necesita permisos adicionales para conservar los metadatos de los archivos, como las listas de acceso discrecional de NTFS ()DACLs.

Para obtener más información, consulte Comprender cómo se DataSync gestionan los metadatos de archivos y objetos.

Recopilación de métricas de rendimiento del almacenamiento de origen

Mida la línea base de operaciones de entrada/salida por segundo (IOPS) y el rendimiento del disco durante cargas de trabajo promedio y de pico en el almacenamiento de origen. La transferencia de datos supone una I/O sobrecarga para los sistemas de almacenamiento de origen y destino.

Compare estos datos de rendimiento con las especificaciones del sistema de almacenamiento para determinar los recursos de rendimiento disponibles.

Elegir un servicio de AWS almacenamiento de destino

En este punto, es posible que tenga una idea de qué servicio de AWS almacenamiento es adecuado para sus datos. De lo contrario, los patrones de uso de los datos y el rendimiento del almacenamiento son dos aspectos clave que conviene considerar al tomar la decisión. Por ejemplo, podría considerar Amazon S3 si tiene datos archivados y Amazon FSx o Amazon EFS para los datos activos.

Para ayudarle a decidir el almacenamiento basado en objetos o archivos adecuado para sus datos, consulte Elegir un servicio AWS de almacenamiento.

Determinación de los requisitos de red

Para migrar sus datos DataSync, debe establecer conexiones de red entre el almacenamiento de origen, el agente y AWS. También es necesario planificar suficiente ancho de banda de la red e infraestructura.

Trabaje con los ingenieros de red y los administradores de almacenamiento para identificar los siguientes requisitos de red.

Evaluación del ancho de banda de la red disponible

El ancho de banda de la red disponible influye en las velocidades de transferencia y en la duración total de la migración. Si la transferencia se realiza desde un sistema de almacenamiento en las instalaciones, realice lo siguiente:

  • Trabaje con el equipo de red para determinar el uso promedio y máximo del ancho de banda.

  • Identifique intervalos de tiempo en los que sea posible transferir datos y evitar interrupciones en las operaciones diarias. Esto permite definir cuándo se llevarán a cabo las oleadas de migración y las transiciones.

Puede controlar cuánto ancho de banda DataSync utiliza. Para obtener más información, consulte Establecer límites de ancho de banda para su tarea AWS DataSync.

Dado que las transferencias desde almacenamiento en otras nubes se suelen realizar a través de Internet público, por lo general existen menos restricciones y consideraciones de ancho de banda en este tipo de transferencias.

¿Está considerando las opciones para conectar su red a AWS

Ten en cuenta las siguientes opciones para establecer la conectividad de red para tu DataSync transferencia:

  • Direct Connect- Revise los ejemplos de arquitectura y enrutamiento para usar Direct Connect with DataSync. Puedes monitorizar la actividad de Direct Connect a través de Amazon CloudWatch.

  • VPN: AWS Site-to-Site VPN ofrece hasta 1,25 Gbps de rendimiento por túnel.

  • Internet público: póngase en contacto con el proveedor de servicios de Internet para obtener datos de uso de red.

Selección de un punto de conexión de servicio para la comunicación del agente

DataSync los agentes utilizan los puntos finales del servicio para comunicarse con el DataSync servicio. El tipo de punto de conexión que se utilice depende de la forma en que se establezca conexión entre la red y AWS

Planificación de una infraestructura de red suficiente

Para cada tarea de transferencia que cree, genera y administra DataSync automáticamente la infraestructura de red para las transferencias de datos. Esta infraestructura se conoce como interfaces de red o interfaces de red elásticas, que son componentes de red lógicos dentro de una nube privada virtual (VPC) de Amazon y representan tarjetas de red virtuales. Para obtener más información, consulte la Guía del usuario de Amazon EC2.

Cada interfaz de red usa una única dirección IP en la subred de VPC de destino. Para asegurarse de contar con suficiente infraestructura de red para la migración, realice lo siguiente:

  • Anote la cantidad de interfaces de red que DataSync se crearán para su ubicación de DataSync destino.

  • Asegúrese de que la subred tenga suficientes direcciones IP para sus DataSync tareas. Por ejemplo, una tarea que usa un agente requiere cuatro direcciones IP. Si se crean cuatro tareas para la migración, esto significa que se necesitan 16 direcciones IP disponibles en la subred.