Elección de la instancia de replicación de AWS DMS adecuada para la migración
AWS DMS crea la instancia de replicación en una instancia de Amazon EC2. AWS DMS admite actualmente las clases de instancias de T3, C5, C6i, R5 y R6i Amazon EC2 para instancias de replicación:
-
Las instancias T3 son el tipo de instancia de uso general fragmentable de próxima generación. Este tipo proporciona un nivel básico de rendimiento de la CPU con posibilidad de ampliar el uso de la CPU en cualquier momento durante el tiempo que sea necesario. Las instancias T3 ofrecen un equilibrio entre recursos informáticos, de memoria y de red y están diseñadas para aplicaciones con un uso moderado de CPU que experimentan picos temporales en su uso. Las instancias T3 acumulan créditos de CPU cuando una carga de trabajo funciona por debajo del umbral de referencia. Cada crédito de CPU obtenido proporciona a la instancia T3 la oportunidad de aprovechar al máximo el rendimiento de un núcleo de CPU completo durante un minuto cuando sea necesario.
Las instancias T3 pueden realizar ráfagas en cualquier momento durante el tiempo que sea necesario en el modo
unlimited. Para obtener más información sobre el modounlimited, consulte Trabajo con modo ilimitado para las instancias de rendimiento ampliable. -
Las instancias C5 son el tipo de instancia de próxima generación que ofrecen un alto rendimiento rentable a un precio bajo por cómputo para ejecutar cargas de trabajo avanzadas con un uso intensivo de computación. Esto incluye cargas de trabajo como servidores web de alto rendimiento, computación de alto rendimiento (HPC), procesamiento por lotes, publicación de anuncios, juegos multijugador altamente escalables y codificación de vídeo. Otras cargas de trabajo para las que las instancias C5 son adecuadas incluyen el modelado científico, el análisis distribuido y la inferencia de aprendizaje profundo y automático. Las instancias C5 están disponibles con una selección de procesadores de Intel y AMD.
-
Las instancias C6i ofrecen un rendimiento informático hasta un 15 % superior al de las instancias Gen5 comparables para una amplia variedad de cargas de trabajo y un cifrado de memoria permanente. Las instancias C6i son ideales para cargas de trabajo con un uso intensivo de computación, como el procesamiento por lotes, la analítica distribuida, la computación de alto rendimiento (HPC), la distribución de anuncios, los juegos multijugador altamente escalables y la codificación de vídeo.
-
Las instancias R5 son la nueva generación de tipos de instancias optimizados para memoria para Amazon EC2. Las instancias R5 son ideales para aplicaciones con un uso intensivo de memoria, como bases de datos de alto rendimiento, cachés en memoria de escala web distribuida, bases de datos en memoria de tamaño mediano, análisis de macrodatos en tiempo real y otras aplicaciones empresariales. Las migraciones continuas o las replicaciones de sistemas de transacción de alto rendimiento que utilizan AWS DMS pueden también consumir gran cantidad de CPU y de memoria.
-
Las instancias R6i ofrecen un rendimiento informático hasta un 15 % superior al de las instancias Gen5 comparables para una amplia variedad de cargas de trabajo y un cifrado de memoria permanente. Las instancias R6i cuentan con la certificación SAP y son ideales para cargas de trabajo como bases de datos SQL y NoSQL, cachés en memoria distribuidas a escala web como Memcached y Redis OSS, bases de datos en memoria como SAP HANA y análisis de macrodatos en tiempo real, como los clústeres de Hadoop y Spark.
-
Las instancias de C7i ofrecen mejor rendimiento computacional en comparación con las instancias de la generación anterior. En cuanto a las cargas de trabajo de AWS DMS, las instancias de C7i son excelentes a la hora de acelerar los procesos de transformación de datos, gestionar las conversiones de esquemas con un uso intensivo de los recursos computacionales y mantener un rendimiento uniforme durante las tareas de migración de gran volumen. Estas instancias ofrecen un equilibrio ideal para el rendimiento computacional que requiere un rendimiento sostenido de la CPU.
-
Las instancias de R7i mejoran el rendimiento computacional en comparación con las instancias de la generación anterior, además de disponer de una gran capacidad de memoria para las cargas de trabajo con un uso intensivo de memoria. En cuanto a las cargas de trabajo de AWS DMS, las instancias de R7i son especialmente adecuadas para realizar tareas con bases de datos de gran tamaño que procesan grandes volúmenes de transacciones simultáneas de bases de datos, lo que permite gestionar de forma eficiente los escenarios de replicación con uso intensivo de memoria y los procesos complejos de validación de datos que requieren una cantidad considerable de búferes de memoria.
Cada instancia de replicación tiene una configuración específica de memoria y de vCPU. La siguiente tabla muestra la configuración de cada tipo de instancia de replicación. Para obtener información acerca de los precios, consulte la página de precios del servicio de AWS Database Migration Service
Tipos de instancias de replicación de uso general
|
Tipo |
vCPU |
Memoria (GiB) |
|---|---|---|
|
dms.t3.micro |
2. |
1 |
|
dms.t3.small |
2 |
2. |
|
dms.t3.medium |
2 |
4 |
|
dms.t3.large |
2 |
8 |
Tipos de instancias de replicación optimizadas para computación
|
Tipo |
vCPU |
Memoria (GiB) |
|---|---|---|
|
dms.c5.large |
2 |
4 |
|
dms.c5.xlarge |
4 |
8 |
|
dms.c5.2xlarge |
8 |
16 |
|
dms.c5.4xlarge |
16 |
32 |
|
dms.c5.9xlarge |
36 |
72 |
|
dms.c5.12xlarge |
48 |
96 |
|
dms.c5.18xlarge |
72 |
144 |
|
dms.c5.24xlarge |
96 |
192 |
|
dms.c6i.large |
2 |
4 |
|
dms.c6i.xlarge |
4 |
8 |
|
dms.c6i.2xlarge |
8 |
16 |
|
dms.c6i.4xlarge |
16 |
32 |
|
dms.c6i.8xlarge |
32 |
64 |
|
dms.c6i.12xlarge |
48 |
96 |
|
dms.c6i.16xlarge |
64 |
128 |
|
dms.c6i.24xlarge |
96 |
192 |
|
dms.c6i.32xlarge |
128 |
256 |
|
dms.c7i.large |
2 |
4 |
|
dms.c7i.xlarge |
4 |
8 |
|
dms.x7i.2xlarge |
8 |
16 |
|
dms.x7i.4xlarge |
16 |
32 |
|
dms.x7i.8xlarge |
32 |
64 |
|
dms.x7i.12xlarge |
48 |
96 |
|
dms.x7i.16xlarge |
64 |
128 |
|
dms.x7i.24xlarge |
96 |
192 |
|
dms.x7i.48xlarge |
192 |
384 |
Tipos de instancias de replicación optimizadas para memoria
|
Tipo |
vCPU |
Memoria (GiB) |
|---|---|---|
|
dms.r5.large |
2 |
16 |
|
dms.r5.xlarge |
4 |
32 |
|
dms.r5.2xlarge |
8 |
64 |
|
dms.r5.4xlarge |
16 |
128 |
|
dms.r5.8xlarge |
32 |
256 |
|
dms.r5.12xlarge |
48 |
384 |
|
dms.r5.16xlarge |
64 |
512 |
|
dms.r5.24xlarge |
96 |
768 |
|
dms.r6i.large |
2 |
16 |
|
dms.r6i.xlarge |
4 |
32 |
|
dms.r6i.2xlarge |
8 |
64 |
|
dms.r6i.4xlarge |
16 |
128 |
|
dms.r6i.8xlarge |
32 |
256 |
|
dms.r6i.12xlarge |
48 |
384 |
|
dms.r6i.16xlarge |
64 |
512 |
|
dms.r6i.24xlarge |
96 |
768 |
|
dms.r6i.32xlarge |
128 |
1024 |
|
dms.r7i.large |
2 |
16 |
|
dms.r7i.xlarge |
4 |
32 |
|
dms.r7i.2xlarge |
8 |
64 |
|
dms.r7i.4xlarge |
16 |
128 |
|
dms.r7i.8xlarge |
32 |
256 |
|
dms.r7i.12xlarge |
48 |
384 |
|
dms.r7i.16xlarge |
64 |
512 |
|
dms.r7i.24xlarge |
96 |
768 |
|
dms.r7i.48xlarge |
192 |
1536 |
En las tablas anteriores se muestran todos los tipos de instancias de replicación de AWS DMS, pero es posible que los tipos disponibles en la región varíen. Para ver los tipos de instancias de replicación disponibles en la región, puede ejecutar el siguiente comando AWS CLI:
aws dms describe-orderable-replication-instances --regionyour_region_name
Temas
Decidir qué clase de instancias usar
Para ayudarle a determinar qué clase de instancia de replicación funcionaría mejor para usted, veamos el proceso de captura de datos de cambios (CDC) que utiliza AWS DMS.
Supongamos que está ejecutando una tarea de carga completa más CDC (carga masiva más replicación continua). En este caso, la tarea tiene su propio repositorio SQLite para almacenar los metadatos y otra información. Antes de que AWS DMS inicie una carga completa, estos pasos tienen lugar:
-
AWS DMS comienza a capturar los cambios para las tablas que está migrando desde el registro de transacciones del motor de origen (los llamamos cambios en la memoria caché). Después de que se haya realizado la carga completa, estos cambios en caché se recopilan y se aplican en el destino. En función del volumen de los cambios en la memoria caché, estos cambios se pueden aplicar directamente desde la memoria, donde se recopilan en primer lugar, hasta un umbral definido. O pueden aplicarse desde el disco, donde los cambios se escriben cuando no se pueden mantener en memoria.
-
Después de que se apliquen cambios en la memoria caché, de forma predeterminada AWS DMS inicia un proceso de aplicación transaccional en la instancia de destino.
Durante la fase de cambios en caché aplicada y la fase de replicaciones en curso, AWS DMS utiliza dos búferes de flujo, uno para los datos entrantes y salientes. AWS DMS también utiliza un componente importante denominado clasificador, que es otro búfer de memoria. A continuación se muestran dos usos importantes del componente clasificador (que tiene otros):
-
Realiza un seguimiento de todas las transacciones y se asegura de que reenvía únicamente las transacciones pertinentes al búfer de salida.
-
Se asegura de que las transacciones se reenvían en el mismo orden de confirmación que en el origen.
Como puede ver, tenemos tres importantes búferes de memorias en esta arquitectura para CDC en AWS DMS. Si cualquiera de estos búferes experimenta presión de memoria, la migración puede tener problemas de desempeño que podrían llegar a producir errores.
Cuando conecte cargas de trabajo pesadas con un elevado número de transacciones por segundo (TPS) en esta arquitectura, puede encontrar la memoria adicional proporcionada por instancias R5 y R6i útiles. Puede utilizar instancias R5 y R6i para almacenar un gran número de transacciones en memoria y evitar problemas de presión de memoria durante las replicaciones en curso.
Trabajo con modo ilimitado para las instancias de rendimiento ampliable
Una instancia de rendimiento ampliable configurada como unlimited, por ejemplo una instancia de T3, puede sostener una utilización de la CPU alta durante cualquier periodo siempre que sea necesario. El precio por hora de la instancia puede cubrir automáticamente todos los picos de uso de la CPU. Es así si la utilización media de la CPU de la instancia está a la par o por debajo de la base de referencia en un periodo de 24 horas o durante la vida útil de la instancia, lo que dure menos.
Para la gran mayoría de las cargas de trabajo de uso general, las instancias configuradas como unlimited proporcionan un rendimiento suficiente sin cargos adicionales. Si la instancia requiere un mayor uso de la CPU durante un período prolongado, también puede hacerlo por un cargo fijo adicional por hora de vCPU. Para obtener información sobre los precios de las instancias T3, consulte “Créditos de CPU T3” en AWS Database Migration Service
Para obtener más información sobre el modo unlimited para instancias de T3, consulte Modo ilimitado para las instancias de rendimiento ampliable en la Guía del usuario de Amazon EC2.
importante
Si utiliza una instancia dms.t3.micro en la oferta del nivel gratuito de AWSunlimited, es posible que se apliquen cargos. En particular, podrían aplicarse cargos si la utilización promedio en un periodo de 24 horas supera la utilización de base de referencia de la instancia. Para obtener más información, consulte Utilización de referencia en la Guía del usuario de Amazon EC2.
Las instancias T3 se lanzan como unlimited de forma predeterminada. Si el uso medio de CPU durante un período de 24 horas supera la base de referencia, incurre en cargos por créditos excedentes. En algunos casos, es posible que lance instancias de spot T3 como unlimited y planee usarlas inmediatamente y durante un corto periodo de tiempo. Si lo hace sin tiempo de inactividad para acumular créditos de CPU, genera gastos por créditos excedentes. Le recomendamos lanzar las instancias de spot de T3 en modo estándar para evitar pagar costos más elevados. Para obtener más información, consulte Los créditos sobrantes pueden generar costos, las instancias de spot T3 y Modo estándar para las instancias de rendimiento ampliable en la Guía del usuario de Amazon EC2.