Elección de una solución de alta disponibilidad y recuperación ante desastres - Recomendaciones de AWS

Elección de una solución de alta disponibilidad y recuperación ante desastres

Descripción general

Le recomendamos que diseñe una arquitectura para la implementación de SQL Server en AWS que se adapte a las necesidades de su empresa y, al mismo tiempo, cumpla con sus objetivos de recuperación ante desastres, lo que abarca el objetivo de tiempo de recuperación (RTO) y el objetivo de punto de recuperación (RPO). Las siguientes soluciones pueden serle útiles para diseñar la arquitectura adecuada para SQL Server en Amazon Elastic Compute Cloud (Amazon EC2) y, al mismo tiempo, para optimizar los costos de las cargas de trabajo de SQL Server.

  • Grupos de disponibilidad Always On de SQL Server: los grupos de disponibilidad Always On de SQL Server proporcionan soluciones de alta disponibilidad y recuperación ante desastres para las bases de datos de SQL Server. Un grupo de disponibilidad consta de un conjunto de bases de datos de usuarios que realizan la conmutación por error entre sí. Los grupos de disponibilidad Always On también proporcionan redundancia en las bases de datos, pero no requieren almacenamiento compartido: cada réplica tiene su propio almacenamiento local. Puede implementar esta característica como una solución de alta disponibilidad y recuperación ante desastres. Para obtener más información, consulte What is an Always On availability group? en la documentación de Microsoft.

  • Instancias de clústeres de conmutación por error (FCI) Always On de SQL Server: las FCI Always On de SQL Server utilizan los clústeres de conmutación por error de Windows Server (WSFC) para proporcionar una alta disponibilidad a las instancias de SQL Server. Las FCI requieren almacenamiento compartido para alojar las bases de datos. Puede utilizar el almacenamiento en bloques compartido o el almacenamiento de archivos compartido. Por ejemplo, puede utilizar Amazon FSx para Windows File Server o Amazon FSx para NetApp ONTAP como solución de almacenamiento compartido con varias zonas de disponibilidad. Para obtener más información, consulte Always On Failover Cluster Instances (SQL Server) en la documentación de Microsoft.

  • SIOS DataKeeper: SIOS DataKeeper le permite cumplir con los requisitos de alta disponibilidad y recuperación ante desastres, pues activa una FCI de SQL Server que abarca tanto las zonas de disponibilidad como las Regiones de AWS. SIOS DataKeeper crea una red de área de almacenamiento (SAN) virtual agrupada mediante volúmenes locales de Amazon Elastic Block Store (Amazon EBS) y utiliza la replicación sincrónica entre las zonas de disponibilidad para garantizar la alta disponibilidad, a la vez que utiliza la replicación asíncrona entre regiones y para la recuperación ante desastres. Para obtener más información, consulte la sección High Availability Protection for Windows Applications en la documentación de SIOS.

  • Grupos de disponibilidad distribuida: un grupo de disponibilidad distribuida es un tipo especial de grupo de disponibilidad que abarca dos grupos de disponibilidad Always On independientes. Un grupo de disponibilidad puede residir en dos regiones distintas (por ejemplo, us-east-1 y us-west-1). Puede pensar en un grupo de disponibilidad distribuido como un grupo de disponibilidad de grupos de disponibilidad porque los grupos de disponibilidad Always On subyacentes están configurados en dos clústeres de WSFC diferentes. Se requiere la edición Enterprise de SQL Server para implementar grupos de disponibilidad distribuida. Para obtener más información, consulte Distributed availability groups en la documentación de Microsoft.

  • Envío de registros: puede implementar el envío de registros para proteger sus bases de datos en varias regiones, en el raro caso de que una región se vea afectada y deje de estar disponible. En función de la frecuencia de envío de las transacciones y los registros, puede lograr el RPO y el RTO en cuestión de minutos. Para obtener más información, consulte About Log Shipping (SQL Server) en la documentación de Microsoft.

  • AWS Elastic Disaster Recovery: Recuperación elástica ante desastres es una aplicación de software como servicio (SaaS) que administra la replicación de servidores desde cualquier infraestructura a AWS con fines de recuperación ante desastres. También puede usar Recuperación elástica ante desastres para replicar SQL Server en todas las regiones. Recuperación elástica ante desastres es una solución basada en agentes que replica máquinas virtuales completas, lo que incluye el sistema operativo, todas las aplicaciones instaladas y todas las bases de datos en un área de almacenamiento provisional. Para obtener más información, consulte What is Elastic Disaster Recovery? en la documentación de Recuperación elástica ante desastres.

  • AWS Database Migration Service (AWS DMS): AWS DMSadmite la migración en tiempo real de datos hacia y desde AWS, también si se trata de una región diferente. Puede usar esta característica para configurar una instancia de SQL Server independiente en una región diferente para que sirva como base de datos de la recuperación ante desastres. Para obtener más información, consulte What is AWS Database Migration Service? en la documentación de AWS DMS.

Grupos de disponibilidad Always On de SQL Server

Si utiliza la edición Enterprise de SQL Server solo para un grupo de disponibilidad Always On de alta disponibilidad, puede pasarse a la edición Standard de SQL Server aprovechando los grupos de disponibilidad básicos. Puede reducir los costos entre un 65 % y un 75 % si utiliza grupos de disponibilidad básicos en lugar de grupos de disponibilidad Always On.

nota

Para obtener información adicional sobre las diferencias de costo entre las distintas ediciones de SQL Server, consulte la sección Comparación de las ediciones de SQL Server de esta guía.

Características

  • Disponible en la edición Standard de SQL Server.

  • Límite de dos réplicas (principal y secundaria).

  • No hay acceso de lectura en la réplica secundaria.

  • No hay comprobaciones de integridad en las réplicas secundarias.

Limitaciones

  • Solo admite una base de datos de disponibilidad por grupo de disponibilidad.

  • Los grupos de disponibilidad básicos no pueden formar parte de un grupo de disponibilidad distribuida,

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una solución de clúster de conmutación por error de Windows Server.

Arquitectura de un clúster de conmutación por error de Windows Server

Instancias de clústeres de conmutación por error Always On de SQL Server

Puede utilizar instancias de clústeres de conmutación por error (FCI) para garantizar la continuidad de las operaciones de la base de datos y, al mismo tiempo, minimizar el tiempo de inactividad y reducir el riesgo de pérdida de datos. Las FCI ofrecen una solución fiable si busca una alta disponibilidad para su base de datos de SQL Server sin configurar réplicas de lectura.

A diferencia de los grupos de disponibilidad, las FCI pueden proporcionar una solución de conmutación por error fiable sin necesidad de usar la edición Enterprise de SQL Server. En cambio, las FCI solo requieren una licencia de la edición Standard de SQL Server. Puede utilizar las FCI para reducir los costos asociados al uso de licencias de SQL Server entre un 65 % y un 75 %.

nota

Para obtener información adicional sobre las diferencias de costo entre las ediciones de SQL Server, consulte la sección Comparación de las ediciones de SQL Server de esta guía.

Considere lo siguiente:

  • Amazon FSx para Windows File Server ofrece una solución eficaz para cumplir los requisitos de almacenamiento compartido de las FCI de SQL Server. Puede usar FSx para Windows File Server si no quiere adquirir una licencia para una solución de replicación de almacenamiento y administrar el almacenamiento compartido por su cuenta. Esto puede suponer un ahorro significativo de entre un 30 % y un 40 %. Para obtener más información, consulte Simplify your Microsoft SQL Server high availability deployments using Amazon FSx for Windows File Server en el blog de almacenamiento de AWS.

  • Con Software Assurance benefits summary (PDF descargable) y el modelo traiga su propia licencia (BYOL), podrá aprovechar las ventajas de la conmutación por error pasiva, siempre y cuando el servidor secundario sea pasivo. Esto se traduce en un ahorro de los costos derivados del uso de licencias de SQL, ya que no es necesario proporcionar licencias al nodo pasivo del clúster.

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una copia de seguridad nativa de SQL Server en FSx para Windows File Server.

Arquitectura de FSx para Windows File Server

SIOS DataKeeper

Le recomendamos que tenga en cuenta los requisitos de almacenamiento compartido si planea implementar las FCI de SQL Server en AWS. Las infraestructuras en las instalaciones tradicionales suelen utilizar una SAN para cumplir con los requisitos de almacenamiento compartido, pero esta no es una opción viable en AWS. Amazon FSx para Windows File Server es la solución de almacenamiento recomendada para las FCI de SQL Server en AWS, pero tiene limitaciones que impiden agregar servidores de clústeres en diferentes Regiones de AWS.

Puede utilizar SIOS DataKeeper para crear una FCI de SQL Server que abarque tanto las zonas de disponibilidad como las regiones y, al mismo tiempo, reducir los costos entre un 58 % y un 71 %. SIOS DataKeeper le permite obtener las ventajas de alta disponibilidad de las FCI. Esto convierte a SIOS DataKeeper en una solución rentable y fiable para las organizaciones.

Tenga en cuenta las siguientes ventajas adicionales de utilizar SIOS DataKeeper:

  • SIOS DataKeeper crea una SAN virtual agrupada mediante volúmenes de EBS locales y utiliza la replicación sincrónica entre las zonas de disponibilidad para lograr una alta disponibilidad. En cuanto a la recuperación ante desastres, SIOS DataKeeper utiliza la replicación asíncrona entre regiones.

  • SIOS DataKeeper proporciona características de agrupamiento empresariales mediante el uso de la edición Standard de SQL Server. Esto reduce los costos asociados al uso de licencias de SQL Server entre un 65 % y un 75 % en comparación con la implementación de la alta disponibilidad con los grupos de disponibilidad de SQL Server Always On que utilizan la edición Enterprise de SQL Server. Con SIOS DataKeeper, puede crear un entorno de SQL Server rentable, flexible y de alta disponibilidad que satisfaga las necesidades de su organización.

nota

Para obtener información adicional sobre las diferencias de costo entre las ediciones de SQL Server, consulte la sección Comparación de las ediciones de SQL Server de esta guía.

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una FCI de SQL Server que utiliza una solución de SAN virtual en clústeres.

La FCI de SQL Server utiliza una solución de SAN virtual agrupada en clústeres.

Grupos de disponibilidad AlwaysOn

Puede usar los grupos de disponibilidad Always On para lograr una alta disponibilidad y para fines de recuperación ante desastres. Puede lograr una alta disponibilidad implementando SQL Server en dos zonas de disponibilidad de una región. Puede lograr la recuperación ante desastres ampliando los grupos de disponibilidad a varias regiones.

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una solución basada en grupos de disponibilidad Always On. Las réplicas de la región 1 del diagrama utilizan una confirmación sincrónica, que proporciona una conmutación por error automática del grupo de disponibilidad. La réplica de la región 2 utiliza una confirmación asíncrona, que requerirá una conmutación por error manual del grupo de disponibilidad.

Arquitectura de los grupos de disponibilidad Always On

Grupos de disponibilidad distribuida

En el caso de las implementaciones de SQL Server críticas en las que no se puede comprometer la fiabilidad ni la recuperación ante desastres, recomendamos una estrategia multirregional. La distribución de los grupos de disponibilidad en varias regiones es la solución más resiliente para mantener la continuidad empresarial y minimizar el tiempo de inactividad.

Esta arquitectura aprovecha al máximo las capacidades de Amazon FSx para Windows File Server, como el almacenamiento compartido, la replicación sincrónica de los bloques y las FCI de SQL Server. Estas capacidades le permiten crear un entorno de SQL Server de alta disponibilidad que abarque varias zonas de disponibilidad. Al replicar esta configuración en otra región, obtiene un sistema completamente redundante que puede gestionar incluso las interrupciones más graves. Lo que distingue a esta solución es el nivel de flexibilidad y seguridad que ofrece. La arquitectura agnóstica al dominio de los grupos de disponibilidad distribuida permite que los servidores de clústeres de Windows subyacentes se unan a diferentes dominios de Active Directory, mientras que la autenticación basada en certificados garantiza la máxima protección para los entornos de SQL Server y proporciona estrictos requisitos de RTO y RPO para una estrategia de recuperación ante desastres multirregional. Para obtener información sobre la creación de una arquitectura multirregional, consulte Field Notes: Building a Multi-Region Architecture for SQL Server using FCI and Distributed Availability Groups en el blog de arquitectura de AWS.

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una solución multirregional que utiliza grupos de disponibilidad distribuida.

Arquitectura multirregión

Envío de registros

El envío de registros es un método probado, fiable y rentable para proteger sus bases de datos en todas las regiones en caso de que se produzca una interrupción inesperada. Las organizaciones llevan décadas usando el envío de registros para proteger sus datos.

Si implementa el envío de registros en AWS, puede lograr el RPO y el RTO en cuestión de minutos, en función de la frecuencia de las transacciones y de las tareas de envío de registros. En el improbable caso de que una región quede inaccesible, el envío de registros mantiene sus datos protegidos y recuperables.

Tenga en cuenta las siguientes ventajas adicionales de utilizar el envío de registros:

  • Reduzca los costos y cumpla con los requisitos de su empresa gracias al envío de registros para mejorar la resiliencia de la recuperación ante desastres en todas las regiones. El envío de registros reduce el costo total de propiedad, ya que solo necesita licencias de la edición Standard o Web de SQL Server.

  • Elimine los costos asociados al uso de licencias de un servidor pasivo o de recuperación ante desastres mediante el envío de registros con Software Assurance activo. Solo se necesita una licencia para su base de datos de SQL Server principal o activa cuando se utiliza el envío de registros con Software Assurance.

  • Reduzca los costos asociados al uso de licencias de SQL Server entre un 65 % y un 75 % al no tener que usar la edición Enterprise de SQL Server para configurar grupos de disponibilidad distribuida entre las regiones. Para ello, puede utilizar la edición Standard y las FCI de SQL Server junto con el envío de registros para cumplir con sus requisitos de recuperación ante desastres.

nota

Para obtener información adicional sobre las diferencias de costo entre las ediciones de SQL Server, consulte la sección Comparación de las ediciones de SQL Server de esta guía.

Para obtener más información, consulte Extend SQL Server DR using log shipping for SQL Server FCI with Amazon FSx for Windows configuration en el blog de arquitectura de AWS.

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una solución de envío de registros.

Arquitectura del envío de registros

AWS Database Migration Service

Puede usar AWS Database Migration Service (AWS DMS) para diseñar una solución de alta disponibilidad y recuperación ante desastres en función de las necesidades de su aplicación. AWS DMS le permite copiar fácilmente los datos a una base de datos secundaria de SQL Server en la misma región (alta disponibilidad) o entre regiones (recuperación ante desastres). Esta estrategia es técnicamente segura y le permite maximizar su inversión en infraestructura de AWS, así como también optimizar el uso de los recursos.

AWS DMS es un servicio rentable. Solo se le cobrarán los recursos de CPU utilizados durante el proceso de transferencia y cualquier almacenamiento de registros adicional. Esto significa que puede beneficiarse de esta solución sin incurrir en costos adicionales significativos. Puede utilizar AWS DMS para garantizar que sus datos estén disponibles y accesibles y, al mismo tiempo, minimizar los costos asociados al uso de licencias y recursos.

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una solución basada en AWS DMS.

AWS DMSArquitectura de

AWS Elastic Disaster Recovery

Algunas organizaciones deben asegurarse de que todas las aplicaciones empresariales críticas cuenten con un plan de recuperación ante desastres. En el pasado, muchas de estas organizaciones hacían grandes inversiones en las soluciones tradicionales de recuperación ante desastres, que requerían la creación previa y el mantenimiento de toda una infraestructura duplicada. Esta estrategia es costosa, laboriosa y difícil de escalar.

Ahora puede usar AWS Elastic Disaster Recovery para no tener que crear previamente una infraestructura de recuperación ante desastres. Las máquinas de recuperación ante desastres no se inician en Recuperación elástica ante desastres hasta que son necesarias, por lo que solo paga por lo que usa cuando lo necesitas. Esto significa que puede reducir considerablemente los costos asociados al uso de licencias de software y de recursos de computación de alto rendimiento.

Además, el área de almacenamiento provisional de la solución de recuperación ante desastres contiene volúmenes de Amazon Elastic Block Store (Amazon EBS) de bajo costo. Los volúmenes de EBS reducen aún más el costo de aprovisionar recursos duplicados. Esto le permite reducir los costos generales de recuperación ante desastres y, al mismo tiempo, mantener una solución de recuperación ante desastres sólida y fiable que cumpla con los requisitos de su empresa. Puede usar Recuperación elástica ante desastres para centrarse en tus actividades empresariales principales, mientras que AWS se encarga de la infraestructura subyacente de su solución de recuperación ante desastres.

En el caso de SQL Server, puede usar Recuperación elástica ante desastres como una opción rentable de recuperación ante desastres. La licencia para el nodo pasivo en una arquitectura de SQL Server altamente disponible y tolerante a errores viene incluida si utiliza y activa Software Assurance. Sin embargo, tendrá que seguir pagando los costos de procesamiento para que el servidor pasivo esté en línea. Con Recuperación elástica ante desastres, el servidor principal puede replicarse en el entorno de recuperación ante desastres sin necesidad de mantener activo Software Assurance y sin tener que pagar los costos de los recursos de computación de la recuperación ante desastres. Esta combinación de ahorros puede reducir los costos de recuperación ante desastres de SQL Server en un 50 % o más.

En el siguiente diagrama, se muestra un ejemplo de arquitectura para una solución basada en Recuperación elástica ante desastres.

Arquitectura de Recuperación elástica ante desastres

Para obtener más información, consulte How to set up high availability for SQL Server at DR site that was restored using AWS Elastic Disaster Recovery en el blog de cargas de trabajo de Microsoft en AWS.

Comparación de los costos

En la siguiente tabla se comparan los costos de las soluciones de alta disponibilidad y recuperación ante desastres que se describen en esta sección. A los efectos de esta comparación, se hacen las siguientes suposiciones:

  • Tipo de instancia: r5d.xlarge

  • Tipo de licencia: licencia incluida para Windows y SQL Server

  • Regiónus-east-1

Solución Alta disponibilidad Recuperación ante desastres Enterprise Edition Standard Edition Coste
Envío de registros No

Edición Enterprise de SQL Server: 32 674,8 USD (2 nodos)

Edición Standard de SQL Server: 14 804,4 USD (2 nodos)

Grupos de disponibilidad AlwaysOn Sí, pero grupos de disponibilidad básicos (2 nodos)

Edición Enterprise de SQL Server: 32 674,8 USD (2 nodos)

Edición Standard de SQL Server: 14 804,4 USD (2 nodos)

FCI Always On No Sí (2 nodos) Edición Standard de SQL Server: 14 804,4 USD
Grupos de disponibilidad distribuida No Edición Enterprise de SQL Server: 65 349,6 USD (4 nodos)
Elastic Disaster Recovery No

Aproximadamente 107,48 USD al mes para la replicación de 1 instancia y 1 TB de almacenamiento

Nota: Recuperación elástica ante desastres se factura por hora y por servidor de replicación. El costo es el mismo, independientemente de la cantidad de discos, el tamaño del almacenamiento, la cantidad de operaciones de simulacro o recuperación iniciadas o la región en la que se vaya a replicar.

SIOS DataKeeper

Grupos de disponibilidad Always On con Software Assurance (2 nodos, 24 núcleos): 213 480 USD

Clúster de SQL Server de 2 nodos que funciona en la edición Standard de SQL Server con SIOS DataKeeper y Software Assurance: 61 530 USD (2 nodos)

AWS DMS No 745,38 USD al mes por una instancia r5.xlarge y 1 TB de almacenamiento

Recomendaciones de optimización de costos

Le recomendamos que siga estos pasos para elegir una solución de alta disponibilidad y recuperación ante desastres que cumpla con los requisitos de su organización:

  • Consulte la sección Selección de la instancia de EC2 adecuada para las cargas de trabajo de SQL Server de esta guía.

  • Determine los requisitos de IOPS y rendimiento de sus cargas de trabajo poniendo en marcha contadores de rendimiento durante los picos de carga de trabajo:

    • IOPS = lecturas de disco/segundo + escrituras en disco/segundo

    • Rendimiento = bytes de lectura de disco/segundo + bytes de escritura en disco/segundo

  • Utilice los siguientes tipos de volúmenes de almacenamiento para mejorar el rendimiento y ahorrar costos:

    • Almacenamiento NVMe de instancias para tempdb y extensión de grupo de búferes

    • Volúmenes io2 para archivos de bases de datos

  • Use AWS Trusted Advisor para obtener recomendaciones sobre la optimización de costos para SQL Server en Amazon EC2. No tiene que instalar un agente para Trusted Advisor para realizar comprobaciones de optimización de SQL Server. Trusted Advisor inspecciona las configuraciones de las instancias de SQL Server de Amazon EC2 con licencia incluida, como las CPU virtuales (vCPU), la versión y la edición. A continuación, Trusted Advisor hace recomendaciones basadas en las prácticas recomendadas.

  • Use AWS Compute Optimizer para obtener recomendaciones de dimensionamiento correcto para Amazon EBS y las instancias de Amazon EC2.

  • Use Calculadora de precios de AWS para diseñar su estrategia de alta disponibilidad y recuperación ante desastres y hacer una previsión de los costos.

  • Para determinar si es posible pasar de la edición Enterprise de SQL Server a la edición Standard de SQL Server, utilice la vista de administración dinámica sys dm_db_persisted_sku_features para identificar las características específicas de la edición que están activas en la base de datos actual.

    nota

    Cuando se utilizan instancias de EC2 con licencia incluida, es necesario realizar migraciones paralelas para hacer cambios en la edición de SQL Server.

  • Realice simulacros de recuperación ante desastres semestrales o anuales para hacer un mejor diseño que pueda recuperar la base de datos con un RTO y un RPO definidos. Esto también puede ser útil para identificar cualquier punto débil en la arquitectura.

Recursos adicionales