Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Fundamento multirregional 1: comprender los requisitos
Como se mencionó anteriormente, la alta disponibilidad y la continuidad de las operaciones son motivos habituales para optar por arquitecturas multirregionales. Las métricas de disponibilidad miden el porcentaje de tiempo que una carga de trabajo está disponible para su uso durante un período definido, mientras que las métricas de continuidad de las operaciones miden el tiempo de recuperación para eventos a gran escala y, por lo general, de mayor duración.
Medir la disponibilidad es un proceso casi continuo. Las mediciones específicas pueden variar, pero por lo general se agrupan en torno a una métrica de disponibilidad objetivo, que en la mayoría de los casos se denomina nueves (por ejemplo, una disponibilidad del 99,99 por ciento). Con los objetivos de disponibilidad, no hay una solución única para todos. Debe establecer objetivos de disponibilidad a nivel de carga de trabajo y separar los componentes no críticos de los componentes críticos, en lugar de aplicar un objetivo único a todas las cargas de trabajo.
Para la continuidad de las operaciones, se suelen utilizar las siguientes point-in-time medidas:
-
Objetivo de tiempo de recuperación (RTO): el RTO es el retraso máximo aceptable entre la interrupción del servicio y el restablecimiento del servicio. Este valor determina un período aceptable durante el cual el servicio estará interrumpido.
-
Objetivo de punto de recuperación (RPO): el RPO es el tiempo máximo aceptable desde el último punto de recuperación de datos. Esto determina qué se considera una pérdida de datos aceptable entre el último punto de recuperación y una interrupción del servicio.
Al igual que cuando se establecen los objetivos de disponibilidad, el RTO y el RPO también deben definirse a nivel de carga de trabajo. Una continuidad de las operaciones más agresiva o una alta disponibilidad requieren una mayor inversión. Dicho esto, no todas las aplicaciones pueden exigir o requieren el mismo nivel de resiliencia. Alinear a los propietarios empresariales y de TI para evaluar la criticidad de las aplicaciones en función del impacto empresarial y, luego, organizarlas en niveles en consecuencia puede ayudar a proporcionar un punto de partida. En las siguientes tablas se proporcionan ejemplos de organización en niveles.
En esta tabla se muestra un ejemplo de organización por niveles de resiliencia para los acuerdos de nivel de servicio (). SLAs
Nivel de resiliencia | SLA de disponibilidad | Tiempo de inactividad aceptable por año |
---|---|---|
Platino |
99,99% |
52,60 minutos |
Oro |
99,90% |
8,77 horas |
Plata |
99,5% |
1,83 días |
La siguiente tabla muestra un ejemplo de estratificación de resiliencia para RTO y RPO.
Nivel de resiliencia | RTO máximo | RPO máximo | Criterios | Costo |
---|---|---|---|---|
Platino |
15 minutos |
5 minutos |
Cargas de trabajo de misión crítica |
$$$ |
Oro |
15 minutos — 6 horas |
2 horas |
Cargas de trabajo importantes pero no esenciales |
$$ |
Plata |
6 horas, unos días |
24 horas |
Cargas de trabajo no críticas |
$ |
Cuando diseñe cargas de trabajo que tengan resiliencia, tenga en cuenta la relación entre la alta disponibilidad y la continuidad de las operaciones. Por ejemplo, si una carga de trabajo requiere una disponibilidad del 99,99 por ciento, no se toleran más de 53 minutos de inactividad al año. La detección de una falla puede tardar al menos 5 minutos y un operador puede tardar otros 10 minutos en intervenir, tomar decisiones sobre los pasos de recuperación y llevarlos a cabo. No es inusual tardar entre 30 y 45 minutos en recuperarse de un solo problema. En este caso, es beneficioso contar con una estrategia multirregional para proporcionar una instancia aislada que elimine el impacto correlacionado. Esto permite continuar con las operaciones al realizar la conmutación por error dentro de un tiempo limitado y, al mismo tiempo, clasificar la avería inicial de forma independiente. Aquí es donde es necesario definir el tiempo de recuperación limitado adecuado y garantizar que haya una alineación.
Un enfoque multirregional podría ser adecuado para cargas de trabajo de misión crítica que tienen necesidades de disponibilidad extremas (por ejemplo, una disponibilidad del 99,99 por ciento o más) o para requisitos estrictos de continuidad de las operaciones que solo se pueden cumplir si se transfieren por error a otra región. Sin embargo, estos requisitos suelen aplicarse solo a un pequeño subconjunto de la cartera de cargas de trabajo de una empresa que tiene un tiempo de recuperación limitado medido en minutos u horas. A menos que una aplicación necesite un tiempo de recuperación de unos minutos o unas horas, lo mejor sería esperar a que se corrija una interrupción regional de la aplicación en la región afectada. Este enfoque suele estar alineado con las cargas de trabajo de nivel inferior.
Antes de implementar una arquitectura multirregional, los responsables de la toma de decisiones empresariales y los equipos técnicos deben tener en cuenta las implicaciones de los costos, incluidos los factores de costos operativos y de infraestructura. Una arquitectura multirregional típica puede incurrir en un costo dos veces mayor que un enfoque de una sola región. Si bien existen varios patrones multirregionales para la continuidad del negocio, como funcionar con un modo de espera en caliente, en modo de espera en caliente o con una luz piloto, el patrón con el menor riesgo de cumplir los objetivos de recuperación implicará utilizar un modo de espera activo y duplicará el coste de la carga de trabajo.
Guía clave
-
Los objetivos de disponibilidad y continuidad de las operaciones, como el RTO y el RPO, deben establecerse por carga de trabajo y alinearse con las partes interesadas de la empresa y de TI.
-
La mayoría de los objetivos de disponibilidad y continuidad de las operaciones se pueden cumplir en una sola región. En el caso de los objetivos que no se puedan cumplir dentro de una sola región, opte por la opción de multirregión con una visión clara de las ventajas y desventajas entre costo, complejidad y beneficios.