Administración de instancias bajo demanda e instancias de spot
Puede lanzar y escalar automáticamente una flota de instancias en diferido e instancias de spot en un solo grupo de Auto Scaling. Las siguientes opciones se pueden usar en conjunto para configurar la forma en que el servicio de escalado automático administra las instancias de spot y las instancias bajo demanda en su entorno.
Puede configurar estas opciones en su entorno mediante la consola de Elastic Beanstalk, las opciones de la configuración del espacio de nombres, la AWS CLI o la CLI de EB.
Estas opciones forman parte del espacio de nombres aws:ec2:instances:
-
EnableSpot: si se establece comotrue, esta configuración habilita las solicitudes de las instancias de spot para el entorno. -
SpotFleetOnDemandBase: establece el número mínimo de instancias bajo demanda que el grupo de escalado automático aprovisiona antes de considerar la posibilidad de utilizar instancias de spot cuando se amplía el entorno. -
SpotFleetOnDemandAboveBasePercentage: porcentaje de instancias bajo demanda que forman parte de la capacidad adicional que el grupo de escalado automático aprovisiona después de las instancias deSpotOnDemandBase.
Las opciones de la lista anterior se correlacionan con las siguientes opciones del espacio de nombres aws:autoscaling:asg:
-
MinSize: el número mínimo de instancias que desea en el grupo de escalado automático. -
MaxSize: el número máximo de instancias que desea en el grupo de escalado automático.
importante
La configuración opcional de EnableSpot puede provocar que Elastic Beanstalk cree un entorno con una plantilla de lanzamiento o actualice un entorno existente de configuraciones de lanzamiento a plantillas de lanzamiento. Para ello, se requieren los permisos necesarios para administrar las plantillas de lanzamiento. Estos permisos están incluidos en nuestra política administrada. Si utiliza políticas personalizadas en lugar de nuestras políticas administradas, es posible que no se pueda crear el entorno o que fallen las actualizaciones cuando se actualice la configuración del entorno. Para obtener más información y conocer otras consideraciones, consulte Migración del entorno de Elastic Beanstalk para lanzar plantillas .
Aplicación de ambos conjuntos de opciones de espacio de nombres
En los siguientes puntos se describe cómo la combinación de estas opciones de configuración afecta el escalado del entorno.
-
Solo
MinSizedetermina la capacidad inicial del entorno: el número de instancias que debe ejecutar como mínimo. -
SpotFleetOnDemandBaseno afecta a la capacidad inicial. Si se habilita spot, esta opción solamente determina cuántas instancias bajo demanda se aprovisionan antes de que se considere la posibilidad de utilizar instancias de spot. -
Tenga en cuenta cuándo
SpotFleetOnDemandBasees menor queMinSize. Obtendrá exactamenteMinSizeinstancias como capacidad inicial. Como mínimoSpotFleetOnDemandBasedeben ser instancias en diferido. -
Tenga en cuenta cuándo
SpotFleetOnDemandBasees mayor queMinSize. A medida que el entorno escale de forma horizontal, tendrá la seguridad de obtener al menos una cantidad de instancias adicionales igual a la diferencia entre los dos valores. En otras palabras, se garantiza que obtendrá al menos(SpotFleetOnDemandBase - MinSize)instancias adicionales que son en diferido antes de cumplir con el requisito deSpotFleetOnDemandBase.
Entornos de una sola instancia
En entornos de producción, las instancias de spot resultan particularmente útiles en un entorno escalable con equilibrio de carga. No es conveniente utilizar Spot en un entorno con una única instancia. Si no hay instancias de spot disponibles, podría perder toda la capacidad del entorno (una sola instancia). Es posible que desee utilizar una instancia de spot en un entorno con una sola instancia para realizar el desarrollo o las pruebas. Si lo hace, asegúrese de establecer SpotFleetOnDemandBase y SpotFleetOnDemandAboveBasePercentage en cero. Cualquier otra configuración dará como resultado una instancia en diferido.
Ejemplos de configuración de opciones de escalado
En los siguientes ejemplos, se muestran diversos escenarios de configuración con distintas opciones de escala. En todos los ejemplos, se presupone que se está utilizando un entorno con balanceo de carga y que las solicitudes de instancias de spot están habilitadas.
ejemplo 1: Instancias en diferido y de spot como parte de la capacidad inicial
| Opción | Espacio de nombres | Valor |
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
En este ejemplo, el entorno comienza con diez instancias, de las cuales siete son en diferido (cuatro base y el 50 % de las seis que están por encima de la base), mientras que tres son de spot. El entorno puede escalar horizontalmente hasta un máximo de 24 instancias. A medida que se amplía, la parte en diferido de la flota que está por encima de las cuatro instancias base en diferido se mantiene en el 50 %, hasta un máximo total de 24 instancias, de las cuales 14 son en diferido (cuatro base y el 50 % de las 20 que están por encima de la base) y 10 son de spot.
ejemplo 2: Toda la capacidad inicial la conforman instancias en diferido
| Opción | Espacio de nombres | Valor |
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
En este ejemplo, el entorno comienza con cuatro instancias, todas ellas en diferido. El entorno puede ampliarse hasta un máximo de 24 instancias. A medida que se amplía, la parte en diferido de la flota que está por encima de las cuatro instancias base en diferido se mantiene en el 50 %, hasta un máximo total de 24 instancias, de las cuales 14 son en diferido (cuatro base y el 50 % de las 20 que están por encima de la base) y 10 son de spot.
ejemplo 3: Base en diferido adicional que supera la capacidad inicial
| Opción | Espacio de nombres | Valor |
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
En este ejemplo, el entorno comienza con tres instancias, todas ellas en diferido. El entorno puede escalar horizontalmente hasta un máximo de 24 instancias. La primera instancia adicional por encima de las tres iniciales es una instancia en diferido y completa las cuatro instancias base en diferido. A medida que sigue ampliándose, la parte en diferido de la flota que está por encima de las cuatro instancias base en diferido se mantiene en el 50 %, hasta un máximo total de 24 instancias, de las cuales 14 son en diferido (cuatro base y el 50 % de las 20 que están por encima de la base), mientras que diez son instancias de spot.