Visão geral do Flexibilidade de tipo da instância Flexibilidade da zona de disponibilidade Preço máximo do spot Rebalanceamento proativo de capacidade Comportamento do ajuste de escala Disponibilidade regional dos tipos de instância Recursos relacionados Limitações

Visão geral da configuração para criar um grupo de instâncias mistas

Este tópico fornece uma visão geral e as melhores práticas para criar um grupo de instâncias mistas.

Conteúdo

Visão geral do
Flexibilidade de tipo da instância
Flexibilidade da zona de disponibilidade
Preço máximo do spot
Rebalanceamento proativo de capacidade
Comportamento do ajuste de escala
Disponibilidade regional dos tipos de instância
Recursos relacionados
Limitações

Visão geral do

Para criar um grupo de instâncias mistas, você tem duas opções:

Seleção de tipo de instância com base em atributos — Defina seus requisitos de computação para escolher seus tipos de instância automaticamente com base em seus atributos de instância específicos.
Seleção manual do tipo de instância — Escolha manualmente os tipos de instância adequados ao seu workload.

Manual selection

As etapas a seguir descrevem como criar um grupo de instâncias mistas escolhendo manualmente os tipos de instância:

Escolha um modelo de execução que tenha os parâmetros para iniciar uma EC2 instância. Os parâmetros nos modelos de execução são opcionais, mas o Amazon EC2 Auto Scaling não pode iniciar uma instância se o ID amilong; (AMI) estiver ausente do modelo de execução.
Escolha a opção de substituir o modelo de execução.
Escolha manualmente os tipos de instância adequados ao seu workload.
Especifique as porcentagens de instâncias sob demanda e de instâncias spot a serem iniciadas.
Escolha estratégias de alocação que determinem como o Amazon EC2 Auto Scaling atende às suas capacidades sob demanda e spot a partir dos tipos de instância possíveis.
Escolha as zonas de disponibilidade e sub-redes VPC nas quais iniciar suas instâncias.
Especifique o tamanho inicial do grupo (a capacidade desejada) e o tamanho mínimo e máximo do grupo.

As substituições são necessárias para substituir o tipo de instância declarado no modelo de execução e usar vários tipos de instâncias incorporados na própria definição de recursos do grupo do Auto Scaling. Para obter mais informações sobre os tipos de instância disponíveis, consulte Tipos de instância no Guia do EC2 usuário da Amazon.

Você também pode configurar os seguintes parâmetros opcionais para cada tipo de instância:

LaunchTemplateSpecification — Você pode atribuir um modelo de execução diferente a um tipo de instância, conforme necessário. Essa opção não está disponível atualmente no console. Para obter mais informações, consulte Usar vários modelos de execução.
WeightedCapacity — Você decide o quanto a instância conta para a capacidade desejada em relação ao resto das instâncias do seu grupo. Se você especificar um valor WeightedCapacity para um tipo de instância, deverá especificar um valor WeightedCapacity para todos os tipos. Por padrão, cada instância conta como uma para a capacidade desejada. Para obter mais informações, consulte Configurar um grupo do Auto Scaling para usar ponderação da instância.

Attribute-based selection

Para permitir que o Amazon EC2 Auto Scaling escolha seus tipos de instância automaticamente com base em seus atributos de instância específicos, use as etapas a seguir para criar um grupo misto de instâncias especificando seus requisitos computacionais:

Escolha um modelo de execução que tenha os parâmetros para iniciar uma EC2 instância. Os parâmetros nos modelos de execução são opcionais, mas o Amazon EC2 Auto Scaling não pode iniciar uma instância se o ID amilong; (AMI) estiver ausente do modelo de execução.
Escolha a opção de substituir o modelo de execução.
Especifique os atributos da instância que correspondam aos seus requisitos de computação, como v CPUs e requisitos de memória.
Especifique as porcentagens de instâncias sob demanda e de instâncias spot a serem iniciadas.
Escolha estratégias de alocação que determinem como o Amazon EC2 Auto Scaling atende às suas capacidades sob demanda e spot a partir dos tipos de instância possíveis.
Escolha as zonas de disponibilidade e sub-redes VPC nas quais iniciar suas instâncias.
Especifique o tamanho inicial do grupo (a capacidade desejada) e o tamanho mínimo e máximo do grupo.

As substituições são necessárias para substituir o tipo de instância declarado no modelo de execução e usar um conjunto de atributos de instância que descrevam seus requisitos de computação. Para ver os atributos compatíveis, consulte InstanceRequirementsa Amazon EC2 Auto Scaling API Reference. Como alternativa, é possível usar um modelo de execução que já tenha sua definição de atributos de instância.

Você também pode configurar o parâmetro LaunchTemplateSpecification na estrutura de substituições para atribuir um modelo de execução diferente a um conjunto de requisitos de instância, conforme necessário. Essa opção não está disponível atualmente no console. Para obter mais informações, consulte LaunchTemplateOverridesa Amazon EC2 Auto Scaling API Reference.

Por padrão, você definiu o número de instâncias como da capacidade desejada do seu grupo do Auto Scaling.

Como alternativa, você pode definir o valor da capacidade desejada como o número de v CPUs ou a quantidade de memória. Para fazer isso, use a propriedade DesiredCapacityType na operação da API CreateAutoScalingGroup ou o campo suspenso Tipo de capacidade desejada no Console de gerenciamento da AWS. Essa é uma alternativa útil aos pesos de instância.

Flexibilidade de tipo da instância

Para aumentar a disponibilidade, implemente sua aplicação em vários tipos de instância. É uma prática recomendada usar vários tipos de instância para atender aos requisitos de capacidade. Dessa forma, o Amazon EC2 Auto Scaling pode iniciar outro tipo de instância se não houver capacidade de instância suficiente nas zonas de disponibilidade escolhidas.

Se não houver capacidade suficiente de instâncias com instâncias spot, o Amazon EC2 Auto Scaling continua tentando iniciar a partir de outros pools de instâncias spot. (Os pools usados são determinados por sua escolha de tipos de instância e estratégia de alocação.) O Amazon EC2 Auto Scaling ajuda você a aproveitar a economia de custos das instâncias spot lançando-as em vez de instâncias sob demanda.

Recomendamos ser flexível para pelo menos 10 tipos de instância para cada workload. Ao escolher seus tipos de instância, não se limite aos novos tipos de instância mais usados. Escolher tipos de instância de gerações mais antigas tende a resultar em menos interrupções spot, pois há menos demanda de clientes sob demanda.

Flexibilidade da zona de disponibilidade

Recomendamos fortemente que estenda seu grupo do Auto Scaling em várias zonas de disponibilidade. Com várias zonas de disponibilidade, você pode criar aplicações que executam o failover automaticamente entre as zonas para obter maior resiliência.

Como benefício adicional, você pode acessar um pool de EC2 capacidade mais profundo da Amazon em comparação com grupos em uma única zona de disponibilidade. Como a capacidade oscila independentemente para cada tipo de instância na zona de disponibilidade, é frequentemente possível obter maior capacidade computacional quando você tem tanto a flexibilidade de tipo de instância quanto da zona de disponibilidade.

Para ter mais informações sobre como usar várias Zonas de disponibilidade, consulte Exemplo: distribuir instâncias entre zonas de disponibilidade.

Preço máximo do spot

Ao criar seu grupo de Auto Scaling usando o AWS CLI ou um SDK, você pode especificar o parâmetro. SpotMaxPrice O parâmetro SpotMaxPrice determina o preço máximo que você está disposto a pagar por uma hora de instância spot.

Quando você especifica o parâmetro WeightedCapacity em suas substituições (ou "DesiredCapacityType": "vcpu" ou "DesiredCapacityType": "memory-mib" no nível do grupo), o preço máximo representa o preço unitário máximo, não o preço máximo de uma instância inteira.

É altamente recomendável que você não especifique um preço máximo. Talvez sua aplicação não seja executada se você não receber suas instâncias spot, como quando o preço máximo é muito baixo. Se você não especificar um preço máximo, o padrão será o preço sob demanda. Você pagará apenas o preço spot pelas instâncias spot que iniciar. Você ainda recebe os grandes descontos oferecidos pelas Instâncias spot. Esses descontos são possíveis devido ao preço spot estável disponível com o modelo de preço spot. Para obter mais informações, consulte Preços e descontos no Guia do EC2 usuário da Amazon.

Rebalanceamento proativo de capacidade

Se o seu caso de uso permitir, recomendamos o rebalanceamento de capacidade. O rebalanceamento de capacidade ajuda você a manter a disponibilidade da workload ao substituir proativamente as instâncias spot com risco de interrupção.

Quando o rebalanceamento de capacidade está ativado, o Amazon Auto EC2 Scaling tenta substituir proativamente as instâncias spot que receberam EC2 uma recomendação de rebalanceamento de instâncias. É possível decidir rebalancear sua workload em instâncias spot novas ou existentes que não tenham um risco elevado de interrupção.

Para obter mais informações, consulte Rebalanceamento de capacidade no Auto Scaling para substituir instâncias spot em risco.

Comportamento do ajuste de escala

Quando você cria um grupo misto de instâncias, ele usa instâncias sob demanda por padrão. Para usar as instâncias spot, é necessário modificar a porcentagem do grupo a ser iniciada como instâncias sob demanda. Você pode especificar qualquer número de 0 a 100 para a porcentagem sob demanda.

Opcionalmente, você também pode designar um número base de instâncias sob demanda para começar. Se você fizer isso, o Amazon EC2 Auto Scaling espera para lançar instâncias spot até depois de lançar a capacidade básica das instâncias sob demanda, quando o grupo se expande. Depois de ultrapassada a capacidade básica, é usada a porcentagem sob demanda para determinar o número de instâncias spot e sob demanda que serão executadas.

O Amazon EC2 Auto Scaling converte a porcentagem no número equivalente de instâncias. Se o resultado criar um número fracionário, ele arredonda para o próximo inteiro em favor das instâncias sob demanda.

A tabela a seguir demonstra o comportamento do grupo do Auto Scaling à medida que aumenta e diminui de tamanho.

Exemplo: comportamento de escalabilidade
Opções de compra	Tamanho de grupo e número total de instâncias em execução nas opções de compra
	10	20	30	40
Exemplo 1: base de 10, 50/50% sob demanda/spot
Instâncias sob demanda (valor base)	10	10	10	10
Instâncias sob demanda	0	5	10	15
Instâncias spot	0	5	10	15
Exemplo 2: base de 0, 0/100% sob demanda/spot
Instâncias sob demanda (valor base)	0	0	0	0
Instâncias sob demanda	0	0	0	0
Instâncias spot	10	20	30	40
Exemplo 3: base de 0, 60/40% sob demanda/spot
Instâncias sob demanda (valor base)	0	0	0	0
Instâncias sob demanda	6	12	18	24
Instâncias spot	4	8	12	16
Exemplo 4: base de 0, 100/0% sob demanda/spot
Instâncias sob demanda (valor base)	0	0	0	0
Instâncias sob demanda	10	20	30	40
Instâncias spot	0	0	0	0
Exemplo 5: base de 12, 0/100% sob demanda/spot
Instâncias sob demanda (valor base)	10	12	12	12
Instâncias sob demanda	0	0	0	0
Instâncias spot	0	8	18	28

Quando o tamanho do grupo aumenta, o Amazon EC2 Auto Scaling tenta equilibrar sua capacidade uniformemente nas zonas de disponibilidade especificadas. Em seguida, ele inicia os tipos de instância de acordo com a estratégia de alocação especificada.

Quando o tamanho do grupo diminui, o Amazon EC2 Auto Scaling primeiro identifica qual dos dois tipos (spot ou sob demanda) deve ser encerrado. Em seguida, ele tenta encerrar as instâncias de forma balanceada nas zonas de disponibilidade especificadas. Também favorece o encerramento de instâncias de uma forma que se alinhe mais às suas estratégias de alocação. Para obter mais informações sobre políticas de encerramento, consulte Configurar políticas de rescisão para o Amazon EC2 Auto Scaling.

Disponibilidade regional dos tipos de instância

A disponibilidade dos tipos de EC2 instância varia de acordo com sua Região da AWS. Por exemplo, os tipos de instância de geração mais recente podem ainda não estar disponíveis em uma determinada região. Devido às variações na disponibilidade de instâncias entre regiões, você pode encontrar problemas ao fazer solicitações programáticas se vários tipos de instância em suas substituições não estiverem disponíveis em sua região. Usar vários tipos de instância que não estão disponíveis na sua região pode fazer com que a solicitação falhe completamente. Para resolver o problema, repita a solicitação com diferentes tipos de instância, certificando-se de que cada tipo de instância esteja disponível na região. Para pesquisar os tipos de instância oferecidos por localização, use o describe-instance-type-offeringscomando. Para obter mais informações, consulte Como encontrar um tipo de EC2 instância da Amazon no Guia EC2 do usuário da Amazon.

Para obter mais práticas recomendadas para instâncias spot, consulte Melhores práticas para EC2 Spot no Guia EC2 do usuário da Amazon.

Limitações

Depois de adicionar substituições a um grupo do Auto Scaling usando uma política de instâncias mistas, você pode atualizar as substituições com a UpdateAutoScalingGroupchamada de API, mas não excluí-las. Para remover completamente as substituições, é necessário primeiro mudar o grupo do Auto Scaling para usar um modelo de execução ou uma configuração de execução em vez de uma política de instâncias mistas. Em seguida, você pode adicionar uma política de instâncias mistas novamente sem nenhuma substituição.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Usar vários tipos de instâncias e opções de compra

Estratégias de alocação para vários tipos de instância