As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Componentes do AWS Batch
O AWS Batch simplifica a execução de trabalhos em lote em várias zonas de disponibilidade dentro de uma região. Você pode criar ambientes computacionais do AWS Batch em uma VPC nova ou existente. Depois que um ambiente computacional estiver ativo e associado a uma fila de trabalho, você poderá fazer as definições de trabalho que especificam quais imagens de contêineres do Docker executarão seus trabalhos. As imagens de contêiner são armazenadas em registros de contêiner e extraídas deles, que podem existir dentro ou fora de sua infraestrutura da AWS.
Ambiente computacional
Um ambiente computacional é um conjunto de recursos computacionais gerenciados ou não gerenciados que são usados para executar trabalhos. Com ambientes de computação gerenciados, você pode especificar o tipo de computação desejado (Fargate ou EC2) em vários níveis de detalhe. Você pode configurar ambientes computacionais que usem um determinado tipo de instância EC2, um modelo específico, como c5.2xlarge ou m5.10xlarge. Ou você pode optar apenas por especificar que deseja usar os tipos de instância mais recentes. Também é possível especificar os números mínimo, desejado e máximo de vCPUs para o ambiente com a quantia que você está disposto a pagar por uma instância spot como uma porcentagem do preço da instância sob demanda e um conjunto de destino de sub-redes da VPC. O AWS Batch inicia, gerencia e encerra com eficiência os tipos de computação conforme necessário. Você também pode gerenciar seus próprios ambientes computacionais. Nesse caso, você é responsável por configurar e escalar as instâncias em um cluster do Amazon ECS que o AWS Batch cria para você. Para obter mais informações, consulte Ambientes computacionais para AWS Batch.
Filas de tarefas
Quando enviar um trabalho do AWS Batch, você o enviará para uma fila de trabalho específica, onde ele fica até que seja programado em um ambiente computacional. Você pode associar um ou mais ambientes de computação a uma fila de trabalhos. Você também pode atribuir valores de prioridade para esses ambientes de computação e até mesmo para as próprias filas de trabalhos. Por exemplo, você pode ter uma fila de alta prioridade à qual você envia trabalhos urgentes e uma fila de baixa prioridade para trabalhos que podem ser executados a qualquer momento quando os recursos computacionais forem mais baratos. Para obter mais informações, consulte Filas de tarefas.
Definições de trabalho
As definições de trabalhos especificam como os trabalhos devem ser executados. Você pode pensar em uma definição de trabalho como um esquema para os recursos em seu trabalho. Você pode fornecer ao seu trabalho um perfil do IAM para fornecer acesso a outros recursos da AWS. Você também especifica os requisitos de memória e CPU. A definição de trabalho também pode controlar as propriedades do contêiner, as variáveis de ambiente e pontos de montagem para armazenamento persistente. Muitas das especificações em uma definição de trabalho podem ser substituídas especificando-se novos valores ao enviar trabalhos individuais. Para obter mais informações, consulte Definições de trabalho
Tarefas
Uma unidade de trabalho (como um script de shell, um executável do Linux ou uma imagem de contêiner do Docker) que você envia para o AWS Batch. Ela tem um nome e é executada como um aplicativo em contêineres no AWS Fargate ou em recursos do Amazon EC2 no seu ambiente de computação usando parâmetros que você especifica em uma definição de trabalho. Os trabalhos podem fazer referência a outros trabalhos por nome ou por ID e podem ser dependentes da conclusão bem-sucedida de outros trabalhos ou da disponibilidade dos recursos que você especificar. Para obter mais informações, consulte Tarefas.
Política de agendamento
Você pode usar políticas de agendamento para configurar como os recursos de computação em uma fila de trabalhos serão alocados entre usuários ou workloads. Usando políticas de agendamento de compartilhamento justo, você pode atribuir diferentes identificadores de compartilhamento a workloads ou usuários. O agendador de trabalhos AWS Batch usará como padrão uma estratégia FIFO (por ordem de entrada). Para obter mais informações, consulte Políticas de agendamento de compartilhamento justo.
Recursos consumíveis
Um recurso consumível é um recurso necessário para executar seus trabalhos, como um token de licença de terceiros, largura de banda de acesso ao banco de dados, a necessidade de chamadas de controle de utilização para uma API de terceiros e assim por diante. Você especifica os recursos consumíveis necessários para a execução de um trabalho e o Batch leva essas dependências de recursos em consideração ao agendar um trabalho. Você pode reduzir a subutilização dos recursos computacionais alocando somente os trabalhos que têm todos os recursos necessários disponíveis. Para obter mais informações, consulte Agendamento com reconhecimento de recurso .
Ambiente de serviço
Um ambiente de serviço define como o AWS Batch se integra ao SageMaker para execução de trabalhos. Os ambientes de serviço permitem ao AWS Batch enviar e gerenciar trabalhos no SageMaker, ao mesmo tempo em que fornecem os recursos de enfileiramento, agendamento e gerenciamento de prioridades do AWS Batch. Os ambientes de serviço definem limites de capacidade para tipos de serviços específicos, como trabalhos do SageMaker Training. Os limites de capacidade controlam o máximo de recursos que podem ser usados por trabalhos de serviço no ambiente. Para obter mais informações, consulte Ambientes de serviço para AWS Batch.
Trabalhos de serviço
Um trabalho de serviço é uma unidade de trabalho que você envia ao AWS Batch para execução em um ambiente de serviço. Os trabalhos de serviço utilizam os recursos de enfileiramento e agendamento AWS Batch enquanto delegam a execução real ao serviço externo. Por exemplo, trabalhos do SageMaker Training enviados como trabalhos de serviço são colocados em fila e priorizados pelo AWS Batch, mas a execução do trabalho do SageMaker Training ocorre dentro da infraestrutura do SageMaker AI. Essa integração permite que cientistas de dados e engenheiros de ML se beneficiem do gerenciamento automatizado de workload do AWS Batch e do enfileiramento prioritário para seus workloads do SageMaker AI Training. Os trabalhos de serviço podem referenciar outros trabalhos por nome ou ID e dar suporte às dependências do trabalho. Para obter mais informações, consulte Empregos de serviços em AWS Batch.