As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
O que são ambientes de serviço em AWS Batch
Um ambiente de serviço é um AWS Batch recurso que contém os parâmetros de configuração necessários para a integração AWS Batch com a SageMaker IA. Os ambientes de serviço permitem AWS Batch enviar e gerenciar trabalhos de SageMaker treinamento, ao mesmo tempo em AWS Batch que fornecem recursos de filas, agendamento e gerenciamento de prioridades.
Os ambientes de serviço abordam desafios comuns que as equipes de ciência de dados enfrentam ao gerenciar cargas de trabalho de aprendizado de máquina. As organizações geralmente limitam o número de instâncias disponíveis para modelos de treinamento para evitar gastos excessivos acidentais, atender às restrições orçamentárias, economizar custos com instâncias reservadas ou usar tipos de instância específicos para cargas de trabalho. No entanto, os cientistas de dados podem querer executar mais cargas de trabalho simultaneamente do que é possível com suas instâncias alocadas, exigindo coordenação manual para decidir quais cargas de trabalho serão executadas e quando.
Esse desafio de coordenação afeta organizações de todos os tamanhos, desde equipes com apenas alguns cientistas de dados até operações em grande escala. À medida que as organizações crescem, a complexidade aumenta, exigindo mais tempo para gerenciar a coordenação da carga de trabalho e, muitas vezes, exigindo o envolvimento do administrador da infraestrutura. Esses esforços manuais desperdiçam tempo e reduzem a eficiência das instâncias, resultando em custos reais para os clientes.
Com ambientes de serviço, cientistas de dados e engenheiros de ML podem enviar trabalhos de SageMaker treinamento com prioridades para filas configuráveis, garantindo que as cargas de trabalho sejam executadas automaticamente sem intervenção assim que os recursos estiverem disponíveis. Essa integração aproveita os amplos recursos AWS Batch de enfileiramento e agendamento, permitindo que os clientes personalizem suas políticas de filas e agendamento de acordo com as metas da organização.
Como os ambientes de serviço funcionam com outros AWS Batch componentes
Os ambientes de serviço se integram a outros AWS Batch componentes para permitir o enfileiramento de tarefas de SageMaker treinamento:
-
Filas de trabalhos - Os ambientes de serviço são associados às filas de trabalhos para permitir que a fila processe trabalhos de serviço para trabalhos de treinamento SageMaker
-
Trabalhos de serviço - Quando você envia um trabalho de serviço para uma fila associada a um ambiente de serviço, AWS Batch usa a configuração do ambiente para enviar o trabalho de SageMaker treinamento correspondente
-
Políticas de agendamento - Os ambientes de serviço trabalham com políticas AWS Batch de agendamento para priorizar e gerenciar a ordem de execução dos trabalhos de treinamento SageMaker
Essa integração permite que você aproveite os recursos maduros AWS Batch de enfileiramento e agendamento da empresa, mantendo a funcionalidade e a flexibilidade completas das tarefas de SageMaker treinamento.
Práticas recomendadas para ambientes de serviço
Os ambientes de serviço fornecem recursos para gerenciar trabalhos SageMaker de treinamento em grande escala. Seguir essas práticas recomendadas ajuda a otimizar o custo, o desempenho e a eficiência operacional, evitando problemas comuns de configuração que podem afetar seus fluxos de trabalho de aprendizado de máquina.
Ao planejar a capacidade do ambiente de serviço, considere as cotas e os limites específicos que se aplicam à fila de trabalhos de SageMaker treinamento. Cada ambiente de serviço tem um limite máximo de capacidade expresso em número de instâncias, o que controla diretamente quantas tarefas de SageMaker treinamento podem ser executadas simultaneamente. Compreender esses limites ajuda a evitar a contenção de recursos e garante tempos previsíveis de execução do trabalho.
O desempenho ideal do ambiente de serviço depende da compreensão das características exclusivas do agendamento de tarefas de SageMaker treinamento. Diferentemente dos trabalhos em contêineres tradicionais, os trabalhos de serviços passam por um SCHEDULED
estado enquanto a SageMaker IA adquire e provisiona as instâncias de treinamento necessárias. Isso significa que os horários de início do trabalho podem variar significativamente com base na disponibilidade da instância e na capacidade regional.
Importante
Os ambientes de serviço têm cotas específicas que podem afetar sua capacidade de escalar as cargas de trabalho de SageMaker treinamento. Você pode criar até 50 ambientes de serviço por conta, com cada fila de trabalhos suportando somente um ambiente de serviço associado. Além disso, a carga útil da solicitação de serviço para trabalhos individuais é limitada a 10 KiB, e a SubmitServiceJob
API está limitada a 5 transações por segundo por conta. Compreender esses limites durante o planejamento da capacidade evita restrições de escalabilidade inesperadas.
O monitoramento eficaz dos ambientes de serviço requer atenção tanto às métricas de serviço AWS Batch quanto às métricas de serviços de SageMaker IA. As transições de estado de trabalho fornecem informações valiosas sobre o desempenho do sistema, especialmente o tempo gasto no SCHEDULED
estado, o que indica padrões de disponibilidade de capacidade. Os ambientes de serviço mantêm seus próprios estados de ciclo de vida semelhantes aos ambientes computacionais, passando por, CREATING
VALID
INVALID
, e DELETING
estados que devem ser monitorados quanto à integridade operacional. Organizações com práticas de monitoramento maduras geralmente monitoram a profundidade da fila, as taxas de conclusão do trabalho e os padrões de utilização da instância para otimizar suas configurações de ambiente de serviço ao longo do tempo.