Implementación de una carga de trabajo - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Implementación de una carga de trabajo

Los siguientes ejemplos demuestran cómo el HyperPod escalado automático con Karpenter aprovisiona automáticamente los nodos en respuesta a las demandas de carga de trabajo. En estos ejemplos se muestra el comportamiento de escalado básico y los patrones de distribución de múltiples zonas de disponibilidad.

Implementación de una sola carga de trabajo
  1. La siguiente implementación de Kubernetes incluye pods que solicitan 1 CPU y 256 M de memoria por réplica o pod. En este escenario, los pods aún no se han creado.

    kubectl apply -f https://raw.githubusercontent.com/aws/karpenter-provider-aws/refs/heads/main/examples/workloads/inflate.yaml
  2. Para probar el proceso de escalado vertical, ejecute el siguiente comando. Karpenter agregará nuevos nodos al clúster.

    kubectl scale deployment inflate --replicas 10
  3. Para probar el proceso de reducción vertical, ejecute el siguiente comando. Karpenter eliminará los nodos del clúster.

    kubectl scale deployment inflate --replicas 0
Implemente una carga de trabajo en varios AZs
  1. Ejecute el siguiente comando para implementar una carga de trabajo que lance una implementación de Kubernetes, en la que los pods implementados deben distribuirse de manera uniforme entre las diferentes zonas de disponibilidad con un desfase máximo de 1.

    kubectl apply -f https://raw.githubusercontent.com/aws/karpenter-provider-aws/refs/heads/main/examples/workloads/spread-zone.yaml
  2. Ejecute el siguiente comando para ajustar el número de pods:

    kubectl scale deployment zone-spread --replicas 15

    Karpenter agregará nuevos nodos al clúster con al menos un nodo en una zona de disponibilidad diferente.

Para ver más ejemplos, consulta los ejemplos de cargas de trabajo de Karpenter en. GitHub