

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Reservas de capacidad en AWS PCS
<a name="working-with_capacity-reservations"></a>

 Puede reservar la EC2 capacidad de Amazon en una zona de disponibilidad específica y durante un período específico mediante reservas de capacidad bajo demanda o bloques de EC2 capacidad de Amazon para aprendizaje automático para asegurarse de que tiene la capacidad informática necesaria disponible cuando la necesite. 

 **Las reservas de capacidad bajo demanda (ODCRs)** le permiten reservar capacidad de cómputo para sus EC2 instancias de Amazon en una zona de disponibilidad específica durante cualquier período. Puede crear y cancelar reservas en cualquier momento, sin compromisos a largo plazo ni pagos por adelantado. ODCRs son ideales cuando necesita reservas de capacidad flexibles que pueda modificar a medida que cambien sus requisitos. Para obtener más información, consulte [Reservas de capacidad bajo demanda](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-capacity-reservations.html) en la *Guía del usuario de Amazon Elastic Compute Cloud*. 

 **Amazon EC2 Capacity Blocks for ML** le permite reservar instancias de computación acelerada basadas en GPU para usarlas en el futuro, con hasta 8 semanas de antelación. Puede reservar bloques de 1 a 64 instancias con una duración de 1 día a 6 meses. Los bloques de capacidad son ideales para las cargas de trabajo de aprendizaje automático que requieren un acceso garantizado a la capacidad de la GPU en momentos específicos. Para obtener más información, consulte [Capacity Blocks for ML](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-capacity-blocks.html) en la *Guía del usuario de Amazon Elastic Compute Cloud*. 

**Topics**
+ [

# Uso ODCRs con AWS PCS
](capacity-reservations-odcr.md)
+ [

# Uso de bloques de capacidad de Amazon EC2 para aprendizaje automático con PCS AWS
](capacity-blocks.md)

# Uso ODCRs con AWS PCS
<a name="capacity-reservations-odcr"></a>

 Puede elegir la forma en que AWS PCS consume las instancias reservadas. Si crea una ODCR **abierta**, cualquier instancia coincidente lanzada por AWS PCS u otros procesos de su cuenta se descontará de la reserva. Con una ODCR **segmentada**, solo las instancias lanzadas con el identificador de reserva específico se tienen en cuenta para la reserva. En el caso de las cargas de trabajo urgentes, las segmentadas ODCRs son más habituales. 

 Puede configurar un grupo de nodos de cómputo de AWS PCS para que utilice un ODCR de destino agregándolo a una plantilla de lanzamiento. Estos son los pasos para hacerlo: 

1.  Cree una reserva de capacidad bajo demanda (ODCR) específica mediante la Guía del usuario [para crear una reserva de capacidad de Amazon EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/capacity-reservations-create.html). 

1.  Asocie la ODCR a una plantilla de lanzamiento. Hay dos maneras de hacerlo: 

   1.  **Asociación directa de ODCR: haga** referencia al ID de ODCR directamente en la plantilla de lanzamiento. Este enfoque proporciona un control estricto de la capacidad y no admite la reposición de instancias (si el grupo de nodos de procesamiento solicita más instancias de las disponibles en la ODCR, no se lanzará ninguna instancia adicional). 

   1.  **Asociación de grupos de reserva de capacidad:** añada el ODCR a un grupo de reserva de capacidad y haga referencia al grupo en la plantilla de lanzamiento. Este enfoque permite la reposición de instancias, lo que permite a AWS PCS lanzar instancias adicionales bajo demanda si se supera la capacidad de reserva. 

1.  Cree o actualice un grupo de nodos de cómputo de AWS PCS para usar la plantilla de lanzamiento. Para obtener más información, consulte la [Guía del usuario de los grupos de nodos de cómputo de AWS PCS](https://docs.aws.amazon.com/pcs/latest/userguide/working-with_cng.html). 

   1. Establezca el grupo `purchaseOption` de nodos de cómputo en`ONDEMAND`.

## Ejemplo: reserve y use instancias hpc6a.48xlarge con un ODCR de destino
<a name="capacity-reservations-odcr-example"></a>

 Este comando de ejemplo crea un ODCR de destino para 32 instancias de hpc6a.48xlarge. Para lanzar las instancias reservadas en un grupo de ubicación, agréguelas al comando. `--placement-group-arn` Puede definir una fecha de finalización con `--end-date` y`--end-date-type`, de lo contrario, la reserva continuará hasta que se finalice manualmente. 

```
aws ec2 create-capacity-reservation \
    --instance-type hpc6a.48xlarge \
    --instance-platform Linux/UNIX \
    --availability-zone us-east-2a \
    --instance-count 32 \
    --instance-match-criteria targeted
```

 El resultado de este comando será un ARN para el nuevo ODCR. El ID de ODCR se puede recuperar del `"arn:aws:ec2:us-east-2:123456789012:capacity-reservation/ODCR-ID"` ARN o mediante Amazon [EC2](https://docs.aws.amazon.com/AWSEC2/latest/APIReference/API_DescribeCapacityReservations.html). DescribeCapacityReservations 

 **Asociación ODCR directa:** añada el ID de ODCR a la plantilla de lanzamiento. A continuación, se muestra un ejemplo de plantilla de lanzamiento que hace referencia al ID de la ODCR. 

```
{
  "CapacityReservationSpecification": {
    "CapacityReservationTarget": {
      "CapacityReservationId": "cr-1234567890abcdef1"
    }
  }
}
```

 **Asociación de grupos de reserva de capacidad:** cree un grupo de reserva de capacidad y añada el grupo a la plantilla de lanzamiento. El siguiente comando crea un grupo de reserva de capacidad denominado`EXAMPLE-CR-GROUP`. 

```
aws resource-groups create-group \
    --name EXAMPLE-CR-GROUP \
    --configuration \
        '{"Type": "AWS::EC2::CapacityReservationPool"}' \
        '{"Type": "AWS::ResourceGroups::Generic", "Parameters": [{"Name": "allowed-resource-types", "Values": ["AWS::EC2::CapacityReservation"]}]}'
```

 El siguiente comando agrega el ODCR al grupo de reserva de capacidad. 

```
aws resource-groups group-resources --group EXAMPLE-CR-GROUP \
    --resource-arns arn:aws:ec2:us-east-2:123456789012:capacity-reservation/cr-1234567890abcdef1
```

 Con el ODCR creado y agregado a un grupo de reserva de capacidad, ahora se puede conectar a un grupo de nodos de cómputo del AWS PCS agregándolo a una plantilla de lanzamiento. A continuación, se muestra un ejemplo de plantilla de lanzamiento que hace referencia al grupo de reserva de capacidad. 

```
{
  "CapacityReservationSpecification": {
    "CapacityReservationResourceGroupArn": "arn:aws:resource-groups:us-east-2:123456789012:group/EXAMPLE-CR-GROUP"
  }
}
```

 Por último, cree o actualice un grupo de nodos de cómputo de AWS PCS para utilizar instancias hpc6a.48xlarge y utilice la plantilla de lanzamiento que hace referencia a la ODCR. Para un grupo de nodos estático, defina las instancias mínimas y máximas según el tamaño de la reserva (32). Para un grupo de nodos dinámico, establece el número mínimo de instancias en 0 y el máximo en el tamaño de instancia deseado. 

 Este ejemplo es una implementación simple de un ODCR único que se aprovisiona para un grupo de nodos de cómputo. Sin embargo, AWS PCS admite muchos otros diseños. Por ejemplo, puede subdividir un grupo grande de ODCR o de reserva de capacidad entre varios grupos de nodos de cómputo. O bien, puede usar la ODCRs que otra cuenta de AWS haya creado y compartido con la suya. 

 Para obtener más información, consulte [Reservas de capacidad bajo demanda y bloques de capacidad para aprendizaje automático](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/capacity-reservation-overview.html) en la *Guía del usuario de Amazon Elastic Compute Cloud*. 

# Uso de bloques de capacidad de Amazon EC2 para aprendizaje automático con PCS AWS
<a name="capacity-blocks"></a>

Amazon EC2 Capacity Blocks for ML es una opción de compra de Amazon EC2 que le permite pagar por adelantado la reserva de instancias de computación acelerada basadas en GPU dentro de un intervalo de fechas y horas específico para soportar cargas de trabajo de corta duración. Las instancias que se ejecutan dentro de un bloque de capacidad se colocan automáticamente juntas dentro de Amazon EC2 UltraClusters, para una red de baja latencia, escala de petabits y sin bloqueos. Para obtener más información, consulte [Capacity Blocks for ML](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-capacity-blocks.html) en la *Guía del usuario de Amazon Elastic Compute Cloud*.

Puede usar una plantilla de lanzamiento para que AWS PCS utilice un bloque de capacidad cuando lance instancias para un grupo de nodos de cómputo.

**nota**  
AWS PCS introdujo la compatibilidad con los bloques de capacidad desde la versión 24.05 de Slurm.

## Limitaciones
<a name="capacity-blocks-limitations"></a>
+ AWS PCS solo admite bloques de capacidad con las familias de instancias P5en, P5e, P5 y P4d.
+ Solo puede asociar un grupo de nodos de cómputo a un bloque de capacidad a la vez.
+ No puede asociar un grupo de nodos de cómputo a un grupo de reserva de capacidad que combine varios bloques de capacidad.
+ Los bloques de capacidad deben estar en un `active` estado `scheduled` o estado para poder usarse con AWS PCS. No puedes usar bloques de capacidad en otros estados, como`payment-failed`. Para obtener más información, consulte [Ver bloques de capacidad](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/capacity-blocks-view.html) en la *Guía del usuario de Amazon Elastic Compute Cloud*.

## Caducidad del bloque de capacidad
<a name="capacity-blocks-expiration"></a>

Los bloques de capacidad están limitados a un intervalo de fecha y hora específicos. Cuando caduca un bloque de capacidad:
+ El grupo de nodos de cómputo asociado a ese bloque de capacidad sigue existiendo y sigue asociado a las mismas colas.
+ Todas las instancias del grupo de nodos de cómputo están cerradas y es posible que los trabajos activos fallen, según la configuración de Slurm.
+ AWS PCS no puede lanzar nuevas instancias en el grupo de nodos de cómputo.
+ Todos los trabajos en cola o recién enviados permanecen pendientes hasta que se adjunte otro grupo de nodos de cómputo a la cola o hasta que se actualice el grupo de nodos de cómputo para usar una nueva plantilla de lanzamiento que especifique un nuevo bloque de capacidad.

# Configurar un grupo de nodos de cómputo de AWS PCS para usar un bloque de capacidad
<a name="capacity-blocks-configure-cng"></a>

**Para asociar un bloque de capacidad a un grupo de nodos de cómputo**

1. Crea una plantilla de EC2 lanzamiento de Amazon para AWS PCS que especifique tu bloque de capacidad. Para obtener más información sobre la creación de una plantilla de lanzamiento para AWS PCS, consulte[Uso de plantillas de lanzamiento de Amazon EC2 con PCS AWS](working-with_launch-templates.md).

   La plantilla de lanzamiento debe incluir:
   + El valor `MarketType` de `InstanceMarketOptions` debe estar establecido en`capacity-block`.
   + A `CapacityReservationSpecification` con un valor válido `CapacityReservationId`
   + Una válida `InstanceType` que coincida con el tipo de instancia del bloque de capacidad que compraste.

1. Cree un grupo de nodos de cómputo que utilice la plantilla de lanzamiento. Para obtener más información, consulte [Creación de un grupo de nodos de cómputo en AWS PCS](working-with_cng_create.md). También puede actualizar un grupo de nodos de procesamiento existente para usar la plantilla de lanzamiento. Para obtener más información, consulte [Actualización de un grupo de nodos de cómputo AWS PCS](working-with_cng_update.md).

   Al crear o actualizar el grupo de nodos de cómputo:
   + La identidad de IAM que utilices para crear o actualizar el grupo de nodos de procesamiento debe tener el siguiente permiso:

     ```
     ec2:DescribeCapacityReservations
     ```

     Para obtener más información, consulte [Permisos mínimos para PCS AWS](security-min-permissions.md).
   + El bloque de capacidad debe estar en un `active` estado `scheduled` o.
   + Defina el grupo `purchaseOption` de nodos de cómputo en`CAPACITY_BLOCK`.
   + El tamaño `maxInstanceCount` del grupo de nodos de cómputo no debe superar el tamaño del bloque de capacidad.
   + La zona de disponibilidad del grupo de nodos de cómputo debe coincidir con una de las zonas de disponibilidad de subred del grupo de nodos de cómputo.

**importante**  
No puedes cambiar el tipo de instancia de un grupo de nodos de cómputo al actualizarlo. Solo puedes usar un bloque de capacidad con el mismo tipo de instancia que el grupo de nodos de cómputo. Si quieres usar un bloque de capacidad con un tipo de instancia diferente, debes crear un nuevo grupo de nodos de cómputo.

# Preguntas frecuentes sobre el uso de bloques de capacidad con AWS PCS
<a name="capacity-blocks-faq"></a>

**Acabo de pagar un bloque de capacidad e inmediatamente intenté usarlo con AWS PCS, pero no se pudo crear el grupo de nodos de cómputo. ¿Qué ha pasado?**  
Es posible que su bloque de capacidad no esté en un `active` estado `scheduled` o. Vuelva a intentarlo cuando el bloque de capacidad esté `scheduled` o`active`.

**Estoy utilizando un bloque de capacidad en AWS PCS y he comprado una extensión antes de que caducara. ¿Cómo puedo seguir utilizándolo en AWS PCS?**  
No tiene que hacer nada para seguir utilizando el bloque de capacidad en AWS PCS. La fecha de finalización de tu bloque de capacidad se actualiza una vez que se haya realizado el pago de la extensión. Mientras el bloque de capacidad no caduque, el grupo de nodos de cómputo seguirá funcionando. Si no se realiza el pago de la extensión, el bloque de capacidad permanece `active` y el grupo de nodos de cómputo funciona hasta que el bloque de capacidad venza en su fecha de finalización original.

**¿Qué ocurre con mis trabajos en cola y en ejecución si mi bloque de capacidad caduca?**  
Los trabajos en cola que no se iniciaron antes de que expirara el bloque de capacidad permanecen pendientes hasta que asocie otro grupo de nodos de cómputo a la cola o actualice el grupo de nodos de cómputo con un nuevo bloque de capacidad. Aún puede enviar trabajos a la cola. La configuración de Slurm afecta a los trabajos activos. De forma predeterminada, los trabajos activos se vuelven a poner en cola automáticamente, pero pueden tener errores o fallar.

**Mi bloque de capacidad ha caducado. ¿Debo hacer algo?**  
No tienes que hacer nada. Puede comprobar el estado de sus reservas de capacidad de EC2 en la consola Amazon EC2. Cuando un bloque de capacidad caduca, el grupo de nodos de cómputo asociado a ese bloque de capacidad sigue existiendo y gestionando las mismas colas. El grupo de nodos de cómputo no tiene instancias para ejecutar trabajos. Puedes eliminar el grupo de nodos de cómputo o desasociarlo de las colas para evitar que los usuarios envíen trabajos que no se ejecutarán.

**Quiero usar un nuevo bloque de capacidad con mi grupo de nodos de cómputo de AWS PCS. ¿Qué tengo que hacer?**  
Le recomendamos que cree un nuevo grupo de nodos de cómputo para usar el nuevo bloque de capacidad. Para obtener más información, consulte [Configurar un grupo de nodos de cómputo de AWS PCS para usar un bloque de capacidad](capacity-blocks-configure-cng.md).

**¿Cómo puedo compartir 1 bloque de capacidad entre clústeres y servicios?**  
Puede dividir un bloque de capacidad en varios clústeres y servicios. Por ejemplo, para dividir un bloque de capacidad con 64 `p5.48xlarge` instancias con 20 nodos en el PCS-Cluster-1, 16 nodos en el PCS-Cluster-2 y los nodos restantes para otros servicios, defina ambos `minInstanceCount` nodos en 20 para el PCS-Cluster-1 y 16 para el PCS-Cluster-2. `maxInstanceCount`

**¿Puedo usar más de un bloque de capacidad o una capacidad combinada con un grupo de nodos de cómputo?**  
No. Solo se puede asociar un bloque de capacidad a un único grupo de nodos de procesamiento. AWS PCS no admite grupos de reserva de capacidad que combinen varios bloques de capacidad.

**¿Cómo sé cuándo comienzan o caducan mis bloques de capacidad?**  
Independientemente del AWS PCS, Amazon EC2 envía un `Capacity Block Reservation Delivered` evento EventBridge cuando se inicia una reserva de bloque de capacidad y un `Capacity Block Reservation Expiration Warning` evento 40 minutos antes de que caduque la reserva de bloque de capacidad. Para obtener más información, consulte [Supervisar los bloques de capacidad EventBridge](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/capacity-blocks-monitor.html) en la *Guía del usuario de Amazon Elastic Compute Cloud*.

**¿Cómo rastrea Slurm el estado de mi bloque de capacidad?**  
Puede correr `sinfo` para entender cómo AWS PCS utiliza el bloque de capacidad. En el siguiente resultado de ejemplo, se asocia una cola a un grupo de nodos de cómputo que ejecuta 4 instancias desde un bloque de `active` capacidad. Los nodos están en el estado `idle` Slurm (están disponibles para su uso y aún no están asignados a ningún trabajo).  

```
$ sinfo  
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST  
fanout up infinite 4 idle node-fanout-[1-4]
```
Si, por el contrario, los nodos están en `maint` estado, puedes ir `scontrol show res` a ver los detalles sobre la reserva de Slurm que controla este estado. En el siguiente ejemplo de salida, el bloque de capacidad tiene `scheduled` una fecha de inicio futura.  

```
$ scontrol show res                                                                                                  
ReservationName=node-fanout-scheduled StartTime=2025-10-14T13:09:17 EndTime=2025-10-14T13:11:17 Duration=00:02:00    
   Nodes=node-fanout-[1-4] NodeCnt=4 CoreCnt=16 Features=(null) PartitionName=(null) Flags=MAINT,SPEC_NODES          
   TRES=cpu=16                                                                                                       
   Users=root Groups=(null) Accounts=(null) Licenses=(null) State=ACTIVE BurstBuffer=(null)                          
   MaxStartDelay=(null)                                                                                              
   Comment=node-fanout Scheduled
```

**¿Cómo puedo saber si los errores que recibo al lanzar la capacidad se deben a que mi bloque de capacidad está compartido?**  
Compruebe **las reservas de capacidad** en la consola de Amazon EC2 para averiguar cuántas instancias del bloque de capacidad están aprovisionadas activamente. Compruebe las etiquetas de cada instancia para saber qué servicio o clúster la utiliza. Por ejemplo, todas las instancias de AWS PCS tienen etiquetas de AWS PCS, como las `aws:pcs:cluster-id = pcs_l0mizqyk5o | aws:pcs:compute-node-group-id = pcs_ic7onkmfqk` que indican a qué clústeres y grupos de nodos de cómputo pertenece la instancia. A continuación, puede comprobar si el bloque de capacidad está al máximo de su capacidad.  
`scontrol show nodes`Para comprobar si un nodo de bloque de capacidad de un clúster de AWS PCS se está activando`ReservationCapacityExceeded`:  

```
[root@ip-172-16-10-54 ~]# scontrol show nodes test-node-8-gamma-cb-2  
NodeName=test-8-gamma-cb-2 CoresPerSocket=1  
   CPUAlloc=0 CPUEfctv=8 CPUTot=8 CPULoad=0.00  
   AvailableFeatures=test-8-gamma-cb,gpu  
   ActiveFeatures=test-8-gamma-cb,gpu  
   Gres=gpu:H100:1  
   NodeAddr=test-8-gamma-cb-2 NodeHostName=test-8-gamma-cb-2  
   RealMemory=249036 AllocMem=0 FreeMem=N/A Sockets=8 Boards=1  
   State=IDLE+CLOUD+POWERING_DOWN ThreadsPerCore=1 TmpDisk=0 Weight=1 Owner=N/A MCS_label=N/A  
   Partitions=my-q  
   BootTime=None SlurmdStartTime=None  
   LastBusyTime=Unknown ResumeAfterTime=None  
   CfgTRES=cpu=8,mem=249036M,billing=8  
   AllocTRES=  
   CurrentWatts=0 AveWatts=0  
   Reason=Failed to launch backing instance (Error Code: ReservationCapacityExceeded) [root@2025-08-28T15:15:33]
```

**Cuando hay varios grupos de nodos de cómputo conectados a la misma cola, ¿cómo puedo forzar la ejecución de un trabajo en instancias respaldadas por Capacity Block?**  
Puedes usar las funciones y restricciones de Slurm para bloquear un trabajo en un determinado conjunto de nodos. Le recomendamos que no establezca ponderaciones de Slurm para cada grupo de nodos de cómputo, ya que eso solo funciona con los nodos que no están en ese estado. `maint`