AWS PCS에서 ML에 Amazon EC2 용량 블록 사용 - AWS PCS

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS PCS에서 ML에 Amazon EC2 용량 블록 사용

ML용 Amazon EC2 용량 블록은 특정 날짜 및 시간 범위 내에 GPU 기반 가속 컴퓨팅 인스턴스를 미리 예약하여 단기 워크로드를 지원할 수 있는 Amazon EC2 구매 옵션입니다. 용량 블록 내부에서 실행되는 인스턴스는 지연 시간이 짧은 페타비트 규모의 비차단 네트워킹을 위해 Amazon EC2 UltraClusters 내부에 자동으로 서로 가깝게 배치됩니다. 자세한 내용은 Amazon Elastic Compute Cloud 사용 설명서ML용 용량 블록을 참조하세요.

시작 템플릿을 사용하여 컴퓨팅 노드 그룹의 인스턴스를 시작할 때 AWS PCS가 용량 블록을 사용하도록 할 수 있습니다.

참고

AWS PCS는 Slurm 버전 24.05 이상의 용량 블록만 지원합니다.

제한 사항

  • AWS PCS는 P5en, P5e, P5 및 P4d 인스턴스 패밀리가 있는 용량 블록만 지원합니다.

  • 컴퓨팅 노드 그룹은 한 번에 하나의 용량 블록에만 연결할 수 있습니다.

  • 컴퓨팅 노드 그룹을 여러 용량 블록을 결합하는 용량 예약 그룹과 연결할 수 없습니다.

  • AWS PCS와 함께 사용하려면 용량 블록이 scheduled 또는 active 상태여야 합니다. 와 같은 다른 상태에서는 용량 블록을 사용할 수 없습니다payment-failed. 자세한 내용은 Amazon Elastic Compute Cloud 사용 설명서용량 블록 보기를 참조하세요.

용량 블록 만료

용량 블록은 특정 날짜 및 시간 범위로 제한됩니다. 용량 블록이 만료되는 경우:

  • 해당 용량 블록과 연결된 컴퓨팅 노드 그룹은 계속 존재하며 동일한 대기열과 연결된 상태로 유지됩니다.

  • Slurm 설정에 따라 컴퓨팅 노드 그룹의 모든 인스턴스가 종료되고 활성 작업이 실패할 수 있습니다.

  • AWS PCS는 컴퓨팅 노드 그룹에서 새 인스턴스를 시작할 수 없습니다.

  • 대기열에 다른 컴퓨팅 노드 그룹이 연결되거나 새 용량 블록을 지정하는 새 시작 템플릿을 사용하도록 컴퓨팅 노드 그룹을 업데이트할 때까지 대기 중이거나 새로 제출된 모든 작업은 보류 상태로 유지됩니다.