GPU 액셀러레이터 사용

하나 이상의 GPUs를 사용하여 작업 처리를 가속화하도록 서비스 관리형 플릿에서 작업자 호스트를 구성할 수 있습니다. 액셀러레이터를 사용하면 작업을 처리하는 데 걸리는 시간을 줄일 수 있지만 각 작업자 인스턴스의 비용이 증가할 수 있습니다. GPU 액셀러레이터를 사용하는 플릿과 그렇지 않은 플릿 간의 장단점을 이해하려면 워크로드를 테스트해야 합니다.

wait-and-save 인스턴스가 있는 플릿에는 GPUs를 사용할 수 없습니다.

참고

테스트 목적으로 GPU는 1개로 제한됩니다. 프로덕션 워크로드에 대해 더 많은 것을 요청하려면 Service Quotas 사용 설명서의 할당량 증가 요청을 참조하세요.

작업자 인스턴스 기능을 지정할 때 플릿이 GPU 액셀러레이터를 사용할지 여부를 결정합니다. GPUs를 사용하기로 결정한 경우 각 인스턴스의 최소 및 최대 GPUs 수, 사용할 GPU 칩 유형, GPU의 런타임 드라이버를 GPUs.

사용 가능한 GPU 액셀러레이터는 다음과 같습니다.

T4 - NVIDIA T4 Tensor 코어 GPU
A10G - NVIDIA A10G Tensor 코어 GPU
L4 - NVIDIA L4 Tensor 코어 GPU
L40s - NVIDIA L40S Tensor 코어 GPU

다음 런타임 드라이버 중에서 선택할 수 있습니다.

Latest - 칩에 사용할 수 있는 최신 런타임을 사용합니다. 를 지정latest하고 새 버전의 런타임이 릴리스되면 새 버전의 런타임이 사용됩니다.
grid:r570 - NVIDIA vGPU 소프트웨어 18
grid:r535 - NVIDIA vGPU 소프트웨어 16

런타임을 지정하지 않으면 Deadline Cloud는를 기본값latest으로 사용합니다. 그러나 액셀러레이터가 여러 개 있고 일부에 latest 대해를 지정하고 다른는 비워 두면 Deadline Cloud에서 예외가 발생합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

서비스 관리형 플릿

소프트웨어 라이선스