

# GPU 가속 인스턴스 시작하기
<a name="gpu-instances-started"></a>

다음 목록에 표시된 것과 같은 최신 세대의 GPU 가속 인스턴스 유형은 딥 러닝 및 고성능 컴퓨팅(HPC) 애플리케이션을 위한 최고 성능 기능을 제공합니다. 인스턴스 유형 링크를 선택하고 해당 기능을 자세히 알아보세요.
+ [P6 패밀리](https://aws.amazon.com/ec2/instance-types/p6/)
+ [P6 패밀리](https://aws.amazon.com/ec2/instance-types/p6/)
+ [P5 패밀리](https://aws.amazon.com/ec2/instance-types/p5/)

가속 인스턴스 유형의 전체 인스턴스 유형 사양 목록은 *Amazon EC2 인스턴스 유형* 참조의 [가속 컴퓨팅](https://docs.aws.amazon.com/ec2/latest/instancetypes/ac.html)을 참조하세요.

**소프트웨어 구성**  
최신 세대의 GPU 가속 인스턴스 유형을 시작하는 가장 쉬운 방법은 필요한 모든 소프트웨어가 미리 구성되어 있는 AWS Deep Learning AMI를 사용하여 인스턴스를 시작하는 것입니다. GPU 가속 인스턴스 유형과 함께 사용할 수 있는 최신 AWS Deep Learning AMIs는 *AWS Deep Learning AMIs 개발자 가이드*의 [P6 지원 DLAMI](https://docs.aws.amazon.com/dlami/latest/devguide/p6-support-dlami.html)를 참조하세요.

사용자 지정 AMI를 구축하여 딥 러닝 또는 HPC 애플리케이션을 호스팅하는 인스턴스를 시작해야 하는 경우 다음과 같은 최소 소프트웨어 버전을 기본 이미지 위에 설치하는 것이 좋습니다.


| 인스턴스 유형 | NVIDIA 드라이버 | CUDA | NVIDIA GDRCopy | EFA 설치 프로그램 | NCCL | EFA K8s ¹ | 
| --- | --- | --- | --- | --- | --- | --- | 
| G7e | 575 | 12.9 | 2.5 | 1.45.0 | 2.28.3 | 0.5.10 | 
| P5 | 530 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.4.4 | 
| P5.4xlarge | 530 | 12.1 | 2.3 | 1.43.1 ² | 2.18.3 | 0.4.4 | 
| P5e | 550 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.5.5 | 
| P5en | 550 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.5.6 | 
| P6-B200 | 570 | 12.8 | 2.5 | 1.41.0 | 2.26.2-1 | 0.5.10 | 
| P6e-GB200 | 570 | 12.8 | 2.5 | 1.41.0 | 2.26.2-1 | 0.5.10 | 
| P6-B300 | 580 | 13.0 | 2.5 | 1.44.0 | 2.28.3 | 0.5.10 | 

** ¹** **EFA K8s** 열에는 `aws-efa-k8s-device-plugin`의 최소 권장 버전이 포함되어 있습니다.

** ²** GPU-to-GPU 통신에서 Elastic Fabric Adapter(EFA) 및 NVIDIA Collective Communications Library(NCCL)를 사용하는 경우 `P5.4xlarge` 인스턴스에 영향을 미치는 호환성 문제가 있습니다. 문제를 완화하려면 환경 변수 `FI_HMEM_DISABLE_P2P`를 `1`로 설정하고 EFA 버전 1.43.1 이상을 설치해야 합니다.

**참고**  
EFA 설치 관리자 버전 1.41.0을 사용하는 경우 `aws-ofi-nccl plugin`이 함께 제공됩니다. 이전 버전의 EFA 설치 관리자는 `aws-ofi-nccl plugin` 버전 `1.7.2-aws` 이상을 사용합니다.

또한 심화된 C 상태를 사용하지 않도록 인스턴스를 구성하는 것이 좋습니다. 자세한 내용은 *Amazon Linux 2 사용 설명서*의 [C 상태 심화 제한을 통한 고성능 및 저지연 시간](https://docs.aws.amazon.com/linux/al2/ug/processor_state_control.html#c-states)을 참조하세요. 최신 AWS Deep Learning Base GPU AMI는 심화된 C 상태를 사용하지 않도록 미리 구성되어 있습니다.

네트워킹 및 Elastic Fabric Adapter(EFA) 구성에 대한 자세한 내용은 [여러 네트워크 카드를 사용하여 Amazon EC2 인스턴스의 네트워크 대역폭 극대화](efa-acc-inst-types.md)를 참조하세요.