# SUS05-BP04 Mengoptimalkan penggunaan akselerator komputasi berbasis perangkat keras
<a name="sus_sus_hardware_a5"></a>

Optimalkan penggunaan instans komputasi terakselerasi Anda untuk mengurangi permintaan-permintaan infrastruktur fisik beban kerja Anda.

 **Anti-pola umum:** 
+  Anda tidak memantau penggunaan GPU. 
+  Anda menggunakan instans tujuan umum untuk beban kerja, padahal instans yang dibuat khusus dapat menghadirkan kinerja yang lebih tinggi, biaya yang lebih rendah, dan kinerja per watt yang lebih baik. 
+  Anda menggunakan akselerator komputasi berbasis perangkat keras untuk tugas-tugas yang akan lebih efisien jika dikerjakan menggunakan alternatif berbasis CPU. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan mengoptimalkan penggunaan akselerator berbasis perangkat keras, Anda dapat mengurangi permintaan infrastruktur fisik untuk beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Jika Anda memerlukan kemampuan pemrosesan tinggi, Anda dapat memanfaatkan instans komputasi terakselerasi, yang menyediakan akses ke akselerator komputasi berbasis perangkat keras seperti unit pemrosesan grafis (GPU) dan field programmable gate array (FPGA). Akselerator perangkat keras ini menjalankan fungsi-fungsi tertentu seperti pemrosesan grafis atau pencocokan pola data secara lebih efisien daripada alternatif yang berbasis CPU. Banyak beban kerja terakselerasi, seperti perenderan, transkode, dan machine learning, yang memiliki variabel tinggi sehubungan dengan penggunaan sumber daya. Jalankan perangkat keras ini hanya ketika diperlukan, dan non-aktifkan instans GPU secara otomatis saat tidak diperlukan, guna meminimalkan sumber daya yang digunakan. 

## Langkah-langkah implementasi
<a name="implementation-steps"></a>
+  **Jelajahi akselerator komputasi:** Identifikasi [instans komputasi terakselerasi](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/accelerated-computing-instances.html) yang dapat memenuhi kebutuhan Anda. 
+  **Gunakan perangkat keras yang dibuat khusus:** Untuk beban kerja machine learning, manfaatkan perangkat keras yang dibuat khusus untuk beban kerja Anda, misalnya [AWS Trainium](https://aws.amazon.com/machine-learning/trainium/), [AWS Inferentia](https://aws.amazon.com/machine-learning/inferentia/), dan [Amazon EC2 DL1](https://aws.amazon.com/ec2/instance-types/dl1/). Instans-instans AWS Inferentia seperti instans Inf2 menawarkan kinerja per watt hingga [50% lebih baik daripada instans Amazon EC2 yang setara](https://aws.amazon.com/machine-learning/inferentia/). 
+  **Pantau metrik penggunaan:** Kumpulkan metrik penggunaan untuk instans komputasi terakselerasi Anda. Misalnya, Anda dapat menggunakan agen CloudWatch untuk mengumpulkan metrik seperti metrik `utilization_gpu` dan `utilization_memory` untuk GPU Anda seperti yang ditunjukkan dalam [Mengumpulkan metrik GPU NVIDIA dengan Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Agent-NVIDIA-GPU.html). 
+  **Rampingkan:** Optimalkan kode, operasi jaringan, dan pengaturan akselerator perangkat keras untuk memastikan perangkat keras yang mendasarinya dimanfaatkan sepenuhnya. 
  +  [Mengoptimalkan pengaturan GPU](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/optimize_gpu.html) 
  +  [Pemantauan dan Pengoptimalan GPU dalam AMI Deep Learning](https://docs.aws.amazon.com/dlami/latest/devguide/tutorial-gpu.html) 
  +  [Mengoptimalkan I/O untuk penyetelan kinerja GPU pelatihan deep learning di Amazon SageMaker AI](https://aws.amazon.com/blogs/machine-learning/optimizing-i-o-for-gpu-performance-tuning-of-deep-learning-training-in-amazon-sagemaker/) 
+  **Pastikan tetap terbaru:** Gunakan driver GPU dan pustaka berkinerja tinggi terbaru. 
+  **Lepaskan instans yang tidak diperlukan:** Gunakan otomatisasi untuk melepaskan instans GPU ketika tidak digunakan. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Komputasi yang Dipercepat](https://aws.amazon.com/ec2/instance-types/#Accelerated_Computing) 
+ [ Mari Merancang\$1 Merancang arsitektur dengan chip dan akselerator kustom ](https://aws.amazon.com/blogs/architecture/lets-architect-custom-chips-and-accelerators/)
+ [ Bagaimana cara memilih jenis instans Amazon EC2 yang tepat untuk beban kerja saya? ](https://aws.amazon.com/premiumsupport/knowledge-center/ec2-instance-choose-type-for-workload/)
+  [Instans Amazon EC2 VT](https://aws.amazon.com/ec2/instance-types/vt1/) 
+ [ Pilih akselerator AI dan kompilasi model terbaik untuk inferensi penglihatan komputer dengan Amazon SageMaker AI ](https://aws.amazon.com/blogs/machine-learning/choose-the-best-ai-accelerator-and-model-compilation-for-computer-vision-inference-with-amazon-sagemaker/)

 **Video terkait:** 
+ [AWS re:Invent 2021 - Cara memilih instans GPU Amazon EC2 untuk deep learning ](https://www.youtube.com/watch?v=4bVrIbgGWEA)
+  [AWS Pembicaraan Teknologi Online - Men-deploy Inferensi Deep Learning yang Hemat Biaya](https://www.youtube.com/watch?v=WiCougIDRsw) 
+ [AWS re:Invent 2023 - AI mutakhir dengan AWS dan NVIDIA](https://www.youtube.com/watch?v=ud4-z_sb_ps)
+ [AWS re:Invent 2022 - [PELUNCURAN BARU\$1] Memperkenalkan instans Amazon EC2 Inf2 berbasis AWS Inferensia2](https://www.youtube.com/watch?v=jpqiG02Y2H4)
+ [AWS re:Invent 2022 - Mempercepat deep learning dan berinovasi lebih cepat dengan AWS Trainium](https://www.youtube.com/watch?v=YRqvfNwqUIA)
+ [AWS re:Invent 2022 - Deep learning di AWS dengan NVIDIA: Dari pelatihan hingga deployment](https://www.youtube.com/watch?v=l8AFfaCkp0E)