Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Elastic Fabric Adapter
Elastic Fabric Adapter (EFA) adalah perangkat jaringan yang memiliki kemampuan OS-bypass untuk komunikasi jaringan latensi rendah dengan instans lain pada subnet yang sama. EFA diekspos dengan menggunakan Libfabric, dan dapat digunakan oleh aplikasi menggunakan Messaging Passing Interface (MPI).
Untuk menggunakan EFA dengan AWS ParallelCluster dan Slurm penjadwal, atur SlurmQueues//ComputeResourcesEfa/Enabledke. true
Untuk melihat daftar instans Amazon EC2 yang mendukung EFA, lihat Jenis instans yang didukung di Panduan Pengguna Amazon EC2 untuk Instans Linux.
Kami menyarankan Anda menjalankan instans berkemampuan EFA Anda dalam grup penempatan. Dengan cara ini instance diluncurkan ke grup latensi rendah dalam satu Availability Zone. Untuk informasi selengkapnya tentang cara mengonfigurasi grup penempatan dengan AWS ParallelCluster, lihat SlurmQueues/Networking/PlacementGroup.
catatan
Elastic Fabric Adapter (EFA) tidak didukung pada zona ketersediaan yang berbeda. Untuk informasi selengkapnya, lihat Penjadwalan/SlurmQueues/Jaringan/SubnetIds.
catatan
Secara default, Ubuntu distribusi mengaktifkan perlindungan ptrace (jejak proses). ptraceperlindungan dinonaktifkan sehingga Libfabric berfungsi dengan baik. Untuk informasi selengkapnya, lihat Menonaktifkan perlindungan ptrace di Panduan Pengguna Amazon EC2.
Konfigurasi jaringan EFA default
Mulai AWS ParallelCluster 3.15.0, ketika EFA diaktifkan, AWS ParallelCluster secara otomatis mengkonfigurasi antarmuka jaringan khusus EFA untuk memisahkan lalu lintas EFA dari lalu lintas IP. Ini memaksimalkan bandwidth EFA sambil meminimalkan konsumsi alamat IP. AWS ParallelCluster menentukan konfigurasi optimal berdasarkan kemampuan jenis instance.
Konfigurasi default ini direkomendasikan untuk sebagian besar beban kerja, termasuk HPC yang digabungkan erat dan pelatihan terdistribusi. AI/ML
Menyesuaikan antarmuka jaringan EFA
Jika beban kerja Anda memerlukan konfigurasi jaringan yang berbeda, seperti memaksimalkan bandwidth ENA pada kartu jaringan sekunder atau mengonfigurasi subset kartu jaringan yang tersedia, Anda dapat mengganti pengaturan default menggunakan parameter///. SlurmQueuesComputeResourcesLaunchTemplateOverrides Ini menggantikan seluruh konfigurasi antarmuka jaringan dari node komputasi dengan konfigurasi yang ditentukan dalam template peluncuran Anda.
Untuk step-by-step penelusuran, lihat. Sesuaikan antarmuka jaringan node komputasi dengan penggantian template peluncuran
Awas
Jika Anda mengonfigurasi antarmuka jaringan dengan cara yang tidak didukung oleh jenis instance, instance akan gagal diluncurkan. Untuk memverifikasi konfigurasi jaringan yang didukung untuk jenis instans Anda, lihat DescribeInstanceTypesdi Referensi API Amazon EC2.
Untuk informasi selengkapnya, lihat Adaptor Kain Elastis di Panduan Pengguna Amazon EC2 dan Skalakan beban kerja HPC dengan adaptor kain elastis dan AWS ParallelCluster