As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Como configurar clientes do EFA
Use os procedimentos a seguir para configurar seu cliente do Lustre para acessar um sistema de arquivos do FSx para Lustre por meio do Elastic Fabric Adapter (EFA).
O EFA é compatível com os clientes do Lustre que executam os seguintes sistemas operacionais:
Amazon Linux 2023 (AL2023)
Red Hat Enterprise Linux (RHEL) 9.5 ou mais recente
Ubuntu 22.04 ou mais recente com kernel versão 6.8+
O EFA é compatível com os clientes do Lustre listados abaixo. Para obter mais informações, consulte Instalar o cliente do Lustre.
O EFA é compatível com instâncias do EC2 Nitro v4 (ou superior) que compatíveis com o EFA, excluindo a família de instâncias trn2. Consulte Tipos de instância compatíveis no Guia do usuário do Amazon EC2.
Tópicos
Etapa 1: instalar os drivers necessários
nota
Se você estiver usando uma AMI de aprendizado profundo, poderá pular essa etapa, pois o driver do EFA e o driver NVIDIA GPUDirect Storage (GDS) estão pré-instalados.
Instale o driver do EFA
Siga as instruções na Etapa 3: instalar o software EFA no Guia do usuário do Amazon EC2.
Instale o driver GDS (opcional)
Essa etapa só é necessária se você planeja usar o NVIDIA GPUDirect Storage (GDS) com o FSx para Lustre.
Requisitos:
Instância P5, P5e, P5en, P6-B200 ou P6e-GB200 do Amazon EC2
Driver NVIDIA GDS versão 2.24.2 ou superior
Para instalar o driver NVIDIA GPUDirect Storage na instância do seu cliente
Clone o repositório NVIDIA GDS:
git clone https://github.com/NVIDIA/gds-nvidia-fs.gitCompile e instale o driver:
cd gds-nvidia-fs/src/ export NVFS_MAX_PEER_DEVS=128 export NVFS_MAX_PCI_DEPTH=16 sudo -E make sudo insmod nvidia-fs.ko
Etapa 2: configurar o EFA para o cliente do Lustre
Para acessar um sistema de arquivos do FSx para Lustre usando uma interface do EFA, você deve instalar os módulos Lustre do EFA e configurar as interfaces do EFA.
Configuração rápida
Para configurar rapidamente seu cliente do Lustre
Conecte-se à sua instância Amazon EC2.
Baixe e descompacte o arquivo que contém o script de configuração:
curl -O https://docs.aws.amazon.com/fsx/latest/LustreGuide/samples/configure-efa-fsx-lustre-client.zip unzip configure-efa-fsx-lustre-client.zipVá para a pasta
configure-efa-fsx-lustre-cliente execute o script de configuração:cdconfigure-efa-fsx-lustre-clientsudo ./setup.shO script faz o seguinte de forma automática:
Importa os módulos do Lustre
Configura as interfaces de TCP e EFA
Cria um serviço systemd para a configuração automática na reinicialização
Para ver uma lista de opções e exemplos de uso que você pode usar com o script
setup.sh, consulte o arquivoREADME.mdno arquivo zip.
Como gerenciar o serviço systemd manualmente
O arquivo de serviço systemd é criado em /etc/systemd/system/configure-efa-fsx-lustre-client.service. A seguir estão alguns comandos úteis relacionados ao systemd:
# Check status sudo systemctl status configure-efa-fsx-lustre-client.service # View logs sudo journalctl -u configure-efa-fsx-lustre-client.service # View warnings/errors from dmesg sudo dmesg
Para obter mais informações, consulte o arquivo README.md no arquivo zip.
Configuração de montagem automática (opcional)
Para obter mais informações sobre como fazer a montagem do seu sistema de arquivos do Amazon FSx para Lustre na inicialização, consulte Montando seu sistema FSx de arquivos Amazon automaticamente.
Etapa 3: interfaces do EFA
Cada sistema de arquivos do FSx para Lustre tem um limite máximo de 1.024 conexões do EFA em todas as instâncias do cliente.
O script configure-efa-fsx-lustre-client.sh configura automaticamente as interfaces do EFA com base no tipo de instância.
| Tipo de instância | Número padrão de interfaces do EFA |
|---|---|
| p6e-gb200.36xlarge | 8 |
| p6-b200.48xlarge | 8 |
| p5en.48xlarge | 8 |
| p5e.48xlarge | 8 |
| p5.48xlarge | 8 |
| Outras instâncias com várias placas de rede | 2 |
| Outras instâncias com uma única placa de rede | 1 |
Cada interface do EFA configurada em uma instância do cliente conta como uma conexão em relação ao limite de conexão 1024 do EFA quando conectada a um sistema de arquivos do FSx para Lustre.
Como gerenciar interfaces do EFA manualmente
As instâncias com mais interfaces do EFA geralmente oferecem suporte a um throughput mais alto. Você pode personalizar o número de interfaces para otimizar o desempenho de suas workloads específicas, desde que permaneça dentro do limite total de conexão do EFA.
Você pode gerenciar manualmente as interfaces do EFA usando os seguintes comandos:
Visualize os dispositivos do EFA disponíveis:
for interface in /sys/class/infiniband/*; do if [ ! -e "$interface/device/driver" ]; then continue; fi driver=$(basename "$(realpath "$interface/device/driver")") if [ "$driver" != "efa" ]; then continue; fi echo $(basename $interface) doneVisualize as interfaces atualmente configuradas:
sudo lnetctl net showAdicione uma interface do EFA:
sudo lnetctl net add --net efa --ifdevice_name—peer-credits 32Substitua
device_namepor um nome de dispositivo real da lista da etapa 1.Remova uma interface do EFA:
sudo lnetctl net del --net efa --ifdevice_nameSubstitua
device_namepor um nome de dispositivo real da lista da etapa 2.