As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurando clientes EFA
Use os procedimentos a seguir para configurar seu cliente Lustre para acessar um sistema de arquivos for Lustre FSx por meio do Elastic Fabric Adapter (EFA).
O EFA é compatível com clientes Lustre que executam os seguintes sistemas operacionais:
Amazon Linux 2023 (AL2023)
Red Hat Enterprise Linux (RHEL) 9.5 ou mais recente
Ubuntu 22.04 ou mais recente com kernel versão 6.8+
O EFA é compatível com os clientes Lustre listados abaixo. Para obter mais informações, consulte Instalar o cliente do Lustre.
O EFA é compatível com instâncias Nitro v4 (ou superior) que oferecem suporte ao EFA, excluindo a família de EC2 instâncias trn2. Consulte Tipos de instância compatíveis no Guia do EC2 usuário da Amazon.
Tópicos
Etapa 1: instalar os drivers necessários
nota
Se você estiver usando uma AMI de aprendizado profundo, poderá pular essa etapa, pois o driver EFA e o driver NVIDIA GPUDirect Storage (GDS) estão pré-instalados.
Instale o driver EFA
Siga as instruções na Etapa 3: Instale o software EFA no Guia do EC2 usuário da Amazon.
Instale o driver GDS (opcional)
Essa etapa só é necessária se você planeja usar o NVIDIA GPUDirect Storage (GDS) com o FSx for Lustre.
Requisitos:
Instância Amazon EC2 P5, P5e, P5en ou P6-B200
Driver NVIDIA GDS versão 2.24.2 ou superior
Para instalar o driver de GPUDirect armazenamento NVIDIA na sua instância cliente
Clone o repositório NVIDIA GDS:
git clone https://github.com/NVIDIA/gds-nvidia-fs.git
Crie e instale o driver:
cd gds-nvidia-fs/src/ export NVFS_MAX_PEER_DEVS=128 export NVFS_MAX_PCI_DEPTH=16 sudo -E make sudo insmod nvidia-fs.ko
Etapa 2: Configurar o EFA para o cliente Lustre
Para acessar um FSx sistema de arquivos for Lustre usando uma interface EFA, você deve instalar os módulos Lustre EFA e configurar as interfaces EFA.
Configuração rápida
Para configurar rapidamente seu cliente Lustre
Conecte-se à sua EC2 instância da Amazon.
Baixe e descompacte o arquivo que contém o script de configuração:
curl -O https://docs.aws.amazon.com/fsx/latest/LustreGuide/samples/configure-efa-fsx-lustre-client.zip unzip configure-efa-fsx-lustre-client.zip
Vá para a
configure-efa-fsx-lustre-client
pasta e execute o script de configuração:cd
configure-efa-fsx-lustre-client
sudo ./setup.shO script faz automaticamente o seguinte:
Importa módulos Lustre
Configura as interfaces TCP e EFA
Cria um serviço systemd para configuração automática na reinicialização
Para ver uma lista de opções e exemplos de uso que você pode usar com o
setup.sh
script, consulte oREADME.md
arquivo no arquivo zip.
Gerenciando o serviço systemd manualmente
O arquivo de serviço systemd é criado em/etc/systemd/system/configure- efa-fsx-lustre-client .service. A seguir estão alguns comandos úteis relacionados ao systemd:
# Check status sudo systemctl status configure-efa-fsx-lustre-client.service # View logs sudo journalctl -u configure-efa-fsx-lustre-client.service # View warnings/errors from dmesg sudo dmesg
Para obter mais informações, consulte o README.md
arquivo no arquivo zip.
Configuração de montagem automática (opcional)
Para obter informações sobre como montar automaticamente seu sistema de arquivos Amazon FSx for Lustre na inicialização, consulteMontando seu sistema FSx de arquivos Amazon automaticamente.
Etapa 3: interfaces EFA
Cada sistema FSx de arquivos do Lustre tem um limite máximo de 1.024 conexões EFA em todas as instâncias do cliente.
O configure-efa-fsx-lustre-client.sh
script configura automaticamente as interfaces do EFA com base no tipo de instância.
Tipo de instância | Número padrão de interfaces EFA |
---|---|
p6-b200.48xlarge | 8 |
p5en.48xlarge | 8 |
p5e.48xlarge | 8 |
p5.48xlarge | 8 |
Outras instâncias com várias placas de rede | 2 |
Outras instâncias com uma única placa de rede | 1 |
Cada interface EFA configurada em uma instância cliente conta como uma conexão em relação ao limite de conexão 1024 do EFA quando conectada a um sistema de arquivos FSx for Lustre.
Gerenciando interfaces EFA manualmente
As instâncias com mais interfaces EFA geralmente oferecem suporte a uma taxa de transferência mais alta. Você pode personalizar o número de interfaces para otimizar o desempenho de suas cargas de trabalho específicas, desde que permaneça dentro do limite total de conexão do EFA.
Você pode gerenciar manualmente as interfaces do EFA usando os seguintes comandos:
Veja os dispositivos EFA disponíveis:
for interface in /sys/class/infiniband/*; do if [ ! -e "$interface/device/driver" ]; then continue; fi driver=$(basename "$(realpath "$interface/device/driver")") if [ "$driver" != "efa" ]; then continue; fi echo $(basename $interface) done
Veja as interfaces atualmente configuradas:
sudo lnetctl net show
Adicione uma interface EFA:
sudo lnetctl net add --net efa --if
device_name
—peer-credits 32device_name
Substitua por um nome de dispositivo real da lista na etapa 1.Remova uma interface EFA:
sudo lnetctl net del --net efa --if
device_name
device_name
Substitua por um nome de dispositivo real da lista na etapa 2.