Performance do Amazon FSx para NetApp ONTAP
Veja a seguir uma visão geral da desempenho do sistema de arquivos do Amazon FSx para NetApp ONTAP, com uma discussão sobre as opções disponíveis de desempenho e throughput, além de dicas úteis de desempenho.
Tópicos
Como a performance é avaliada nos sistemas de arquivos do FSx para ONTAP
A desempenho do sistema de arquivos é avaliada por latência, throughput e operações de E/S por segundo (IOPS).
Latência
O Amazon FSx para NetApp ONTAP fornece latências de operação de arquivos abaixo de um milissegundo, com armazenamento em unidade de estado sólido (SSD) e dezenas de milissegundos de latência para armazenamento em grupo de capacidade. Além disso, o Amazon FSx tem duas camadas de armazenamento em cache de leitura em cada servidor de arquivos, nas unidades de NVMe (memória não volátil expressa) e em memória, para fornecer latências ainda mais baixas ao acessar seus dados lidos com mais frequência.
Throughput e IOPS
Cada sistema de arquivos do Amazon FSx fornece até vários GBps de throughput e centenas de milhares de IOPS. A quantidade específica de throughput e IOPS que sua workload pode gerar no sistema de arquivos depende da capacidade de throughput total e da configuração da capacidade de armazenamento do sistema de arquivos, com a natureza da workload, incluindo o tamanho do conjunto de trabalho ativo.
Suporte para SMB Multichannel e NFS nconnect
Com o Amazon FSx, você pode configurar o SMB Multichannel para fornecer várias conexões entre o ONTAP e os clientes em uma única sessão de SMB. O SMB Multichannel usa várias conexões de rede entre o cliente e o servidor simultaneamente para agregar largura de banda da rede para a máxima utilização. Para obter informações sobre como usar a CLI do NetApp ONTAP para configurar o SMB Multichannel, consulte Configuring SMB Multichannel for performance and redundancy
Os clientes NFS podem usar a opção de montagem nconnect para ter várias conexões TCP (até 16) associadas a uma única montagem NFS. Esse cliente NFS multiplexa as operações de arquivo em várias conexões TCP de forma round-robin e, assim, obtém maior throughput da largura de banda da rede disponível. NFSv3 e NFSv4.1+ são compatíveis com o nconnect. A largura de banda da rede da instância do Amazon EC2 descreve o limite de largura de banda full duplex de 5 Gbps por fluxo de rede. Você pode superar esse limite usando vários fluxos de rede com nconnect ou SMB Multichannel. Consulte a documentação do seu cliente NFS para confirmar se há suporte para nconnect na versão do cliente. Para obter mais informações sobre a compatibilidade do NetApp ONTAP com nconnect, consulte ONTAP support for NFSv4.1
Molduras jumbo
Para obter o throughput máximo de leitura ou gravação, recomendamos habilitar frames jumbo em todas as interfaces de rede no caminho de dados para seu sistema de arquivos do Amazon FSx, incluindo suas instâncias de clientes do EC2. A configuração padrão de unidade máxima de transmissão (MTU) para interfaces de rede em seu sistema de arquivos do FSx para ONTAP é de 9.001 bytes.
Detalhes da desempenho
Para entender detalhadamente o modelo de performance do Amazon FSx para NetApp ONTAP, você pode examinar os componentes arquitetônicos de um sistema de arquivos do Amazon FSx. As instâncias de computação do cliente, estando elas na AWS ou on-premises, acessam seu sistema de arquivos por meio de uma ou várias interfaces de rede elástica (ENI). Essas interfaces de rede residem na Amazon VPC associada ao seu sistema de arquivos. Por trás de cada ENI do sistema de arquivos está um servidor de arquivos do NetApp ONTAP que fornece dados pela rede aos clientes que acessam o sistema de arquivos. O Amazon FSx fornece um cache em memória rápido e um cache em NVMe em cada servidor de arquivos para melhorar a desempenho dos dados acessados com mais frequência. Os discos SSD que hospedam os dados do sistema de arquivos estão anexados a cada servidor de arquivos.
Esses componentes são ilustrados no diagrama a seguir.
Correspondendo a esses componentes arquitetônicos (interface de rede, cache em memória, cache em NVMe e volumes de armazenamento) estão as principais características de performance de um sistema de arquivos do Amazon FSx para NetApp ONTAP que determinam o throughput e a performance de IOPS gerais.
-
Performance de E/S de rede: throughput e IOPS de solicitações entre os clientes e o servidor de arquivos (em agregação)
-
Tamanho do cache em memória e em NVMe no servidor de arquivos: tamanho do conjunto de trabalho ativo que pode ser acomodado para o armazenamento em cache
-
desempenho de E/S de disco: throughput e IOPS de solicitações entre o servidor de arquivos e os discos de armazenamento
Há dois fatores que determinam essas características de desempenho no sistema de arquivos: a quantidade total de IOPS de SSD e a capacidade de throughput configurada para ele. As duas primeiras características de desempenho (a desempenho de E/S de rede e o tamanho do cache em memória e em NVMe) são determinadas exclusivamente pela capacidade de throughput, enquanto a terceira (a desempenho de E/S de disco) é determinada por uma combinação de capacidade de throughput e IOPS de SSD.
As workloads baseadas em arquivos geralmente apresentam picos, caracterizados por períodos curtos e intensos de alta E/S com bastante tempo ocioso entre as intermitências. Para apoiar workloads com picos, além das velocidades básicas que um sistema de arquivos pode sustentar 24 horas por dia, sete dias por semana, o Amazon FSx oferece a capacidade de atingir velocidades mais altas em certos períodos, tanto para operações de E/S de rede quanto de E/S de disco. O Amazon FSx usa um mecanismo de crédito de E/S de rede para alocar throughput e IOPS com base na utilização média: os sistemas de arquivos acumulam créditos quando o throughput e o uso de IOPS estão abaixo dos limites básicos e podem usar esses créditos ao realizar operações de E/S.
nota
Para os protocolos iSCSI e NVMe/TCP SAN, as operações de leitura sequencial do cliente podem atingir até a máxima intermitência de I/O de rede ou o throughput básico do sistema de arquivos.
As operações de gravação usam duas vezes mais largura de banda da rede do que as operações de leitura. Uma operação de gravação precisa ser replicada no servidor de arquivos secundário. Portanto, uma única operação de gravação resulta no dobro de throughput de rede.
Impacto do tipo de implantação na desempenho
Você pode criar sistemas de arquivos single-AZ e multi-AZ com o FSx para ONTAP. Os sistemas de arquivos de primeira geração (single-AZ e multi-AZ) e os sistemas de arquivos multi-AZ de segunda geração são alimentados por um par de alta disponibilidade (HA). Os sistemas de arquivos single-AZ de segunda geração são habilitados por até 12 pares de HA. Para obter mais informações, consulte Gerenciar pares de alta disponibilidade (HA).
Os sistemas de arquivos multi-AZ e single-AZ do FSx para ONTAP fornecem latências consistentes de operação de arquivos abaixo de um milissegundo com armazenamento SSD e dezenas de milissegundos de latência com armazenamento em grupo de capacidade. Além disso, os sistemas de arquivos que atendem aos seguintes requisitos fornecem um cache de leitura de NVMe para reduzir as latências de leitura e aumentar a IOPS para dados lidos com frequência:
Sistemas de arquivos multi-AZ 1 e multi-AZ 2
Sistemas de arquivos single-AZ 1 criados após 28 de novembro de 2022 com ao menos 2 GBps de capacidade de throughput
Sistemas de arquivos single-AZ 2 com ao menos 6 GBps de capacidade de throughput por par
nota
Para sistemas de arquivos de segunda geração (single-AZ 2 e multi-AZ 2), o uso de um cache NVMe pode fazer com que sua workload alcance menos throughput total para workloads de E/S grandes ou de alto rendimento. Se você tiver uma workload limitada à throughput, recomendamos desativar o cache NVMe. Para obter mais informações, consulte Gerenciar o cache NVMe.
As tabelas a seguir mostram a quantidade de capacidade de throughput para a qual os sistemas de arquivos podem aumentar horizontalmente a escala dependendo de fatores como o número de pares de alta disponibilidade (HA) e a disponibilidade nas Regiões da AWS.
Impacto da capacidade de armazenamento na desempenho
O throughput máximo de disco e os níveis de IOPS que o sistema de arquivos pode alcançar são os mais baixos entre:
-
o nível de desempenho do disco fornecido pelos servidores de arquivos, com base na capacidade de throughput selecionada para o sistema de arquivos
-
o nível de desempenho do disco fornecido pelo número de IOPS de SSD provisionado para o sistema de arquivos
Por padrão, o armazenamento SSD do sistema de arquivos fornece até os seguintes níveis de throughput de disco e IOPS:
-
Throughput de disco (MBps por TiB de armazenamento): 768
-
IOPS de disco (IOPS por TiB de armazenamento): 3.072
nota
Ao diminuir a capacidade de armazenamento SSD em um sistema de arquivos de segunda geração, a maioria das workloads sofre um impacto mínimo no desempenho. No entanto, workloads com alto índice de gravação podem sofrer uma degradação temporária do desempenho. Você também pode ter breves pausas de E/S (até 60 segundos) à medida que o acesso do cliente é redirecionado para novos discos.
Para minimizar o impacto no desempenho, garanta que as workloads contínuas não consumam mais de 50% de CPU, 50% de throughput de disco ou 50% de IOPS de SSD de modo consistente antes de iniciar uma operação de redução de SSD. Para ter mais informações sobre a redução da capacidade de armazenamento, consulte Quando reduzir a capacidade de armazenamento de SSD .
Impacto da capacidade de throughput na desempenho
Cada sistema de arquivos do Amazon FSx tem uma capacidade de throughput configurada quando o sistema de arquivos é criado. A capacidade de throughput do sistema de arquivos determina o nível de desempenho de E/S de rede ou a velocidade com a qual cada um dos servidores de arquivos que hospedam o sistema de arquivos pode fornecer dados de arquivos pela rede aos clientes que os acessam. Níveis mais altos de capacidade de throughput vêm com mais memória e armazenamento de memória não volátil expressa (NVMe) para armazenar dados em cache de cada servidor de arquivos, bem como níveis mais altos de desempenho de E/S de disco com suporte de cada servidor de arquivos.
Opcionalmente, você pode provisionar um nível mais alto de IOPS de SSD ao criar o sistema de arquivos. O nível máximo de IOPS de SSD que o sistema de arquivos pode alcançar também é determinado pela capacidade de throughput do sistema de arquivos, mesmo ao provisionar IOPS de SSD adicionais.
As tabelas a seguir mostram o conjunto completo de especificações de capacidade de throughput, com os níveis de linha de base e de intermitência e a quantidade de memória para armazenamento em cache no servidor de arquivos nas Regiões da AWS correspondentes.
Exemplo: capacidade de armazenamento e capacidade de throughput
O exemplo a seguir ilustra como a capacidade de armazenamento e a capacidade de throughput afetam a desempenho do sistema de arquivos.
Um sistema de arquivos de primeira geração configurado com 2 TiB de capacidade de armazenamento SSD e 512 MBps de capacidade de throughput tem os seguintes níveis de throughput:
-
Throughput de rede: linha de base de 625 MBps e intermitência de 1.250 MBps (consulte a tabela de capacidade de throughput)
-
Throughput de disco: linha de base de 512 MBps e intermitência de 600 MBps.
Portanto, sua workload que acessa o sistema de arquivos será capaz de gerar até 625 MBps de linha de base e 1.250 MBps de throughput de intermitência para operações de arquivo executadas em dados acessados ativamente e armazenados em cache no cache em memória e no cache em NVMe do servidor de arquivos.