Compreensão da modelagem de grafos Otimizar consultas Dimensionar corretamente os clusters Otimizar as gravações

Pilar Eficiência de performance

O pilar de eficiência de desempenho do AWS Well-Architected Framework se concentra em como otimizar o desempenho ao ingerir ou consultar dados. A otimização da performance é um processo incremental e contínuo do seguinte:

Confirmação dos requisitos de negócios
Avaliação da performance da workload
Identificação de componentes com baixa performance
Ajuste dos componentes para atender às suas necessidades comerciais

O pilar de eficiência de performance fornece diretrizes específicas para casos de uso que podem ajudar a identificar o modelo de dados de grafos e as linguagens de consulta corretos a serem usados. Também inclui as práticas recomendadas a serem seguidas ao ingerir e consumir dados do Amazon Neptune.

O pilar de eficiência de performance foca estas áreas principais:

Modelagem de grafos
Otimização de consultas
Dimensionamento correto de um cluster
Otimização de gravações

Compreensão da modelagem de grafos

Entenda a diferença entre os modelos Labeled Property Graph (LPG) e Resource Description Framework (RDF). Na maioria dos casos, é uma questão de preferência. No entanto, existem vários casos de uso em que um modelo é mais adequado do que o outro. Se você precisar de conhecimento do caminho que conecta dois nós em seu grafo, escolha LPG. Se você quiser federar dados em clusters do Neptune ou em outros armazenamentos triplos de grafos, escolha RDF.

Se você estiver criando um aplicação de software como serviço (SaaS) ou uma aplicação que exija multilocação, considere incorporar a separação lógica de locatários em seu modelo de dados em vez de ter um locatário para cada cluster. Para obter esse tipo de design, você pode usar grafos nomeados e estratégias de rotulagem do SPARQL, como prefixar identificadores de clientes em rótulos ou adicionar pares de chave/valor de propriedades representando identificadores de locatários. Certifique-se de que sua camada de cliente injete esses valores para manter essa separação lógica. Para obter mais informações sobre recomendações de multilocação, consulte Orientação de multilocação para executar bancos de dados Amazon ISVs Neptune.

A performance de suas consultas depende do número de objetos de grafos (nós, bordas, propriedades) que precisam ser avaliados no processamento de sua consulta. Dessa forma, o modelo de grafo pode ter um impacto significativo na performance da aplicação. Use rótulos granulares sempre que possível e armazene somente as propriedades necessárias para obter a determinação ou a filtragem do caminho. Para obter maior performance, considere pré-calcular partes do grafo, como criar nós de resumo ou bordas mais diretas conectando caminhos comuns.

Tente evitar navegar por nós que tenham um número anormalmente alto de bordas com o mesmo rótulo. Esses nós geralmente têm milhares de bordas (em que a maioria dos nós tem contagens de bordas na casa das dezenas). O resultado é uma complexidade muito maior de computação e dados. Esses nós podem não ser problemáticos em alguns padrões de consulta, mas recomendamos modelar seus dados de forma diferente para evitá-los, especialmente se você navegar pelo nó como uma etapa intermediária. Você pode usar os logs slow-query para ajudar a identificar consultas que navegam por esses nós. Você provavelmente observará métricas de latência e acesso a dados muito maiores do que seus padrões de consulta comuns, especialmente se usar o modo de depuração.

Use um nó determinístico IDs para nós e bordas se seu caso de uso oferecer suporte a isso, em vez de usar o Neptune para atribuir valores de GUID aleatórios para. IDs O acesso a nós por ID é o método mais eficiente.

Otimizar consultas

As linguagens openCypher e Gremlin podem ser usadas de forma intercambiável em modelos LPG. Se a performance for uma das principais preocupações, considere usar as duas linguagens de forma intercambiável, pois uma pode ter uma dperformance melhor do que a outra para padrões de consulta específicos.

O Neptune está em processo de conversão para seu mecanismo de consulta alternativo (DFE). O openCypher é executado somente no DFE, mas as consultas Gremlin e SPARQL podem ser configuradas opcionalmente para execução no DFE usando anotações de consulta. Considere testar suas consultas com o DFE ativado e comparar a performance do seu padrão de consulta quando não estiver usando o DFE.

O Neptune é otimizado para consultas do tipo transacional que começam em um único nó ou conjunto de nós e se espalham a partir daí, em vez de consultas analíticas que avaliam todo o grafo. Para suas cargas de trabalho de consultas analíticas, use o Neptune Analytics. O Neptune Analytics é a escolha ideal para cargas de trabalho investigatórias, exploratórias ou de ciência de dados que exigem iteração rápida para processamento de dados, analítico e algorítmico. Ele também pode realizar uma pesquisa vetorial em dados gráficos e carregar dados diretamente da sua instância de banco de dados Neptune. Se o Neptune Analytics não atender às suas necessidades, você também pode AWS considerar o SDK for Pandas ou usar o neptune-export combinado com o Amazon EMR. AWS Glue

Para identificar ineficiências e gargalos em seus modelos e consultas, use o profile e explain APIs para cada linguagem de consulta para obter explicações detalhadas sobre o plano de consulta e as métricas de consulta. Para obter mais informações, consulte Perfil do Gremlin, Explicação do openCypher e Explicação do SPARQL.

Entenda seus padrões de consulta. Se o número de bordas distintas em um grafo ficar grande, a estratégia de acesso padrão do Neptune poderá se tornar ineficiente. As consultas a seguir podem se tornar bastante ineficientes:

Consultas que navegam para trás pelas bordas quando nenhum rótulo de borda é fornecido.
Cláusulas que usam esse mesmo padrão internamente, como .both() no Gremlin, ou cláusulas que eliminam nós em qualquer linguagem (o que exige a eliminação das bordas de entrada sem o conhecimento dos rótulos).
Consultas que acessam valores de propriedades sem especificar rótulos de propriedades. Essas consultas podem se tornar bastante ineficientes. Se isso corresponder ao seu padrão de uso, considere habilitar o índice OSGP (objeto, assunto, grafo, predicado).

Use o registro em log slow-query para identificar consultas lentas. Consultas lentas podem ser causadas por planos de consulta não otimizados ou por um número desnecessariamente grande de pesquisas de índices, o que pode aumentar os custos. I/O A explicação e o perfil dos endpoints do Neptune para Gremlin, SPARQL ou openCypher podem ajudar você a entender por que essas consultas são lentas. As causas podem incluir as seguintes:

Os nós com um número anormalmente alto de bordas em comparação com o nó médio no grafo (por exemplo, milhares em comparação com dezenas) podem adicionar complexidade computacional e, portanto, maior latência e maior consumo de recursos. Determine se esses nós estão modelados corretamente ou se os padrões de acesso podem ser aprimorados para reduzir o número de bordas que devem ser percorridas.
As consultas não otimizadas conterão um aviso de que etapas específicas não estão otimizadas. Reescrever essas consultas para usar etapas otimizadas pode melhorar a performance.
Filtros redundantes podem causar pesquisas de índice desnecessárias. Da mesma forma, padrões redundantes podem causar pesquisas de índice duplicadas que podem ser otimizadas melhorando a consulta (consulte Index Operations - Duplication ratio na saída do perfil).
Algumas linguagens, como o Gremlin, não têm valores numéricos fortemente digitados e, em vez disso, usam a promoção de tipos. Por exemplo, se o valor for 55, o Neptune procurará valores que sejam inteiros, longos, flutuantes e outros tipos numéricos equivalentes a 55. Isso resulta em operações adicionais. Se você souber com antecedência que seus tipos coincidem, você pode evitar isso usando uma dica de consulta.
Seu modelo de grafo pode impactar muito a performance. Considere reduzir o número de objetos que precisam ser avaliados usando rótulos mais granulares ou pré-calculando atalhos para caminhos lineares de vários saltos.

Se a otimização de consultas por si só não permitir que você atinja seus requisitos de performance, considere usar uma variedade de técnicas de armazenamento em cache com o Neptune para atingir esses requisitos.

O desempenho do Neptune está melhorando continuamente a cada versão. Revise as notas de lançamento para ver os detalhes das melhorias em cada versão. Considere planejar atualizações regulares em seu cluster de banco de dados Neptune para ajudar a alcançar o desempenho ideal. As versões mais recentes também oferecem suporte a instâncias mais novas. Considere fazer o upgrade para a versão 1.4.5.0 ou posterior para poder utilizar as instâncias. r8g Para obter mais informações sobre como isso pode melhorar o desempenho da sua carga de trabalho, consulte Preço-desempenho de consultas de gravação 4,7 vezes melhor com instâncias AWS Graviton4 R8g usando o Amazon Neptune v1.4.5.

Dimensionar corretamente os clusters

Dimensione seu cluster de acordo com seus requisitos de simultaneidade e throughput. O número de consultas simultâneas que podem ser processadas por cada instância no cluster é igual a duas vezes o número de virtual CPUs (vCPUs) nessa instância. Consultas adicionais que chegam enquanto todos os threads de trabalho estão ocupados são colocadas em uma fila do lado do servidor. Essas consultas são tratadas first-in-first-out (FIFO) quando os threads de trabalho são disponibilizados. A CloudWatch métrica da MainRequestQueuePendingRequests Amazon mostra a profundidade atual da fila para cada instância. Se esse valor estiver frequentemente acima de zero, considere escolher uma instância com mais CPUs v. Se a profundidade da fila exceder 8.192, o Neptune retornará um erro. ThrottlingException

Aproximadamente 65% da RAM de cada instância é reservada para o cache de buffer. O cache do buffer contém o conjunto de dados de trabalho (não o grafo todo; apenas os dados que estão sendo consultados). Para determinar qual porcentagem de dados está sendo obtida do cache de buffer em vez do armazenamento, monitore a CloudWatch métrica. BufferCacheHitRatio Se essa métrica geralmente cai abaixo de 99,9%, considere tentar uma instância com mais memória para determinar se ela diminui sua latência e seus custos. I/O

As réplicas de leitura não precisam ter o mesmo tamanho da sua instância do gravador. No entanto, workloads pesadas de gravação podem fazer com que réplicas menores fiquem atrasadas e sejam reinicializadas, pois não conseguem acompanhar a replicação. Por isso, recomendamos criar réplicas iguais ou maiores que a instância do gravador.

Ao usar o ajuste de escala automático para suas réplicas de leitura, lembre-se de que pode levar até 15 minutos para colocar uma nova réplica de leitura on-line. Quando o tráfego do cliente aumenta de forma rápida, mas previsível, considere usar a escalabilidade programada para definir um número mínimo de réplicas de leitura mais alto para considerar esse tempo de inicialização.

As instâncias sem servidor são compatíveis com diversos casos de uso e workloads. Considere instâncias provisionadas sem servidor para os seguintes cenários:

Sua workload flutua com frequência ao longo do dia.
Você criou uma nova aplicação e não tem certeza de qual será o tamanho da workload.
Você está realizando o desenvolvimento e os testes.

É importante observar que as instâncias sem servidor são mais caras do que as instâncias provisionadas equivalentes com base em um dólar por GB de RAM. Cada instância sem servidor consiste em 2 GB de RAM junto com a vCPU e a rede associadas. Faça uma análise de custos entre suas opções para evitar contas inesperadas. Em geral, você economizará custos sem servidor somente quando sua workload for muito pesada por apenas algumas horas por dia e quase zero no resto do dia, ou se sua workload flutuar significativamente ao longo do dia.

Utilize a calculadora de preços do Amazon Neptune para ajudar a avaliar a configuração correta do seu cluster com base em fatores queries-per-second como requisitos (QPS).

Otimizar as gravações

Para otimizar gravações, considere o seguinte:

O Neptune Bulk Loader é a maneira ideal de carregar inicialmente seu banco de dados ou anexar dados existentes. O carregador do Neptune não é transacional e não pode excluir dados, portanto, não o use se estes forem seus requisitos.
As atualizações transacionais podem ser feitas usando as linguagens de consulta compatíveis. Para otimizar as I/O operações de gravação, grave dados em lotes de 50 a 100 objetos por confirmação. Um objeto é um nó, uma borda ou uma propriedade em um nó ou borda no LPG, ou um armazenamento triplo ou um quádruplo no RDF.
Todas as operações transacionais de gravação do Neptune são de thread único para cada conexão. Ao enviar uma grande quantidade de dados para o Neptune, considere ter várias conexões paralelas, cada uma gravando dados. Quando você escolhe uma instância provisionada pelo Neptune, o tamanho da instância é associado a um número de v. CPUs O Neptune cria dois threads de banco de dados para cada vCPU na instância, então comece com o dobro do número de CPUs v ao testar a paralelização ideal. As instâncias sem servidor escalam o número de v CPUs a uma taxa de aproximadamente uma para cada 4. NCUs

nota
Isso não se aplica à API de carregamento em massa, somente às conexões diretas.
Planeje e gerencie com ConcurrentModificationExceptionseficiência todos os processos de gravação, mesmo que apenas uma única conexão esteja gravando dados a qualquer momento. Projete seus clientes visando a confiabilidade quando ocorrerem ConcurrentModificationExceptions.
Se você quiser excluir todos os seus dados, considere usar a API de reinicialização rápida em vez de emitir consultas de exclusão simultâneas. O último levará muito mais tempo e terá I/O custos substanciais em comparação com o primeiro.
Se você quiser excluir a maioria dos seus dados, considere exportar os dados que deseja manter usando o neptune-export para carregar os dados em um novo cluster. Depois exclua o cluster original.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Pilar Confiabilidade

Pilar Otimização de custos