

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Opções de banco de dados vetoriais
<a name="vector-db-options"></a>

AWS oferece uma ampla variedade de soluções de banco de dados vetoriais para dar suporte a diferentes casos de uso e requisitos em aplicativos generativos de IA. Essas opções podem ser amplamente categorizadas em serviços de banco de dados individuais e ofertas de serviços gerenciados, cada uma com características e vantagens distintas. Compreender essas opções é crucial para organizações que desejam implementar recursos de pesquisa vetorial de forma eficaz, mantendo o desempenho, a escalabilidade e a eficiência de custos ideais.

Para obter mais informações sobre soluções de banco de dados vetoriais, consulte as seções a seguir:
+ [Opções individuais de banco de dados vetoriais](#individual-dbs)
+ [Opção de serviço gerenciado](#managed-db)
+ [Escolhendo o banco de dados vetorial correto](#choosing-database)

## Opções individuais de banco de dados vetoriais
<a name="individual-dbs"></a>

[https://docs.aws.amazon.com/neptune-analytics/latest/userguide/what-is-neptune-analytics.html](https://docs.aws.amazon.com/neptune-analytics/latest/userguide/what-is-neptune-analytics.html) (Uma extensão de código aberto, o pgvector adiciona a capacidade de armazenar e pesquisar incorporações vetoriais geradas por ML.) Essas soluções oferecem abordagens diferentes para a pesquisa vetorial, permitindo que as organizações escolham com base em sua infraestrutura existente, requisitos técnicos e [casos de uso](use-cases.md) específicos.

### Amazon Kendra
<a name="kendra"></a>

O Amazon Kendra é um serviço de pesquisa inteligente de nível corporativo que usa processamento de linguagem natural e algoritmos avançados de aprendizado de máquina para retornar respostas específicas às perguntas de pesquisa de seus dados. O Amazon Kendra simplifica a implementação da funcionalidade de pesquisa, tornando-o uma solução de back-end eficaz para aplicativos generativos de IA.

Outros recursos importantes do Amazon Kendra incluem o seguinte:
+ Conexões nativas com mais de [40 fontes de dados](https://aws.amazon.com/kendra/connectors/)
+ Recursos integrados de preparação de dados
+ Configuração rápida que não requer profundo conhecimento técnico

Os benefícios do Amazon Kendra incluem o seguinte
+ Processamento automatizado de dados (fragmentação, ingestão, recuperação)
+ Opções poderosas de personalização:
  + [Pesquisa de facetas](https://docs.aws.amazon.com/kendra/latest/dg/filtering.html)
  + [Análise de pesquisa](https://docs.aws.amazon.com/kendra/latest/dg/search-analytics.html)
  + [Ajustando a relevância da pesquisa](https://docs.aws.amazon.com/kendra/latest/dg/tuning.html)
+ Acesso programático simples por meio do [AWS SDK para Python (Boto3)](https://docs.aws.amazon.com/kendra/latest/dg/gs-python.html)

Para obter mais informações, consulte [Benefícios do Amazon Kendra na documentação do Amazon](https://docs.aws.amazon.com/kendra/latest/dg/what-is-kendra.html#what-is-benefits) Kendra.

### OpenSearch Serviço Amazon
<a name="opensearch-service"></a>

O Amazon OpenSearch Service é um serviço gerenciado que ajuda você a implantar, operar e escalar clusters de OpenSearch serviços no Nuvem AWS.

Os principais recursos do OpenSearch Serviço incluem o seguinte:
+ Mecanismo de pesquisa e análise de código aberto
+ Arquitetura distribuída
+ Processamento de dados em tempo real

Algumas vantagens de usar o OpenSearch Serviço incluem o seguinte:
+ Escalabilidade horizontal
+ RESTful Suporte à API
+ Lida com dados estruturados e não estruturados
+ Análise de dados em tempo real
+ Adequado para vários tamanhos de implantação

Para obter mais informações, consulte [Recursos do Amazon OpenSearch Service](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/what-is.html#what-is-features) na documentação do OpenSearch serviço.

### Amazon RDS para PostgreSQL com pgvector
<a name="rds"></a>

O Amazon RDS for [PostgreSQL](https://github.com/pgvector/pgvector) com pgvector AWS combina o serviço de banco de dados relacional gerenciado com a extensão de processamento vetorial do PostgreSQL. Essa combinação permite que as organizações armazenem e consultem vetores de alta dimensão enquanto mantêm o Amazon RDS. A solução é particularmente adequada para aplicativos generativos de IA que exigem operações vetoriais em tempo real sem a sobrecarga de gerenciar a infraestrutura do banco de dados.

Os principais benefícios do Amazon RDS for PostgreSQL com pgvector incluem o seguinte:
+ Alta disponibilidade
+ Failover automático
+ Econômico () pay-per-use
+ Monitoramento integrado
+ Integração de dados vetoriais em tempo real

Para obter mais informações, consulte [Vantagens do Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/Welcome.html) na documentação do Amazon RDS.

### Amazon DocumentDB
<a name="documentdb"></a>

O Amazon DocumentDB (com compatibilidade com o MongoDB) é um banco de dados de documentos que oferece recursos de pesquisa vetorial nativa na versão 5.0 e posterior. Ele combina a flexibilidade do armazenamento de documentos baseado em JSON com a pesquisa vetorial, suportando os métodos de indexação hierárquica navegável de pequeno mundo (HNSW) e Inverted File Flat (). IVFFlat

Os principais recursos do Amazon DocumentDB incluem o seguinte:
+ Armazene e indexe vetores de até 2.000 dimensões (até 16.000 dimensões sem indexação)
+ Tempos de resposta em milissegundos para pesquisas de similaridade vetorial
+ Support para métricas de distância de produtos euclidianos, cossenos e pontos
+ Integração perfeita com aplicativos existentes compatíveis com MongoDB

Use o Amazon DocumentDB nas seguintes situações:
+ Para aplicativos que já estão usando o APIs MongoDB e que precisam de recursos de pesquisa vetorial
+ Para casos de uso que exigem estruturas flexíveis de dados de documentos combinadas com pesquisa semântica
+ Para cenários que precisam tanto de consultas tradicionais de documentos quanto de pesquisas por similaridade vetorial
+ Para aplicativos que fornecem recomendações de produtos, personalização, assistentes de bate-papo e detecção de fraudes

Para obter mais informações, consulte [Pesquisa vetorial para Amazon DocumentDB](https://docs.aws.amazon.com/documentdb/latest/developerguide/vector-search.html) na documentação do Amazon DocumentDB.

### Amazon MemoryDB
<a name="memorydb"></a>

O Amazon MemoryDB é um banco de dados em memória compatível com Redis que oferece o desempenho de pesquisa vetorial mais rápido entre os bancos de dados vetoriais mais populares. AWS Ele fornece latências de consulta inferiores a um milissegundo com durabilidade de zona de disponibilidade múltipla.

Os principais recursos do MemoryDB incluem o seguinte:
+ Armazene dados de aplicativos e milhões de vetores em um único banco de dados
+ Tempos de resposta de consulta e atualização de um dígito em milissegundos
+ As maiores taxas de recall com o desempenho mais rápido em AWS
+ Support para até 32.768 dimensões por vetor
+ Recursos de pesquisa semântica e armazenamento em cache em tempo real

Use o MemoryDB nas seguintes situações:
+ Para aplicativos em tempo real que exigem latência ultrabaixa (menos de 10 ms)
+ Para cargas de trabalho de alto rendimento com milhões de solicitações por dia
+ Para casos de uso como mecanismos de recomendação em tempo real, cache semântico e detecção de anomalias
+ Para aplicativos que precisam de recursos de armazenamento de dados na memória e pesquisa vetorial

Para obter mais informações, consulte [Pesquisa vetorial](https://docs.aws.amazon.com/memorydb/latest/devguide/vector-search.html) na documentação do MemoryDB.

### Amazon Neptune Analytics
<a name="neptune"></a>

O Amazon Neptune Analytics é um mecanismo de análise gráfica que oferece recursos de pesquisa vetorial nativa, tornando-o ideal para casos de uso da Geração Aumentada de Recuperação de Gráficos (GraphRag). Ele combina pesquisa de similaridade vetorial com percursos gráficos e algoritmos.

Os principais recursos do Neptune Analytics incluem o seguinte:
+ Analise dezenas de bilhões de relacionamentos em segundos
+ Combine a pesquisa vetorial com algoritmos gráficos (localização de caminhos, detecção de comunidades, centralidade)
+ Support para aplicativos GraphRag com conhecimento topológico
+ Até 80 vezes mais rápido do que as soluções analíticas gráficas existentes
+ Integração com o Amazon Bedrock para GraphRag totalmente gerenciado

Use o Neptune Analytics nas seguintes situações:
+ Para aplicativos GraphRag que exigem gráficos de conhecimento com incorporações vetoriais
+ Para casos de uso que exigem a travessia de relacionamentos complexos ao lado da similaridade vetorial
+ Para aplicativos que exigem respostas explicáveis de IA com contexto de relacionamento
+ Para cenários como visualizações 360 de clientes, redes de detecção de fraudes e descoberta de conhecimento

Para obter mais informações, consulte a documentação do [Amazon Neptune Analytics](https://docs.aws.amazon.com/neptune-analytics/latest/userguide/what-is-neptune-analytics.html).

### Amazon S3 Vectors
<a name="s3-vectors"></a>

O Amazon S3 Vectors é o primeiro armazenamento de objetos em nuvem AWS com armazenamento vetorial nativo e recursos de consulta. Ele fornece armazenamento vetorial personalizado e com custo otimizado para aplicativos de IA que exigem grande escala.

Os principais recursos dos Amazon S3 Vectors incluem o seguinte:
+ Armazenamento para até 2 bilhões de vetores por índice com suporte para até 10.000 índices por compartimento vetorial
+ Latência de consulta abaixo de 100 ms otimizada para armazenamento de longo prazo e padrões de acesso pouco frequentes
+ Redução de custos de até 90% para operações vetoriais em comparação com bancos de dados vetoriais especializados
+ Arquitetura sem servidor com escalabilidade automática e durabilidade de 99,999999999% (11 9s)

Use os vetores do Amazon S3 nas seguintes situações:
+ Para aplicativos que exigem armazenamento de bilhões de vetores a um custo mínimo
+ Para cargas de trabalho que toleram latência de consulta inferior a um segundo (100 ms ou mais) em vez de menos de 10 ms
+ Para casos de uso de arquivamento e retenção de vetores a longo prazo
+ Para aplicações RAG com padrões de recuperação pouco frequentes
+ Para organizações que priorizam a economia de armazenamento em vez da latência ultrabaixa

O Amazon S3 Vectors se integra nativamente às bases de conhecimento do Amazon Bedrock e funciona bem em arquiteturas hierárquicas com o Amazon Service. OpenSearch Você pode usar o Amazon S3 Vectors para armazenamento a frio e usar o OpenSearch Service para consultas dinâmicas.

Para obter mais informações, consulte Como [trabalhar com vetores e buckets vetoriais do S3 na documentação](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors.html) do Amazon S3.

## Opção de serviço gerenciado
<a name="managed-db"></a>

O Amazon Bedrock Knowledge Bases representa a abordagem AWS totalmente gerenciada para a implementação de bancos de dados vetoriais. A flexibilidade do serviço nas opções de armazenamento, combinada com seus recursos de gerenciamento automatizado, o torna particularmente valioso para organizações que buscam implementar o RAG sem gerenciar uma infraestrutura complexa.

Com o Amazon Bedrock Knowledge Bases, você pode criar, manter e consultar bases de conhecimento que aprimoram seus modelos básicos usando o RAG. Esse serviço simplifica o processo complexo de implementação do RAG gerenciando todo o pipeline de ingestão, vetorização e recuperação de dados.

Os principais benefícios das bases de conhecimento Amazon Bedrock incluem o seguinte:
+ Processamento de dados simplificado
  + Ingestão e fragmentação automáticas de dados
  + Extração de texto integrada de vários formatos de arquivo
  + Geração gerenciada de incorporações vetoriais
  + Extração e indexação automáticas de metadados
+ Implementação simplificada do RAG
  + Estratégias de recuperação pré-configuradas
  + Otimização automática da janela de contexto
  + Ajuste de relevância integrado
  + Recursos de pesquisa semântica prontos para uso
+ Segurança e governança
  + Controles integrados AWS Identity and Access Management (IAM)
  + Criptografia de dados em repouso e em trânsito
  + Suporte à VPC
  + Registro de auditoria com AWS CloudTrail

O Amazon Bedrock Knowledge Bases oferece suporte a várias [opções de armazenamento de vetores](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html), incluindo:
+ Amazon Aurora PostgreSQL com pgvector
+ Amazon Neptune Analytics
+ Amazon EMR Sem Servidor
+ Amazon S3 Vectors
+ Pinha
+ Nuvem empresarial Redis

Esse serviço gerenciado gerencia a ingestão, a vetorização e a recuperação automatizadas de dados. Isso simplifica as implementações do RAG.

Para obter informações detalhadas sobre cada loja de vetores compatível, consulte a [documentação do Amazon Bedrock Knowledge Bases](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html).

## Escolhendo o banco de dados vetorial correto
<a name="choosing-database"></a>

Selecione seu banco de dados vetoriais com base nesses principais fatores de decisão:
+ **Se você precisar de um banco de dados de documentos compatível com MongoDB com pesquisa vetorial**, escolha Amazon DocumentDB. Isso é ideal quando seu aplicativo usa o APIs MongoDB e você deseja adicionar recursos de pesquisa semântica sem gerenciar uma infraestrutura vetorial separada.
+ **Se você precisar de latência ultrabaixa para aplicativos em tempo real**, escolha o Amazon MemoryDB. Isso fornece o desempenho de pesquisa vetorial mais rápido AWS com tempos de resposta abaixo de um milissegundo. É ideal para mecanismos de recomendação em tempo real e aplicações de alto rendimento.
+ **Se você precisar de representações de conhecimento baseadas em gráficos com pesquisa vetorial**, escolha o Amazon Neptune Analytics. Isso é melhor para aplicativos GraphRag que precisam atravessar relacionamentos complexos e realizar consultas baseadas em gráficos junto com pesquisas vetoriais, fornecendo respostas de IA explicáveis.
+ **Se você precisar combinar consultas relacionais com pesquisa vetorial**, escolha Amazon Aurora PostgreSQL com pgvector. Essa opção é ideal quando seu aplicativo exige operações SQL tradicionais e pesquisas de similaridade vetorial no mesmo banco de dados.
+ **Se você precisar de consultas de alto rendimento com latência inferior a 10 ms**, escolha o Amazon Service. OpenSearch Ele se destaca no tratamento de consultas de alta frequência e aplicativos em tempo real e inclui melhorias recentes na aceleração da GPU.
+ **Se você precisar armazenar bilhões de vetores de forma econômica**, escolha Amazon S3 Vectors. Essa opção oferece até 90% de economia de custos e é ideal para aplicativos com padrões de recuperação pouco frequentes (minutos a horas entre consultas) que podem tolerar latência abaixo de 100 ms.
+ **Se você precisar de uma pesquisa de texto completo junto com a pesquisa vetorial**, escolha o Amazon OpenSearch Service. Essa opção combina recursos poderosos de pesquisa de texto completo com pesquisa vetorial em uma única plataforma.