As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Opções de banco de dados vetoriais
AWS oferece uma ampla variedade de soluções de banco de dados vetoriais para dar suporte a diferentes casos de uso e requisitos em aplicativos generativos de IA. Essas opções podem ser amplamente categorizadas em serviços de banco de dados individuais e ofertas de serviços gerenciados, cada uma com características e vantagens distintas. Compreender essas opções é crucial para organizações que desejam implementar recursos de pesquisa vetorial de forma eficaz, mantendo o desempenho, a escalabilidade e a eficiência de custos ideais.
Para obter mais informações sobre soluções de banco de dados vetoriais, consulte as seções a seguir:
Opções individuais de banco de dados vetoriais
As opções individuais de banco de dados vetoriais AWS incluem Amazon Kendra, AmazonService, OpenSearch AmazonRDS para PostgreSQL com pgvector, AmazonMemoryDB, Amazon DocumentDB, Amazon Neptune Analytics e Amazon S3 Vector. (Uma extensão de código aberto, o pgvector adiciona a capacidade de armazenar e pesquisar incorporações vetoriais geradas por ML.) Essas soluções oferecem abordagens diferentes para a pesquisa vetorial, permitindo que as organizações escolham com base em sua infraestrutura existente, requisitos técnicos e casos de uso específicos.
Amazon Kendra
O Amazon Kendra é um serviço de pesquisa inteligente de nível corporativo que usa processamento de linguagem natural e algoritmos avançados de aprendizado de máquina para retornar respostas específicas às perguntas de pesquisa de seus dados. O Amazon Kendra simplifica a implementação da funcionalidade de pesquisa, tornando-o uma solução de back-end eficaz para aplicativos generativos de IA.
Outros recursos importantes do Amazon Kendra incluem o seguinte:
-
Conexões nativas com mais de 40 fontes de dados
-
Recursos integrados de preparação de dados
-
Configuração rápida que não requer profundo conhecimento técnico
Os benefícios do Amazon Kendra incluem o seguinte
-
Processamento automatizado de dados (fragmentação, ingestão, recuperação)
-
Opções poderosas de personalização:
-
Acesso programático simples por meio do AWS SDK para Python (Boto3)
Para obter mais informações, consulte Benefícios do Amazon Kendra na documentação do Amazon Kendra.
OpenSearch Serviço Amazon
O Amazon OpenSearch Service é um serviço gerenciado que ajuda você a implantar, operar e escalar clusters de OpenSearch serviços no Nuvem AWS.
Os principais recursos do OpenSearch Serviço incluem o seguinte:
-
Mecanismo de pesquisa e análise de código aberto
-
Arquitetura distribuída
-
Processamento de dados em tempo real
Algumas vantagens de usar o OpenSearch Serviço incluem o seguinte:
-
Escalabilidade horizontal
-
RESTful Suporte à API
-
Lida com dados estruturados e não estruturados
-
Análise de dados em tempo real
-
Adequado para vários tamanhos de implantação
Para obter mais informações, consulte Recursos do Amazon OpenSearch Service na documentação do OpenSearch serviço.
Amazon RDS para PostgreSQL com pgvector
O Amazon RDS for PostgreSQL
Os principais benefícios do Amazon RDS for PostgreSQL com pgvector incluem o seguinte:
-
Alta disponibilidade
-
Failover automático
-
Econômico () pay-per-use
-
Monitoramento integrado
-
Integração de dados vetoriais em tempo real
Para obter mais informações, consulte Vantagens do Amazon RDS na documentação do Amazon RDS.
Amazon DocumentDB
O Amazon DocumentDB (com compatibilidade com o MongoDB) é um banco de dados de documentos que oferece recursos de pesquisa vetorial nativa na versão 5.0 e posterior. Ele combina a flexibilidade do armazenamento de documentos baseado em JSON com a pesquisa vetorial, suportando os métodos de indexação hierárquica navegável de pequeno mundo (HNSW) e Inverted File Flat (). IVFFlat
Os principais recursos do Amazon DocumentDB incluem o seguinte:
-
Armazene e indexe vetores de até 2.000 dimensões (até 16.000 dimensões sem indexação)
-
Tempos de resposta em milissegundos para pesquisas de similaridade vetorial
-
Support para métricas de distância de produtos euclidianos, cossenos e pontos
-
Integração perfeita com aplicativos existentes compatíveis com MongoDB
Use o Amazon DocumentDB nas seguintes situações:
-
Para aplicativos que já estão usando o APIs MongoDB e que precisam de recursos de pesquisa vetorial
-
Para casos de uso que exigem estruturas flexíveis de dados de documentos combinadas com pesquisa semântica
-
Para cenários que precisam tanto de consultas tradicionais de documentos quanto de pesquisas por similaridade vetorial
-
Para aplicativos que fornecem recomendações de produtos, personalização, assistentes de bate-papo e detecção de fraudes
Para obter mais informações, consulte Pesquisa vetorial para Amazon DocumentDB na documentação do Amazon DocumentDB.
Amazon MemoryDB
O Amazon MemoryDB é um banco de dados em memória compatível com Redis que oferece o desempenho de pesquisa vetorial mais rápido entre os bancos de dados vetoriais mais populares. AWS Ele fornece latências de consulta inferiores a um milissegundo com durabilidade de zona de disponibilidade múltipla.
Os principais recursos do MemoryDB incluem o seguinte:
-
Armazene dados de aplicativos e milhões de vetores em um único banco de dados
-
Tempos de resposta de consulta e atualização de um dígito em milissegundos
-
As maiores taxas de recall com o desempenho mais rápido em AWS
-
Support para até 32.768 dimensões por vetor
-
Recursos de pesquisa semântica e armazenamento em cache em tempo real
Use o MemoryDB nas seguintes situações:
-
Para aplicativos em tempo real que exigem latência ultrabaixa (menos de 10 ms)
-
Para cargas de trabalho de alto rendimento com milhões de solicitações por dia
-
Para casos de uso como mecanismos de recomendação em tempo real, cache semântico e detecção de anomalias
-
Para aplicativos que precisam de recursos de armazenamento de dados na memória e pesquisa vetorial
Para obter mais informações, consulte Pesquisa vetorial na documentação do MemoryDB.
Amazon Neptune Analytics
O Amazon Neptune Analytics é um mecanismo de análise gráfica que oferece recursos de pesquisa vetorial nativa, tornando-o ideal para casos de uso da Geração Aumentada de Recuperação de Gráficos (GraphRag). Ele combina pesquisa de similaridade vetorial com percursos gráficos e algoritmos.
Os principais recursos do Neptune Analytics incluem o seguinte:
-
Analise dezenas de bilhões de relacionamentos em segundos
-
Combine a pesquisa vetorial com algoritmos gráficos (localização de caminhos, detecção de comunidades, centralidade)
-
Support para aplicativos GraphRag com conhecimento topológico
-
Até 80 vezes mais rápido do que as soluções analíticas gráficas existentes
-
Integração com o Amazon Bedrock para GraphRag totalmente gerenciado
Use o Neptune Analytics nas seguintes situações:
-
Para aplicativos GraphRag que exigem gráficos de conhecimento com incorporações vetoriais
-
Para casos de uso que exigem a travessia de relacionamentos complexos ao lado da similaridade vetorial
-
Para aplicativos que exigem respostas explicáveis de IA com contexto de relacionamento
-
Para cenários como visualizações 360 de clientes, redes de detecção de fraudes e descoberta de conhecimento
Para obter mais informações, consulte a documentação do Amazon Neptune Analytics.
Amazon S3 Vectors
O Amazon S3 Vectors é o primeiro armazenamento de objetos em nuvem AWS com armazenamento vetorial nativo e recursos de consulta. Ele fornece armazenamento vetorial personalizado e com custo otimizado para aplicativos de IA que exigem grande escala.
Os principais recursos dos Amazon S3 Vectors incluem o seguinte:
-
Armazenamento para até 2 bilhões de vetores por índice com suporte para até 10.000 índices por compartimento vetorial
-
Latência de consulta abaixo de 100 ms otimizada para armazenamento de longo prazo e padrões de acesso pouco frequentes
-
Redução de custos de até 90% para operações vetoriais em comparação com bancos de dados vetoriais especializados
-
Arquitetura sem servidor com escalabilidade automática e durabilidade de 99,999999999% (11 9s)
Use os vetores do Amazon S3 nas seguintes situações:
-
Para aplicativos que exigem armazenamento de bilhões de vetores a um custo mínimo
-
Para cargas de trabalho que toleram latência de consulta inferior a um segundo (100 ms ou mais) em vez de menos de 10 ms
-
Para casos de uso de arquivamento e retenção de vetores a longo prazo
-
Para aplicações RAG com padrões de recuperação pouco frequentes
-
Para organizações que priorizam a economia de armazenamento em vez da latência ultrabaixa
O Amazon S3 Vectors se integra nativamente às bases de conhecimento do Amazon Bedrock e funciona bem em arquiteturas hierárquicas com o Amazon Service. OpenSearch Você pode usar o Amazon S3 Vectors para armazenamento a frio e usar o OpenSearch Service para consultas dinâmicas.
Para obter mais informações, consulte Como trabalhar com vetores e buckets vetoriais do S3 na documentação do Amazon S3.
Opção de serviço gerenciado
O Amazon Bedrock Knowledge Bases representa a abordagem AWS totalmente gerenciada para a implementação de bancos de dados vetoriais. A flexibilidade do serviço nas opções de armazenamento, combinada com seus recursos de gerenciamento automatizado, o torna particularmente valioso para organizações que buscam implementar o RAG sem gerenciar uma infraestrutura complexa.
Com o Amazon Bedrock Knowledge Bases, você pode criar, manter e consultar bases de conhecimento que aprimoram seus modelos básicos usando o RAG. Esse serviço simplifica o processo complexo de implementação do RAG gerenciando todo o pipeline de ingestão, vetorização e recuperação de dados.
Os principais benefícios das bases de conhecimento Amazon Bedrock incluem o seguinte:
-
Processamento de dados simplificado
-
Ingestão e fragmentação automáticas de dados
-
Extração de texto integrada de vários formatos de arquivo
-
Geração gerenciada de incorporações vetoriais
-
Extração e indexação automáticas de metadados
-
-
Implementação simplificada do RAG
-
Estratégias de recuperação pré-configuradas
-
Otimização automática da janela de contexto
-
Ajuste de relevância integrado
-
Recursos de pesquisa semântica prontos para uso
-
-
Segurança e governança
-
Controles integrados AWS Identity and Access Management (IAM)
-
Criptografia de dados em repouso e em trânsito
-
Suporte à VPC
-
Registro de auditoria com AWS CloudTrail
-
O Amazon Bedrock Knowledge Bases oferece suporte a várias opções de armazenamento de vetores, incluindo:
-
Amazon Aurora PostgreSQL com pgvector
-
Amazon Neptune Analytics
-
Amazon EMR Sem Servidor
-
Amazon S3 Vectors
-
Pinha
-
Nuvem empresarial Redis
Esse serviço gerenciado gerencia a ingestão, a vetorização e a recuperação automatizadas de dados. Isso simplifica as implementações do RAG.
Para obter informações detalhadas sobre cada loja de vetores compatível, consulte a documentação do Amazon Bedrock Knowledge Bases.
Escolhendo o banco de dados vetorial correto
Selecione seu banco de dados vetoriais com base nesses principais fatores de decisão:
-
Se você precisar de um banco de dados de documentos compatível com MongoDB com pesquisa vetorial, escolha Amazon DocumentDB. Isso é ideal quando seu aplicativo usa o APIs MongoDB e você deseja adicionar recursos de pesquisa semântica sem gerenciar uma infraestrutura vetorial separada.
-
Se você precisar de latência ultrabaixa para aplicativos em tempo real, escolha o Amazon MemoryDB. Isso fornece o desempenho de pesquisa vetorial mais rápido AWS com tempos de resposta abaixo de um milissegundo. É ideal para mecanismos de recomendação em tempo real e aplicações de alto rendimento.
-
Se você precisar de representações de conhecimento baseadas em gráficos com pesquisa vetorial, escolha o Amazon Neptune Analytics. Isso é melhor para aplicativos GraphRag que precisam atravessar relacionamentos complexos e realizar consultas baseadas em gráficos junto com pesquisas vetoriais, fornecendo respostas de IA explicáveis.
-
Se você precisar combinar consultas relacionais com pesquisa vetorial, escolha Amazon Aurora PostgreSQL com pgvector. Essa opção é ideal quando seu aplicativo exige operações SQL tradicionais e pesquisas de similaridade vetorial no mesmo banco de dados.
-
Se você precisar de consultas de alto rendimento com latência inferior a 10 ms, escolha o Amazon Service. OpenSearch Ele se destaca no tratamento de consultas de alta frequência e aplicativos em tempo real e inclui melhorias recentes na aceleração da GPU.
-
Se você precisar armazenar bilhões de vetores de forma econômica, escolha Amazon S3 Vectors. Essa opção oferece até 90% de economia de custos e é ideal para aplicativos com padrões de recuperação pouco frequentes (minutos a horas entre consultas) que podem tolerar latência abaixo de 100 ms.
-
Se você precisar de uma pesquisa de texto completo junto com a pesquisa vetorial, escolha o Amazon OpenSearch Service. Essa opção combina recursos poderosos de pesquisa de texto completo com pesquisa vetorial em uma única plataforma.