Opções individuais de banco de dados vetoriais Opção de serviço gerenciado Escolhendo o banco de dados vetorial correto

Opções de banco de dados vetoriais

AWS oferece uma ampla variedade de soluções de banco de dados vetoriais para dar suporte a diferentes casos de uso e requisitos em aplicativos generativos de IA. Essas opções podem ser amplamente categorizadas em serviços de banco de dados individuais e ofertas de serviços gerenciados, cada uma com características e vantagens distintas. Compreender essas opções é crucial para organizações que desejam implementar recursos de pesquisa vetorial de forma eficaz, mantendo o desempenho, a escalabilidade e a eficiência de custos ideais.

Para obter mais informações sobre soluções de banco de dados vetoriais, consulte as seções a seguir:

Opções individuais de banco de dados vetoriais
Opção de serviço gerenciado
Escolhendo o banco de dados vetorial correto

Opções individuais de banco de dados vetoriais

As opções individuais de banco de dados vetoriais AWS incluem Amazon Kendra, Amazon Service, OpenSearch Amazon RDS para PostgreSQL com pgvector, Amazon MemoryDB, Amazon DocumentDB, Amazon Neptune Analytics e Amazon S3 Vector. (Uma extensão de código aberto, o pgvector adiciona a capacidade de armazenar e pesquisar incorporações vetoriais geradas por ML.) Essas soluções oferecem abordagens diferentes para a pesquisa vetorial, permitindo que as organizações escolham com base em sua infraestrutura existente, requisitos técnicos e casos de uso específicos.

Amazon Kendra

O Amazon Kendra é um serviço de pesquisa inteligente de nível corporativo que usa processamento de linguagem natural e algoritmos avançados de aprendizado de máquina para retornar respostas específicas às perguntas de pesquisa de seus dados. O Amazon Kendra simplifica a implementação da funcionalidade de pesquisa, tornando-o uma solução de back-end eficaz para aplicativos generativos de IA.

Outros recursos importantes do Amazon Kendra incluem o seguinte:

Conexões nativas com mais de 40 fontes de dados
Recursos integrados de preparação de dados
Configuração rápida que não requer profundo conhecimento técnico

Os benefícios do Amazon Kendra incluem o seguinte

Processamento automatizado de dados (fragmentação, ingestão, recuperação)
Opções poderosas de personalização:
Acesso programático simples por meio do AWS SDK para Python (Boto3)

Para obter mais informações, consulte Benefícios do Amazon Kendra na documentação do Amazon Kendra.

OpenSearch Serviço Amazon

O Amazon OpenSearch Service é um serviço gerenciado que ajuda você a implantar, operar e escalar clusters de OpenSearch serviços no Nuvem AWS.

Os principais recursos do OpenSearch Serviço incluem o seguinte:

Mecanismo de pesquisa e análise de código aberto
Arquitetura distribuída
Processamento de dados em tempo real

Algumas vantagens de usar o OpenSearch Serviço incluem o seguinte:

Escalabilidade horizontal
RESTful Suporte à API
Lida com dados estruturados e não estruturados
Análise de dados em tempo real
Adequado para vários tamanhos de implantação

Para obter mais informações, consulte Recursos do Amazon OpenSearch Service na documentação do OpenSearch serviço.

Amazon RDS para PostgreSQL com pgvector

O Amazon RDS for PostgreSQL com pgvector AWS combina o serviço de banco de dados relacional gerenciado com a extensão de processamento vetorial do PostgreSQL. Essa combinação permite que as organizações armazenem e consultem vetores de alta dimensão enquanto mantêm o Amazon RDS. A solução é particularmente adequada para aplicativos generativos de IA que exigem operações vetoriais em tempo real sem a sobrecarga de gerenciar a infraestrutura do banco de dados.

Os principais benefícios do Amazon RDS for PostgreSQL com pgvector incluem o seguinte:

Alta disponibilidade
Failover automático
Econômico () pay-per-use
Monitoramento integrado
Integração de dados vetoriais em tempo real

Para obter mais informações, consulte Vantagens do Amazon RDS na documentação do Amazon RDS.

Amazon DocumentDB

O Amazon DocumentDB (com compatibilidade com o MongoDB) é um banco de dados de documentos que oferece recursos de pesquisa vetorial nativa na versão 5.0 e posterior. Ele combina a flexibilidade do armazenamento de documentos baseado em JSON com a pesquisa vetorial, suportando os métodos de indexação hierárquica navegável de pequeno mundo (HNSW) e Inverted File Flat (). IVFFlat

Os principais recursos do Amazon DocumentDB incluem o seguinte:

Armazene e indexe vetores de até 2.000 dimensões (até 16.000 dimensões sem indexação)
Tempos de resposta em milissegundos para pesquisas de similaridade vetorial
Support para métricas de distância de produtos euclidianos, cossenos e pontos
Integração perfeita com aplicativos existentes compatíveis com MongoDB

Use o Amazon DocumentDB nas seguintes situações:

Para aplicativos que já estão usando o APIs MongoDB e que precisam de recursos de pesquisa vetorial
Para casos de uso que exigem estruturas flexíveis de dados de documentos combinadas com pesquisa semântica
Para cenários que precisam tanto de consultas tradicionais de documentos quanto de pesquisas por similaridade vetorial
Para aplicativos que fornecem recomendações de produtos, personalização, assistentes de bate-papo e detecção de fraudes

Para obter mais informações, consulte Pesquisa vetorial para Amazon DocumentDB na documentação do Amazon DocumentDB.

Amazon MemoryDB

O Amazon MemoryDB é um banco de dados em memória compatível com Redis que oferece o desempenho de pesquisa vetorial mais rápido entre os bancos de dados vetoriais mais populares. AWS Ele fornece latências de consulta inferiores a um milissegundo com durabilidade de zona de disponibilidade múltipla.

Os principais recursos do MemoryDB incluem o seguinte:

Armazene dados de aplicativos e milhões de vetores em um único banco de dados
Tempos de resposta de consulta e atualização de um dígito em milissegundos
As maiores taxas de recall com o desempenho mais rápido em AWS
Support para até 32.768 dimensões por vetor
Recursos de pesquisa semântica e armazenamento em cache em tempo real

Use o MemoryDB nas seguintes situações:

Para aplicativos em tempo real que exigem latência ultrabaixa (menos de 10 ms)
Para cargas de trabalho de alto rendimento com milhões de solicitações por dia
Para casos de uso como mecanismos de recomendação em tempo real, cache semântico e detecção de anomalias
Para aplicativos que precisam de recursos de armazenamento de dados na memória e pesquisa vetorial

Para obter mais informações, consulte Pesquisa vetorial na documentação do MemoryDB.

Amazon Neptune Analytics

O Amazon Neptune Analytics é um mecanismo de análise gráfica que oferece recursos de pesquisa vetorial nativa, tornando-o ideal para casos de uso da Geração Aumentada de Recuperação de Gráficos (GraphRag). Ele combina pesquisa de similaridade vetorial com percursos gráficos e algoritmos.

Os principais recursos do Neptune Analytics incluem o seguinte:

Analise dezenas de bilhões de relacionamentos em segundos
Combine a pesquisa vetorial com algoritmos gráficos (localização de caminhos, detecção de comunidades, centralidade)
Support para aplicativos GraphRag com conhecimento topológico
Até 80 vezes mais rápido do que as soluções analíticas gráficas existentes
Integração com o Amazon Bedrock para GraphRag totalmente gerenciado

Use o Neptune Analytics nas seguintes situações:

Para aplicativos GraphRag que exigem gráficos de conhecimento com incorporações vetoriais
Para casos de uso que exigem a travessia de relacionamentos complexos ao lado da similaridade vetorial
Para aplicativos que exigem respostas explicáveis de IA com contexto de relacionamento
Para cenários como visualizações 360 de clientes, redes de detecção de fraudes e descoberta de conhecimento

Para obter mais informações, consulte a documentação do Amazon Neptune Analytics.

Amazon S3 Vectors

O Amazon S3 Vectors é o primeiro armazenamento de objetos em nuvem AWS com armazenamento vetorial nativo e recursos de consulta. Ele fornece armazenamento vetorial personalizado e com custo otimizado para aplicativos de IA que exigem grande escala.

Os principais recursos dos Amazon S3 Vectors incluem o seguinte:

Armazenamento para até 2 bilhões de vetores por índice com suporte para até 10.000 índices por compartimento vetorial
Latência de consulta abaixo de 100 ms otimizada para armazenamento de longo prazo e padrões de acesso pouco frequentes
Redução de custos de até 90% para operações vetoriais em comparação com bancos de dados vetoriais especializados
Arquitetura sem servidor com escalabilidade automática e durabilidade de 99,999999999% (11 9s)

Use os vetores do Amazon S3 nas seguintes situações:

Para aplicativos que exigem armazenamento de bilhões de vetores a um custo mínimo
Para cargas de trabalho que toleram latência de consulta inferior a um segundo (100 ms ou mais) em vez de menos de 10 ms
Para casos de uso de arquivamento e retenção de vetores a longo prazo
Para aplicações RAG com padrões de recuperação pouco frequentes
Para organizações que priorizam a economia de armazenamento em vez da latência ultrabaixa

O Amazon S3 Vectors se integra nativamente às bases de conhecimento do Amazon Bedrock e funciona bem em arquiteturas hierárquicas com o Amazon Service. OpenSearch Você pode usar o Amazon S3 Vectors para armazenamento a frio e usar o OpenSearch Service para consultas dinâmicas.

Para obter mais informações, consulte Como trabalhar com vetores e buckets vetoriais do S3 na documentação do Amazon S3.

Opção de serviço gerenciado

O Amazon Bedrock Knowledge Bases representa a abordagem AWS totalmente gerenciada para a implementação de bancos de dados vetoriais. A flexibilidade do serviço nas opções de armazenamento, combinada com seus recursos de gerenciamento automatizado, o torna particularmente valioso para organizações que buscam implementar o RAG sem gerenciar uma infraestrutura complexa.

Com o Amazon Bedrock Knowledge Bases, você pode criar, manter e consultar bases de conhecimento que aprimoram seus modelos básicos usando o RAG. Esse serviço simplifica o processo complexo de implementação do RAG gerenciando todo o pipeline de ingestão, vetorização e recuperação de dados.

Os principais benefícios das bases de conhecimento Amazon Bedrock incluem o seguinte:

Processamento de dados simplificado
- Ingestão e fragmentação automáticas de dados
- Extração de texto integrada de vários formatos de arquivo
- Geração gerenciada de incorporações vetoriais
- Extração e indexação automáticas de metadados
Implementação simplificada do RAG
- Estratégias de recuperação pré-configuradas
- Otimização automática da janela de contexto
- Ajuste de relevância integrado
- Recursos de pesquisa semântica prontos para uso
Segurança e governança
- Controles integrados AWS Identity and Access Management (IAM)
- Criptografia de dados em repouso e em trânsito
- Suporte à VPC
- Registro de auditoria com AWS CloudTrail

O Amazon Bedrock Knowledge Bases oferece suporte a várias opções de armazenamento de vetores, incluindo:

Amazon Aurora PostgreSQL com pgvector
Amazon Neptune Analytics
Amazon EMR Sem Servidor
Amazon S3 Vectors
Pinha
Nuvem empresarial Redis

Esse serviço gerenciado gerencia a ingestão, a vetorização e a recuperação automatizadas de dados. Isso simplifica as implementações do RAG.

Para obter informações detalhadas sobre cada loja de vetores compatível, consulte a documentação do Amazon Bedrock Knowledge Bases.

Escolhendo o banco de dados vetorial correto

Selecione seu banco de dados vetoriais com base nesses principais fatores de decisão:

Se você precisar de um banco de dados de documentos compatível com MongoDB com pesquisa vetorial, escolha Amazon DocumentDB. Isso é ideal quando seu aplicativo usa o APIs MongoDB e você deseja adicionar recursos de pesquisa semântica sem gerenciar uma infraestrutura vetorial separada.
Se você precisar de latência ultrabaixa para aplicativos em tempo real, escolha o Amazon MemoryDB. Isso fornece o desempenho de pesquisa vetorial mais rápido AWS com tempos de resposta abaixo de um milissegundo. É ideal para mecanismos de recomendação em tempo real e aplicações de alto rendimento.
Se você precisar de representações de conhecimento baseadas em gráficos com pesquisa vetorial, escolha o Amazon Neptune Analytics. Isso é melhor para aplicativos GraphRag que precisam atravessar relacionamentos complexos e realizar consultas baseadas em gráficos junto com pesquisas vetoriais, fornecendo respostas de IA explicáveis.
Se você precisar combinar consultas relacionais com pesquisa vetorial, escolha Amazon Aurora PostgreSQL com pgvector. Essa opção é ideal quando seu aplicativo exige operações SQL tradicionais e pesquisas de similaridade vetorial no mesmo banco de dados.
Se você precisar de consultas de alto rendimento com latência inferior a 10 ms, escolha o Amazon Service. OpenSearch Ele se destaca no tratamento de consultas de alta frequência e aplicativos em tempo real e inclui melhorias recentes na aceleração da GPU.
Se você precisar armazenar bilhões de vetores de forma econômica, escolha Amazon S3 Vectors. Essa opção oferece até 90% de economia de custos e é ideal para aplicativos com padrões de recuperação pouco frequentes (minutos a horas entre consultas) que podem tolerar latência abaixo de 100 ms.
Se você precisar de uma pesquisa de texto completo junto com a pesquisa vetorial, escolha o Amazon OpenSearch Service. Essa opção combina recursos poderosos de pesquisa de texto completo com pesquisa vetorial em uma única plataforma.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Visão geral dos bancos de dados vetoriais

Comparação de bancos de dados vetoriais