

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Visão geral dos bancos de dados vetoriais
<a name="vector-databases"></a>

Um banco de dados vetoriais é um sistema especializado que armazena e consulta vetores de alta dimensão com eficiência. Esses bancos de dados são fundamentais para aplicativos de Retrieval Augmented Generation (RAG).

Os bancos de dados vetoriais lidam com a conversão e o armazenamento de dados das seguintes maneiras:
+ Objetos (como arquivos de áudio, imagens e texto) são convertidos em vetores usando modelos de incorporação.
+ Os vetores são armazenados em formatos de dados especializados.
+ Os bancos de dados vetoriais permitem pesquisas rápidas por similaridade.

Os bancos de dados vetoriais oferecem várias vantagens importantes em relação aos bancos de dados tradicionais, o que os torna particularmente adequados para os desafios de dados modernos. Eles são especificamente otimizados para operações vetoriais e lidam com dados de alta dimensão com eficiência. Eles também se especializam em pesquisas por similaridade que os bancos de dados tradicionais enfrentam dificuldades. Além desses recursos principais, os bancos de dados vetoriais são criados para atender às crescentes demandas dos aplicativos de ML e IA generativa. Eles se destacam no armazenamento vetorial em grande escala e usam a computação distribuída para equilibrar as cargas de trabalho em vários nós. Isso fornece escalabilidade e desempenho à medida que os volumes de dados aumentam.

O diagrama a seguir mostra uma implementação do RAG:

1. O conteúdo, como documentos ou arquivos de texto, é inserido no modelo de incorporação como dados brutos para processamento. PDFs

1. O modelo de incorporação transforma os dados brutos em vetores numéricos, que representam o significado semântico do conteúdo.

1. As incorporações vetoriais geradas são armazenadas em um banco de dados vetoriais otimizado para o armazenamento e a recuperação de vetores de alta dimensão.

1. Agora, os aplicativos podem consultar o banco de dados vetoriais em resposta a casos de uso, como pesquisa semântica e recomendação de conteúdo.

![O modelo de incorporação converte conteúdo em incorporações vetoriais armazenadas no banco de dados vetoriais para responder às consultas.](http://docs.aws.amazon.com/pt_br/prescriptive-guidance/latest/choosing-an-aws-vector-database-for-rag-use-cases/images/s3-model.png)


A escolha de um banco de dados vetorial inadequado para uma solução RAG pode levar a dificuldades e limitações significativas, incluindo as seguintes: 
+ Baixo desempenho da consulta
+ Gargalos de escalabilidade
+ Desafios de ingestão de dados
+ Falta de recursos avançados, como filtragem e classificação
+ Dificuldades de integração com outros sistemas
+ Preocupações com persistência e durabilidade
+ Problemas de simultaneidade e consistência em ambientes com vários usuários
+ Custos de licenciamento mais altos ou dependência de fornecedor
+ Suporte e recursos comunitários limitados 
+ Riscos potenciais de segurança e conformidade