Pesquisa vetorial - OpenSearch Serviço Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Pesquisa vetorial

A pesquisa vetorial no Amazon OpenSearch Service permite que você pesquise conteúdo semanticamente semelhante usando incorporações de aprendizado de máquina em vez da correspondência tradicional de palavras-chave. A pesquisa vetorial converte os dados (texto, imagens, áudio etc.) em vetores numéricos de alta dimensão (incorporações) que capturam o significado semântico do conteúdo. Ao realizar uma pesquisa, OpenSearch compara a representação vetorial da sua consulta com os vetores armazenados para encontrar os itens mais semelhantes.

A pesquisa vetorial inclui os seguintes componentes principais.

Campos vetoriais

OpenSearch suporta o tipo de knn_vector campo para armazenar vetores densos com dimensões configuráveis (até 16.000).

Métodos de pesquisa
  • k-NN (vizinhos mais próximos de k): encontra os k vetores mais semelhantes

  • k-NN aproximado: usa algoritmos como o HNSW (Hierarchical Navigable Small World) para pesquisas mais rápidas em grandes conjuntos de dados

Métricas de distância

É compatível com vários cálculos de similaridade, incluindo:

  • Distância euclidiana

  • Similaridade de cossenos

  • Produto escalar

Casos de uso comuns

A pesquisa vetorial aceita os seguintes casos de uso comuns.

  • Pesquisa semântica: encontrar documentos com significado semelhante, não apenas palavras-chave correspondentes

  • Sistemas de recomendação: sugerir produtos, conteúdos ou usuários semelhantes

  • Pesquisa de imagens: encontrar imagens visualmente semelhantes

  • Detecção de anomalias: identificar valores discrepantes em padrões de dados

  • RAG (Retrieval Augmented Generation): aprimorar as respostas do LLM com contexto relevante

Integração com machine learning

OpenSearch se integra aos seguintes serviços e modelos de aprendizado de máquina:

  • Amazon Bedrock: para gerar incorporações usando modelos básicos

  • Amazon SageMaker AI: para implantação de modelo de ML personalizado

  • Modelos Hugging Face: modelos de incorporação pré-treinados

  • Modelos personalizados: seus próprios modelos de incorporação treinados

Com a pesquisa vetorial, você pode criar aplicativos sofisticados baseados em IA que entendem o contexto e o significado, indo muito além dos recursos tradicionais de correspondência de texto.