View a markdown version of this page

矢量数据库概述 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

矢量数据库概述

矢量数据库是一种专门的系统,可以有效地存储和查询高维向量。这些数据库是检索增强生成 (RAG) 应用程序的基础。

矢量数据库通过以下方式处理数据转换和存储:

  • 使用嵌入模型将对象(例如音频、图像和文本文件)转换为矢量。

  • 向量以专门的数据格式存储。

  • 矢量数据库可实现快速相似度搜索。

与传统数据库相比,矢量数据库具有多项关键优势,因此特别适合应对现代数据挑战。它们专门针对向量运算进行了优化,可以高效处理高维数据。他们还专门研究传统数据库难以应对的相似度搜索。除了这些核心功能外,矢量数据库还旨在满足机器学习和生成式人工智能应用不断变化的需求。他们擅长大规模矢量存储,并使用分布式计算来平衡多个节点之间的工作负载。随着数据量的增长,这提供了可扩展性和性能。

下图显示了 RAG 的实现:

  1. 诸如文档或文本文件之类的内容作为原始数据输入到嵌入模型中进行处理。 PDFs

  2. 嵌入模型将原始数据转换为数字向量,这些向量表示内容的语义含义。

  3. 生成的向量嵌入存储在矢量数据库中,该数据库针对高维向量的存储和检索进行了优化。

  4. 应用程序现在可以查询矢量数据库,以响应语义搜索和内容推荐等用例。

嵌入模型将内容转换为存储在矢量数据库中的矢量嵌入以响应查询。

为RAG解决方案选择不合适的矢量数据库可能会导致重大的困难和局限性,包括以下几点:

  • 查询性能不佳

  • 可扩展性瓶颈

  • 数据摄取面临的挑战

  • 缺少高级功能,例如筛选和排名

  • 与其他系统的集成困难

  • 持久性和耐久性问题

  • 有多个用户的环境中的并发性和一致性问题

  • 更高的许可成本或供应商锁定

  • 社区支持和资源有限

  • 潜在的安全和合规风险