向量搜尋

Amazon OpenSearch Service 中的向量搜尋可讓您使用機器學習內嵌而非傳統關鍵字比對來搜尋語意相似的內容。向量搜尋會將您的資料（文字、影像、音訊等）轉換為擷取內容語意意義的高維度數值向量（內嵌）。當您執行搜尋時，OpenSearch 會將查詢的向量表示法與儲存的向量進行比較，以尋找最相似的項目。

向量搜尋包含下列重要元件。

向量欄位

OpenSearch 支援 knn_vector 欄位類型，以存放具有可設定維度的密集向量（最多 16，000 個）。

搜尋方法

k-NN (k 近鄰）：尋找 k 最相似的向量
大約 k-NN：使用 HNSW (Hierarchical Navigable Small World) 等演算法，在大型資料集上更快速地搜尋

距離指標

支援各種相似性計算，包括：

歐幾里德距離
餘弦相似度
點產品

常用案例

向量搜尋支援下列常見使用案例。

語意搜尋：尋找具有類似意義的文件，而不只是比對關鍵字
建議系統：建議類似的產品、內容或使用者
影像搜尋：尋找視覺效果相似的影像
異常偵測：識別資料模式中的極端值
RAG （擷取增強生成）：使用相關內容增強 LLM 回應

與機器學習整合

OpenSearch 與下列機器學習服務和模型整合：

Amazon Bedrock：用於使用基礎模型產生內嵌
Amazon SageMaker AI：適用於自訂 ML 模型部署
Hugging Face 模型：預先訓練的內嵌模型
自訂模型：您自己的訓練內嵌模型

透過向量搜尋，您可以建置複雜的 AI 支援應用程式，了解內容和意義，遠遠超過傳統的文字比對功能。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

產生自然語言查詢

從 Amazon S3 向量匯入 OpenSearch Serverless