本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
向量搜尋
Amazon OpenSearch Service 中的向量搜尋可讓您使用機器學習內嵌而非傳統關鍵字比對來搜尋語意相似的內容。向量搜尋會將您的資料 (文字、影像、音訊等) 轉換為擷取內容語意意義的高維度數值向量 (內嵌)。當您執行搜尋時,OpenSearch 會將查詢的向量表示法與儲存的向量進行比較,以尋找最相似的項目。
向量搜尋包含下列重要元件。
- 向量欄位
-
OpenSearch 支援
knn_vector欄位類型,以存放具有可設定維度的密集向量 (最多 16,000 個)。 - 搜尋方法
-
-
k-NN (k 近鄰):尋找 k 最相似的向量
-
大約 k-NN:使用 HNSW (Hierarchical Navigable Small World) 等演算法,在大型資料集上更快速地搜尋
-
- 距離指標
-
支援各種相似性計算,包括:
-
歐幾里德距離
-
餘弦相似度
-
點產品
-
常用案例
向量搜尋支援下列常見使用案例。
-
語意搜尋:尋找具有類似意義的文件,而不只是比對關鍵字
-
建議系統:建議類似的產品、內容或使用者
-
影像搜尋:尋找視覺效果相似的影像
-
異常偵測:識別資料模式中的極端值
-
RAG (擷取增強生成):使用相關內容增強 LLM 回應
與機器學習整合
OpenSearch 與下列機器學習服務和模型整合:
-
Amazon Bedrock:用於使用基礎模型產生內嵌
-
Amazon SageMaker AI:適用於自訂 ML 模型部署
-
Hugging Face 模型:預先訓練的內嵌模型
-
自訂模型:您自己的訓練內嵌模型
透過向量搜尋,您可以建置複雜的 AI 驅動應用程式,了解內容和意義,遠遠超過傳統的文字比對功能。