本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用您為知識庫建立的向量存放區的先決條件
若要存放轉換為文件的向量內嵌,請使用向量存放區。Amazon Bedrock 知識庫支援某些向量存放區的快速建立流程,因此,如果您偏好 Amazon Bedrock 自動在其中一個向量存放區中為您建立向量索引,請略過此先決條件並繼續 透過連線至 Amazon Bedrock 知識庫中的資料來源來建立知識庫。
如果您想要儲存二進位向量內嵌而非標準浮點 (float32) 向量內嵌,則必須使用支援二進位向量的向量存放區。
注意
Amazon OpenSearch Serverless 和 Amazon OpenSearch Managed 叢集是唯一支援儲存二進位向量的向量存放區。
您可以設定自己的支援向量存放區,為資料的向量內嵌表示法編製索引。您可以為下列資料建立欄位:
-
透過您選擇的內嵌模型,從資料來源中的文字產生的向量欄位。
-
從資料來源中的檔案擷取的文字區塊欄位。
-
Amazon Bedrock 管理的來源檔案中繼資料欄位。
-
(如果您使用 Amazon Aurora 資料庫,並想要設定中繼資料的篩選) 與來源檔案建立關聯的中繼資料欄位。如果您打算在其他向量存放區中設定篩選,則不需要設定這些欄位進行篩選。
您可以使用 KMS 金鑰加密第三方向量存放區。如需詳細資訊,請參閱知識庫資源的加密。
選取與向量存放區服務對應的標籤,您將用來建立向量索引。
注意
您選擇的內嵌模型和向量維度可能會影響可用的向量存放區選擇。如果您無法使用偏好的向量存放區,請選擇內嵌模型和向量維度的相容選項。
- Amazon OpenSearch Serverless
-
-
若要在 Amazon OpenSearch Serverless 中設定許可和建立向量搜尋集合 AWS Management Console,請遵循《Amazon OpenSearch Service 開發人員指南》中的使用向量搜尋集合的步驟 1 和 2。設定集合時,請注意下列考量事項:
-
為集合提供您選擇的名稱和描述。
-
若要將您的集合設為私有,請選取安全性區段的標準建立。然後,在網路存取設定區段中,選取 VPC 做為存取類型,然後選擇 VPC 端點。如需為 Amazon OpenSearch Serverless 集合設定 VPC 端點的詳細資訊,請參閱《Amazon OpenSearch Service 開發人員指南》中的使用介面端點 (AWS PrivateLink) 存取 Amazon OpenSearch Serverless。 OpenSearch
-
-
建立集合之後,請在建立知識庫時記下 的集合 ARN。
-
在左側導覽窗格中,選取無伺服器下的集合。然後選取向量搜尋集合。
-
選取索引索引標籤。然後選擇建立向量索引。
-
在向量索引詳細資訊區段中,在向量索引名稱欄位中輸入索引的名稱。
-
在向量欄位區段中,選擇新增向量欄位。Amazon Bedrock 會將資料來源的向量內嵌存放在此欄位。提供下列組態:
-
向量欄位名稱 – 提供欄位的名稱 (例如,
embeddings
)。 -
引擎 – 用於搜尋的向量引擎。選取失敗。
-
維度 — 向量中的維度數。請參閱下表,以判斷向量應包含多少維度:
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024、512 和 256 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
距離指標 — 用於測量向量之間相似性的指標。我們建議將 Euclidean 用於浮點向量內嵌。
-
-
展開中繼資料管理區段,並新增兩個欄位來設定向量索引,以存放知識庫可以使用向量擷取的其他中繼資料。下表說明要為每個欄位指定的欄位和值:
欄位描述 映射欄位 資料類型 可篩選 Amazon Bedrock 會封鎖資料中的原始文字,並將區塊存放在此欄位中。 您選擇的名稱 (例如 text
)字串 True Amazon Bedrock 會將與知識庫相關的中繼資料存放在此欄位中。 您選擇的名稱 (例如 bedrock-metadata
)字串 False -
建立知識庫時,請記下您為向量索引名稱、向量欄位名稱和中繼資料管理映射欄位名稱選擇的名稱。然後選擇 Create (建立)。
建立向量索引之後,您可以繼續建立知識庫。下表摘要說明您將輸入所記下每個資訊的位置。
欄位 知識庫設定 (主控台) 中的對應欄位 知識庫設定 (API) 中的對應欄位 描述 集合 ARN 集合 ARN collectionARN 向量搜尋集合的 Amazon Resource Name (ARN)。 向量索引名稱 向量索引名稱 vectorIndexName 向量索引的名稱。 向量欄位名稱 向量欄位 vectorField 存放資料來源向量內嵌的欄位名稱。 中繼資料管理 (第一個映射欄位) 文字欄位 textField 要從資料來源存放原始文字的欄位名稱。 中繼資料管理 (第二個映射欄位) Bedrock 受管中繼資料欄位 metadataField 存放 Amazon Bedrock 管理之中繼資料的欄位名稱。 如需在 Amazon OpenSearch Serverless 中設定向量存放區的詳細文件,請參閱《Amazon OpenSearch Service 開發人員指南》中的使用向量搜尋集合。
-
- Amazon OpenSearch Service Managed Clusters
-
重要
-
在 OpenSearch 受管叢集中使用任何網域資源之前,您需要設定特定 IAM 存取許可和政策。如需詳細資訊,請參閱搭配 Amazon Bedrock 知識庫使用 OpenSearch 受管叢集所需的先決條件和許可。
-
如果您遇到資料擷取失敗,可能表示 OpenSearch 網域容量不足。若要解決此問題,請透過佈建較高的 IOPS 和增加輸送量設定來增加網域的容量。如需詳細資訊,請參閱 Amazon OpenSearch Service 的操作最佳實務。
-
若要在 中的 OpenSearch 叢集中建立網域和向量索引 AWS Management Console,請遵循《Amazon OpenSearch Service 開發人員指南》中的建立和管理 OpenSearch Service 網域中所述的步驟。 OpenSearch
設定您的網域時,請注意下列考量事項:
-
為網域提供您選擇的名稱。
-
我們建議您使用輕鬆建立選項快速開始建立您的網域。
注意
此選項為您提供輸送量低的網域。如果您有較大的工作負載需要更高的輸送量,請選擇標準建立選項。您可以視需要稍後調整容量。使用此選項,您可以從最低容量開始,之後可視需要修改。
-
對於網路,您必須選擇公有存取。您的知識庫不支援 VPC 後方的 OpenSearch 網域。
-
對於版本,如果您使用的是二進位向量內嵌,Amazon Bedrock 知識庫需要 2.16 或更新版本的引擎版本。此外,建立 k-nn 索引需要 2.13 或更新版本。如需詳細資訊,請參閱《Amazon OpenSearch Service 開發人員指南》中的 K-NN 搜尋。
-
我們建議您使用雙堆疊模式。
-
我們建議您啟用精細存取控制來保護網域中的資料,並進一步控制授予知識庫服務角色存取 OpenSearch 網域和提出請求的許可。
-
將所有其他設定保留為預設值,然後選擇建立以建立您的網域。
-
-
建立網域之後,請按一下該網域,以便在建立知識庫時記下 的網域 ARN 和網域端點。
-
建立網域之後,您可以在 OpenSearch 儀表板上執行下列命令或使用 curl 命令來建立向量索引。如需詳細資訊,請參閱 OpenSearch 文件
。 執行 命令時:
-
提供向量欄位的名稱 (例如,
embeddings
)。 -
請確定用於搜尋的向量為 faiss。不支援 nmslib。
-
如需向量中的維度數量,請參閱下表,以判斷向量應包含多少維度:
注意
Titan V2 內嵌 - 文字模型支援多個維度。它也可以是 256 或 512。
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024、512 和 256 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
您可以新增兩個欄位來設定向量索引,以存放知識庫可以使用向量擷取的其他中繼資料。下表說明要為每個欄位指定的欄位和值。
欄位描述 映射欄位 Amazon Bedrock 會封鎖資料中的原始文字,並將區塊存放在此欄位中。 指定為 物件,例如 AMAZON_BEDROCK_TEXT_CHUNK
。Amazon Bedrock 會將與知識庫相關的中繼資料存放在此欄位中。 指定為 物件,例如 AMAZON_BEDROCK_METADATA
。
PUT /
<index-name>
{ "settings": { "index": { "knn": true } }, "mappings": { "properties": { "<vector-name>
": { "type": "knn_vector", "dimension":<embedding-dimension>
, "data_type": "binary", # Only needed for binary embeddings "space_type": "l2" | "hamming", # Use l2 for float embeddings and hamming for binary embeddings "method": { "name": "hnsw", "engine": "faiss", "parameters": { "ef_construction": 128, "m": 24 } } }, "AMAZON_BEDROCK_METADATA": { "type": "text", "index": "false" }, "AMAZON_BEDROCK_TEXT_CHUNK": { "type": "text", "index": "true" } } } } -
-
請記下網域 ARN 和端點,以及您在建立知識庫時為向量索引名稱、向量欄位名稱和中繼資料管理映射欄位名稱選擇的名稱。
建立向量索引之後,您可以繼續建立知識庫。下表摘要說明您將輸入所記下每個資訊的位置。
欄位 知識庫設定 (主控台) 中的對應欄位 知識庫設定 (API) 中的對應欄位 描述 網域 ARN 網域 ARN domainARN OpenSearch 域的 Amazon Resource Name (ARN)。 網域端點 網域端點 domainEndpoint 要連線至 OpenSearch 網域的端點。 向量索引名稱 向量索引名稱 vectorIndexName 向量索引的名稱。 向量欄位名稱 向量欄位 vectorField 存放資料來源向量內嵌的欄位名稱。 中繼資料管理 (第一個映射欄位) 文字欄位 textField 要從資料來源存放原始文字的欄位名稱。 中繼資料管理 (第二個映射欄位) Bedrock 受管中繼資料欄位 metadataField 存放 Amazon Bedrock 管理之中繼資料的欄位名稱。 -
- Amazon S3 Vectors
-
Amazon S3 Vectors 在 Amazon S3 中提供經濟實惠的向量儲存,可用於存放和查詢向量資料。它為大型向量資料集提供耐久且彈性的儲存,查詢效能不到一秒。Amazon S3 Vectors 最適合不常查詢工作負載,而且在擷取擴增產生 (RAG) 和語意搜尋應用程式中使用時,可協助降低成本。
重要
Amazon S3 Vectors 與 Amazon Bedrock 知識庫的整合處於預覽版本中,可能會有所變更。
Amazon S3 Vectors 引入了 S3 向量儲存貯體,您可以根據語意意義和相似性進行查詢。它可用來提供一秒的查詢回應時間,並降低成本,同時大規模儲存、存取和查詢向量資料,而無需佈建任何基礎設施。在向量儲存貯體中,您可以在向量索引中組織向量資料。您的向量儲存貯體可以有多個向量索引,每個向量索引可以容納數百萬個向量。如需詳細資訊,請參閱《Amazon S3 使用者指南》中的 Amazon S3 向量。 Amazon S3
注意
您可以在可使用 Amazon Bedrock 和 Amazon S3 Vectors 的所有 AWS 區域中建立 Amazon S3 Vectors 的知識庫。如需有關 Amazon S3 Vectors 區域可用性的資訊,請參閱《Amazon S3 使用者指南》中的 Amazon S3 Vectors。 Amazon S3
中繼資料支援
建立向量索引後,將向量資料新增至索引時,您可以將中繼資料做為索引鍵/值對連接至每個向量。根據預設,連接至向量的所有中繼資料都是可篩選的,並且可以用作相似性搜尋查詢中的篩選條件。可篩選的中繼資料可用來根據一組條件篩選傳入的查詢,例如日期、類別或使用者偏好設定。
您也可以在建立向量索引時,將中繼資料設定為不可篩選。Amazon S3 向量索引支援字串、布林值和數字類型。每個向量最多可支援 40 KB 的中繼資料。在此 40 KB 中繼資料中,每個向量的可篩選中繼資料最多可達 2 KB。可篩選的中繼資料空間可用於在建立知識庫之後存放內嵌項目。
如果中繼資料超過任何這些限制,則在建立向量索引時會導致錯誤。如需詳細資訊,請參閱《Amazon S3 使用者指南》中的 Amazon S3 向量。 Amazon S3
所需的許可
請確定您的 IAM 政策允許 Amazon Bedrock 存取 S3 向量儲存貯體中的向量索引。如需所需許可的詳細資訊,請參閱為 Amazon Bedrock 知識庫建立服務角色。
建立 S3 向量儲存貯體和索引
若要將 Amazon S3 Vectors 與知識庫搭配使用,您需要建立 S3 向量儲存貯體和向量索引。您可以使用 Amazon S3 主控台 AWS CLI或 AWS SDK 建立向量儲存貯體和索引。如需詳細說明,請參閱《Amazon S3 使用者指南》中的建立向量索引。
在 Amazon S3 主控台
中建立向量儲存貯體和索引時,請注意下列考量事項。 -
建立 S3 向量儲存貯體時,請注意下列考量事項。
-
提供唯一的向量儲存貯體名稱。
-
(選用) Amazon S3 會使用 Amazon S3 受管金鑰 (SSE-S3) 的預設伺服器端加密來自動加密資料。您可以選擇是否使用此預設加密,還是使用 AWS Key Management Service 金鑰 (SSE-KMS) 進行伺服器端加密。
注意
建立向量儲存貯體後,就無法變更加密類型。
如需step-by-step說明,請參閱使用 AWS KMS 金鑰加密。
-
-
建立 S3 向量儲存貯體之後,請在建立知識庫時記下向量儲存貯體的 Amazon Resource Name (ARN)。
-
選擇您建立的向量儲存貯體,然後建立向量索引。建立向量索引時,請注意下列考量事項。
-
向量索引名稱 – 提供 欄位的名稱 (例如
embeddings
)。 -
維度 – 向量中的維度數目。維度必須是介於 1 到 4096 之間的值。請參閱下表,根據您選取的內嵌模型,判斷向量應包含多少維度:
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024、512 和 256 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
注意
Amazon S3 Vectors 僅支援浮點內嵌。不支援二進位內嵌。
距離指標 — 用於測量向量之間相似性的指標。您可以使用 Cosine 或 Euclidean。
-
-
展開其他設定,並在不可篩選中繼資料欄位中提供任何不可篩選的中繼資料。
注意
如果您預期文字區塊超過 2 KB 中繼資料空間,建議您將文字欄位新增
AMAZON_BEDROCK_TEXT
為不可篩選的中繼資料金鑰。您的知識庫將使用此欄位來存放文字區塊。您最多可以設定 10 個不可篩選的中繼資料金鑰。選擇新增金鑰,然後新增
AMAZON_BEDROCK_TEXT
做為金鑰。 -
建立向量索引,並在建立知識庫時記下向量索引的 Amazon Resource Name (ARN)。
建立 S3 向量儲存貯體的知識庫
收集此資訊後,您可以繼續建立知識庫。使用 S3 向量儲存貯體建立知識庫時,您需要提供向量儲存貯體的 ARN 和向量索引。向量索引將存放從資料來源產生的內嵌。下表摘要說明您將輸入每個資訊的位置:
欄位 知識庫設定 (主控台) 中的對應欄位 知識庫設定 (API) 中的對應欄位 描述 向量儲存貯體 ARN S3 向量儲存貯體 ARN vectorBucketArn S3 向量儲存貯體的 Amazon Resource Name (ARN)。 向量索引 ARN S3 向量索引 ARN vectorIndexARN S3 向量儲存貯體向量索引的 Amazon Resource Name (ARN)。 -
- Amazon Aurora (RDS)
-
-
依照使用 Aurora PostgreSQL 做為知識庫中的步驟建立 Amazon Aurora 資料庫 (DB) 叢集、結構描述和資料表。建立資料表時,請使用下列資料欄和資料類型進行設定。您可以使用您喜歡的資料欄名稱,而不是下表所列的名稱。記下您選擇的資料欄名稱,以便您可以在知識庫設定期間提供這些資料欄名稱。
您必須先提供這些欄位,才能建立知識庫。建立知識庫後,不會更新它們。
重要
Aurora 叢集必須與為 Amazon Bedrock 建立知識庫 AWS 帳戶 的叢集位於相同的 中。
欄名稱 資料類型 知識庫設定 (主控台) 中的對應欄位 知識庫設定 (API) 中的對應欄位 描述 id UUID 主索引鍵 主索引鍵 primaryKeyField
包含每個記錄的唯一識別碼。 內嵌項目 向量 向量欄位 vectorField
包含資料來源的向量內嵌項目。 區塊 文字 文字欄位 textField
包含來自資料來源的原始文字區塊。 中繼資料 JSON Bedrock 受管中繼資料欄位 metadataField
包含執行來源屬性及啟用資料擷取和查詢所需的中繼資料 custom_metadata JSONB 自訂中繼資料欄位 customMetadataField
選用欄位,指出 Amazon Bedrock 將從資料來源寫入任何中繼資料檔案的所有資訊的欄。 -
您必須在資料欄向量和文字上為您的文字和內嵌欄位建立索引。如果您使用的是自訂中繼資料欄位,您也必須在此欄上建立 GIN 索引。GIN 索引可用來有效搜尋 jsonb 文件中的鍵值對,以進行中繼資料篩選。如需詳細資訊,請參閱 PostgreSQL 文件中的 jsonb 索引
。 欄名稱 在 上建立索引 是否為必要? 向量 CREATE INDEX ON bedrock_integration.bedrock_kb USING hnsw (embedding vector_cosine_ops);
是 text CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (to_tsvector('simple', chunks));
是 自訂中繼資料 CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (custom_metadata);
只有在您已建立自訂中繼資料資料欄時。 -
(選用) 如果您將中繼資料新增至檔案以進行篩選,建議您在自訂中繼資料欄位中提供資料欄名稱,將所有中繼資料存放在單一資料欄中。在資料擷取期間,此欄將填入來自資料來源的中繼資料檔案中的所有資訊。如果您選擇提供此欄位,則必須在此欄上建立 GIN 索引。
注意
如果您經常在數值中繼資料上使用範圍篩選條件,則若要最佳化效能,請為特定索引鍵建立索引。例如,如果您使用 等篩選條件
"lessThan": { "key": "year", "value": 1989 }
,請在year
索引鍵上建立表達式索引。如需詳細資訊,請參閱 PostgreSQL 文件中的表達式索引。 CREATE INDEX ON your_table ((custom_metadata->>'year')::double precision
或者,如果您不提供此欄位名稱,您可以為檔案中的每個中繼資料屬性建立資料欄,並指定資料類型 (文字、數字或布林值)。例如,如果您的資料來源中
genre
存在 屬性,您可以新增名為 的資料欄,genre
並將 指定text
為資料類型。在資料擷取期間,這些個別的資料欄會填入對應的屬性值。 -
遵循使用 Amazon Aurora 和 進行密碼管理中的步驟,為您的 Aurora AWS Secrets Manager 資料庫叢集設定 AWS Secrets Manager 秘密。
-
建立資料庫叢集並設定秘密之後,請注意下列資訊。
知識庫設定 (主控台) 中的欄位 知識庫設定 (API) 中的欄位 描述 Amazon Aurora 資料庫叢集 ARN resourceArn 資料庫叢集的 ARN。 資料庫名稱 databaseName 您資料庫的名稱 資料表名稱 tableName 資料庫叢集中的資料表名稱 秘密 ARN credentialsSecretArn 資料庫叢集之 AWS Secrets Manager 金鑰的 ARN
-
- Neptune Analytics graphs (GraphRAG)
-
-
若要在 中的 Neptune Analytics 中建立圖形和向量存放區 AWS Management Console,請遵循 Neptune Analytics 使用者指南中的 Neptune Analytics 中的向量索引中所述的步驟。
注意
若要使用 Neptune GraphRAG,請使用向量搜尋索引建立空的 Neptune Analytics 圖形。向量搜尋索引只能在建立圖形時建立。當您在主控台中建立 Neptune Analytics 圖形時,您可以在程序即將結束時的向量搜尋設定下指定索引維度。
建立圖形時,請注意下列考量事項:
-
為圖形提供您選擇的名稱。
-
在資料來源下,選擇建立空白圖形,然後指定要配置的 m-NCUs 數目。每個 m-NCU 都有大約 1 GiB 的記憶體容量和對應的運算和聯網。
注意
您可以稍後修改圖形的容量。我們建議您從最小執行個體開始,然後視需要選擇不同的執行個體。
-
您可以保留預設的網路連線設定。Amazon Bedrock 將建立與 Neptune Analytics 圖形的網路連線,您可以將知識庫與之建立關聯。您不需要為圖形設定公有連線或私有端點。
-
在向量搜尋設定下,選擇使用向量維度,並指定每個向量中的維度。
注意
每個向量中的維度必須與內嵌模型中的向量維度相符。請參閱下表,以判斷向量應包含多少維度:
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024、512 和 256 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
將所有其他設定保留為預設值並建立圖形。
-
-
建立圖形後,按一下該圖形,即可在建立知識庫時記下 的資源 ARN 和向量維度。在 Amazon Bedrock 中選擇內嵌模型時,請務必選擇與您在 Neptune Analytics 圖形上設定的向量維度具有相同維度的模型。
建立向量索引後,您可以繼續建立知識庫。下表摘要說明您將輸入所記下每個資訊的位置。
欄位 知識庫設定 (主控台) 中的對應欄位 知識庫設定 (API) 中的對應欄位 描述 圖形 ARN Neptune Analytics 圖形 ARN graphARN Neptune Analytics 圖形的 Amazon Resource Name (ARN)。 中繼資料管理 (第一個映射欄位) 文字欄位名稱 textField 要從資料來源存放原始文字的欄位名稱。您可以為此欄位提供任何值,例如文字。 中繼資料管理 (第二個映射欄位) Bedrock 受管中繼資料欄位 metadataField 存放 Amazon Bedrock 管理之中繼資料的欄位名稱。您可以為此欄位提供任何值,例如中繼資料。 -
- Pinecone
-
注意
如果您使用 Pinecone,即表示您同意授權 代表您 AWS 存取指定的第三方來源,以便為您提供向量存放區服務。您有責任遵守適用於從第三方服務使用和傳輸資料的任何第三方條款。
如需在 中設定向量存放區的詳細文件Pinecone,請參閱 Pinecone 作為 Amazon Bedrock 的知識庫
。 設定向量存放區時,請注意下列資訊,以便在建立知識庫時填寫這些資訊:
-
端點 URL – 索引管理頁面的端點 URL。
-
登入資料秘密 ARN – 您在 中建立的秘密的 Amazon Resource Name (ARN) AWS Secrets Manager ,其中包含資料庫使用者的使用者名稱和密碼。
-
(選用) 登入資料秘密 ARN 的客戶受管 KMS 金鑰 – 如果您加密登入資料秘密 ARN,請提供 KMS 金鑰,以便 Amazon Bedrock 可以將其解密。
-
命名空間 – (選用) 用於將新資料寫入資料庫的命名空間。如需詳細資訊,請參閱使用命名空間
。
建立Pinecone索引時,您必須提供其他組態:
-
文字欄位名稱 – Amazon Bedrock 應存放原始區塊文字的欄位名稱。
-
中繼資料欄位名稱 – Amazon Bedrock 應存放來源屬性中繼資料的欄位名稱。
若要存取您的Pinecone索引,您必須透過 將 Pinecone API 金鑰提供給 Amazon Bedrock AWS Secrets Manager。
為您的Pinecone組態設定秘密
-
請依照建立 AWS Secrets Manager 秘密中的步驟,將金鑰設定為
apiKey
,並將值設定為 API 金鑰以存取您的Pinecone索引。 -
若要找到您的 API 金鑰,請打開您的 Pinecone 主控台
,然後選擇 API 金鑰。 -
建立秘密之後,請記下 KMS 金鑰的 ARN。
-
依照 解密包含知識庫之向量存放區的 AWS Secrets Manager 秘密的許可 中的步驟將許可權附加至您的服務角色,以解密 KMS 金鑰的 ARN。
-
稍後,當您建立知識庫時,請在憑證機密 ARN 欄位中輸入 ARN。
-
- Redis Enterprise Cloud
-
注意
如果您使用 Redis Enterprise Cloud,即表示您同意授權 代表您 AWS 存取指定的第三方來源,以便為您提供向量存放區服務。您有責任遵守適用於使用和傳輸第三方服務之資料的任何第三方條款。
如需在 中設定向量存放區的詳細文件Redis Enterprise Cloud,請參閱Redis Enterprise Cloud與 Amazon Bedrock 整合
。 設定向量存放區時,請注意下列資訊,以便在建立知識庫時填寫這些資訊:
-
端點 URL – 資料庫的公有端點 URL。
-
向量索引名稱 – 資料庫的向量索引名稱。
-
向量欄位 – 存放向量內嵌的欄位名稱。請參閱下表,判斷向量應包含多少維度。
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024、512 和 256 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
文字欄位 – Amazon Bedrock 存放原始文字區塊的欄位名稱。
-
Bedrock 受管中繼資料欄位 – Amazon Bedrock 存放與知識庫相關之中繼資料的欄位名稱。
若要存取Redis Enterprise Cloud叢集,您必須透過 將Redis Enterprise Cloud安全組態提供給 Amazon Bedrock AWS Secrets Manager。
為您的Redis Enterprise Cloud組態設定秘密
-
遵循 Transport Layer Security (TLS)
中的步驟,啟用 TLS 以將您的資料庫與 Amazon Bedrock 搭配使用。 -
請遵循建立 AWS Secrets Manager 秘密中的步驟。使用秘密中Redis Enterprise Cloud組態的適當值設定下列金鑰:
-
username
– 存取Redis Enterprise Cloud資料庫的使用者名稱。若要尋找您的使用者名稱,請查看 Redis 主控台內資料庫的安全性區段下方。 -
password
– 存取Redis Enterprise Cloud資料庫的密碼。若要尋找您的使用者名,請查看 Redis 主控台內資料庫的安全性區段下方。 -
serverCertificate
— 來自 Redis 雲端憑證授權單位的憑證內容。依照下載憑證的步驟,從 Redis 管理主控台下載伺服器憑證。 -
clientPrivateKey
— 來自 Redis 雲端憑證授權單位之憑證的私密金鑰。依照下載憑證的步驟,從 Redis 管理主控台下載伺服器憑證。 -
clientCertificate
— Redis 雲端憑證授權單位的憑證公有金鑰。依照下載憑證的步驟,從 Redis 管理主控台下載伺服器憑證。
-
-
建立秘密之後,請記下其 ARN。稍後,當您建立知識庫時,請在憑證機密 ARN 欄位中輸入 ARN。
-
- MongoDB Atlas
-
注意
如果您使用 MongoDB Atlas,即表示您同意授權 代表您 AWS 存取指定的第三方來源,以便為您提供向量存放區服務。您有責任遵守適用於從第三方服務使用和傳輸資料的任何第三方條款。
如需在 MongoDB Atlas 中設定向量存放區的詳細文件,請參閱使用 MongoDB Atlas 和 Amazon Bedrock 啟動全受管 RAG 工作流程
。 當您設定向量存放區時,請注意建立知識庫時要新增的下列資訊:
-
端點 URL – MongoDB Atlas 叢集的端點 URL。
-
資料庫名稱 – MongoDB Atlas 叢集中的資料庫名稱。
-
集合名稱 – 資料庫中集合的名稱。
-
登入資料秘密 ARN – 您在 中建立的秘密的 Amazon Resource Name (ARN) AWS Secrets Manager ,其中包含 MongoDB Atlas 叢集中資料庫使用者的使用者名稱和密碼。
-
(選用) 登入資料秘密 ARN 的客戶受管 KMS 金鑰 – 如果您加密登入資料秘密 ARN,請提供 KMS 金鑰,以便 Amazon Bedrock 可以將其解密。
建立 MongoDB Atlas 索引時,您必須提供欄位映射的其他組態:
-
向量索引名稱 – 集合上 MongoDB Atlas 向量搜尋索引的名稱。
-
向量欄位名稱 – Amazon Bedrock 應存放向量內嵌的欄位名稱。
-
文字欄位名稱 – Amazon Bedrock 應存放原始區塊文字的欄位名稱。
-
中繼資料欄位名稱 – Amazon Bedrock 應存放來源屬性中繼資料的欄位名稱。
-
(選用) 文字搜尋索引名稱 – 集合上的 MongoDB Atlas 搜尋索引名稱。
(選用) 若要讓 Amazon Bedrock 連接至 MongoDB Atlas 叢集 AWS PrivateLink,請參閱使用 Amazon Bedrock 搭配 MongoDB Atlas 的 RAG 工作流程
。 -