S3 Vectors 最佳實務

Amazon S3 Vectors 提供專用、成本最佳化的向量儲存，供啟用 AI 的應用程式使用，並對儲存在 Amazon S3 中的內容進行語義搜尋。S3 Vectors 旨在為儲存向量資料集提供 S3 層級彈性和耐久性，為冷查詢提供低於一秒的查詢效能，為暖查詢提供低至 100 毫秒的查詢效能，非常適合需要建置和增長向量索引的應用程式。憑藉 S3 Vectors，您可以使用一組專用的 API 操作，在向量資料上儲存、存取和執行相似度查詢，無需佈建任何基礎設施。如需詳細資訊，請參閱使用 S3 Vectors 和向量儲存貯體。

為了確保從 S3 Vectors 獲得最大利益，我們建議您執行以下最佳實務。

插入和刪除向量

您的應用程式可以實現每個向量索引每秒最多一千個 PutVectors 或 DeleteVectors 請求，也可以插入或刪除每個向量索引每秒最多兩千五百個向量，以先達到限制為準。如果您超出請求率，可能會遇到 429 TooManyRequestsException 錯誤。

為了最佳化成本，我們建議大量插入和刪除向量，每個 API 請求的批次大小上限為 500 個向量。如果您的工作負載需要較小的批次，您最多可以傳送每秒 1，000 個請求的並行請求。若要達到每秒 2，500 個向量的最大輸送量，您可以傳送每秒 5 個批次，每個批次 500 個向量，或每秒 1，000 個批次，每個平均 2.5 個向量。

在 S3 向量索引中存取和查詢向量

您的應用程式可以達到每個 S3 向量索引每秒數百個 QueryVectors、GetVectors 或 ListVectors 請求。如果您超出請求率，可能會遇到 429 TooManyRequestsException 錯誤。建議您使用重試機制，並將應用程式設定為傳送較少請求數。

跨向量索引擴展

為了改善每個向量索引的查詢效能，請考量將您的應用程式設定為盡可能將向量分成多個向量索引。例如，若您有多租用戶工作負載，且應用程式會個別查詢每個租用戶，請考量將每個租用戶的向量儲存在個別的向量索引中。如需詳細資訊，請參閱向量索引。

實作具有單獨向量索引的多租用戶

藉由使用每個租用戶的單一向量索引來組織向量資料，即可實現多租用戶。您可以使用 IAM 和儲存貯體政策，限制每個租用戶只能存取其指定的向量索引。此方法有助於維護資料隔離，並藉由消除為每個租用戶建立個別儲存貯體的需求，簡化管理。如需詳細資訊，請參閱S3 Vectors 中的身分和存取管理。

設定向量索引之不可篩選的中繼資料欄位

建立向量索引時，請將不需要篩選的中繼資料欄位設定為不可篩選的中繼資料索引鍵。例如，當您只需要用於參考時，請將向量嵌入的文字區塊儲存為不可篩選的中繼資料欄位。如需詳細資訊，請參閱不可篩選的中繼資料。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

限制

使用 s3vectors-embed-cli 建立和搜尋向量嵌入