選擇您的多模式處理方法

Amazon Bedrock 知識庫提供兩種處理多模態內容的方法：用於視覺相似性搜尋的 Nova 多模態內嵌，以及用於以文字為基礎的多媒體內容處理之 Bedrock 資料自動化 (BDA)。如果您的輸入模式是影像，但不適用於音訊或視訊，您也可以使用基礎模型做為剖析器。

本節說明使用 Nova Multimodal Embeddings 和 BDA 作為多模式內容的處理方法。每種方法都針對不同的使用案例和查詢模式進行最佳化。

多模式處理方法

下表顯示 Nova 多模態內嵌與 BDA 之間的比較，用於處理多模態內容。

處理方法比較
特性	Nova 多模態內嵌	Bedrock 資料自動化 (BDA)
處理方法	在沒有中繼文字轉換的情況下產生內嵌	將多媒體轉換為文字，然後建立內嵌
支援的查詢類型	文字查詢或映像查詢	僅限文字查詢
主要使用案例	視覺相似性搜尋、產品比對、影像探索	語音轉錄、文字搜尋、內容分析
RAG 功能	僅限文字內容	完整`RetrieveAndGenerate`支援
儲存需求	需要多模態儲存目的地	多模態儲存目的地是選用的，但如果未指定，則 BDA 只會處理文字資料。對於非文字輸入，您必須指定多模式儲存目的地。

區域可用性
Nova 多模態內嵌	Bedrock 資料自動化 (BDA)
僅限美國東部（維吉尼亞北部）	美國西部 (奧勒岡) 美國東部 (維吉尼亞北部) 歐洲 (法蘭克福) 歐洲 (倫敦) 歐洲 (愛爾蘭) 亞太地區 (孟買) 亞太地區 (悉尼) AWS GovCloud (US-West)

使用此決策矩陣，根據您的內容和使用案例需求選擇適當的處理方法：

如果您使用 BDA 剖析器搭配 Amazon Nova Multimodal Embeddings 模型，內嵌模型會像文字內嵌模型一樣運作。使用多模態內容時，根據您的使用案例，使用其中一種處理方法來獲得最佳結果。

支援的檔案類型取決於您選擇的處理方法：

透過處理方法支援的檔案類型
檔案類型	Nova 多模態內嵌	Bedrock 資料自動化 (BDA)
映像	.png、.jpg、.jpeg、.gif、.webp	.png、.jpg、.jpeg
音訊	.mp3、.ogg、.wav	.amr、.flac、.m4a、.mp3、.ogg、.wav
影片	.mp4、.mov、.mkv、.webm、.flv、.mpeg、.mpg、.wmv、.3gp	.mp4、.mov
文件	以文字處理	.pdf （加上影像中的文字擷取）

下列資料來源支援多模態內容：

多模式擷取目前僅適用於 Amazon S3 資料來源。其他資料來源 (Confluence、SharePoint、Salesforce、Web Crawler) 不會在擷取期間處理多模式檔案。這些檔案會略過，且不適用於多模式查詢。

Nova 多模態內嵌

主要功能：

限制：

Bedrock 資料自動化 (BDA)

主要功能：

限制：

Nova Multimodal Embeddings 無法有效地處理音訊或影片檔案中的語音內容。如果您的多媒體內容包含使用者需要搜尋的重要口語資訊，請選擇 BDA 方法以確保完整轉錄和可搜尋性。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

建立多模態內容的知識庫

先決條件