Bedrock Data Automation 專案 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Bedrock Data Automation 專案

使用 Amazon Bedrock Data Automation (BDA) 處理檔案的一種方法是建立專案。專案是標準和自訂輸出組態的群組。專案中需要標準輸出,但自訂輸出是選用的。當您使用專案 ARN 呼叫 InvokeDataAutomationAsync API 時,系統會使用該專案中定義的組態設定自動處理檔案。接著會根據專案的組態產生輸出。

您可以為專案指定階段 (可以是 LIVEDEVELOPMENT)。每個階段都是專案的唯一可變版本。這表示您可以使用 DEVELOPMENT 階段進行編輯或測試,並使用 LIVE 階段處理客戶請求。您無法在主控台中存取 DEVELOPMENT 專案,且必須透過 API 變更和調用那些專案。

專案可讓您針對多種檔案類型使用單一資源。例如,系統將使用專案 ABC 的音訊標準輸出組態,處理向 BDA 傳送的音訊檔案 (使用專案名稱 ABC)。系統將使用專案 ABC 的文件標準輸出組態處理向 BDA 傳送的文件 (使用專案名稱 ABC)。

專案可讓您在設定標準輸出時享有更大的彈性。每個標準輸出都有自己的一組可設定選項 (例如轉錄或摘要),而專案可讓您變更那些選項,以更符合使用案例。您也可以使用文件、音訊和影像的藍圖來設定專案,以定義自訂輸出。設定為產生自訂輸出的專案也會自動產生標準輸出。

以下各節將介紹幾個專案的使用範例。

將專案與標準輸出搭配使用

讓我們考慮以下使用案例:您只想擷取完整音訊和影片檔案的轉錄摘要。根據預設,將音訊和影片檔案傳送到 BDA 時,您會收到轉錄摘要,以及完整轉錄、場景層級摘要、偵測到的文字和其他資訊。對於此使用案例,您不想花費額外的時間和資源來收集不需要的資訊。對於此使用案例,您可以設定標準輸出專案,以僅啟用音訊和影片檔案的摘要功能。

若要使用 API 或主控台執行此操作,請建立專案與修改音訊和影片的標準輸出設定。對於影片,啟用完整影片摘要,但確保其他擷取 (例如,完整音訊轉錄、場景摘要、內容審核等) 是停用的。針對音訊重複此組態。將專案設定為僅產生摘要後,請儲存專案並記下專案的 Amazon Resource Name (ARN)。可將此 ARN 用於 InvokeDataAutomationAsync 操作,以大規模處理檔案。透過將音訊或影片檔案傳遞至 BDA,並指定此專案 ARN,您會僅收到每個檔案的摘要輸出。請注意,在此範例中,沒有對文件或影像執行的組態。這表示如果使用該專案 ARN 將影像或文件傳遞至 BDA,您將收到那些檔案的預設標準輸出。

使用專案搭配自訂輸出和標準輸出

針對此使用案例,假設您想要產生文件和音訊檔案的標準輸出摘要,以及從文件中擷取自訂欄位。建立專案之後,請設定音訊的標準輸出以啟用完整音訊摘要,並確保其他擷取是未啟用的狀態。針對文件重複此標準輸出組態。然後,您可以透過新增藍圖或從 BDA 全域目錄中選取預先存在的藍圖,來設定文件的自訂輸出。使用此專案 ARN 傳遞給 BDA 的文件將產生標準輸出完整文件摘要,以及已定義自訂欄位的藍圖輸出。使用此專案 ARN 傳遞至 BDA 的音訊檔案將產生完整摘要。

處理文件時,您可能想要針對傳遞給專案的不同文件類型使用多個藍圖。專案最多可連接 40 個文件藍圖。BDA 會自動將文件與專案中設定的適當藍圖比對,並使用該藍圖產生自訂輸出。此外,您可能想要大量傳遞文件。如果您傳遞的檔案內含多個文件,則可以選擇在建立專案時分割文件。如果您選擇這樣做,BDA 會掃描檔案,並根據內容將其分割成個別文件。隨後會將那些個別文件與正確的藍圖進行比對,以便進行處理。

目前,影像僅支援每個專案單一藍圖定義。影像檔案類型 JPG 和 PNG 可能會根據其內容被視為影像或掃描文件。我們建議您在處理文件的自訂輸出時建立影像的自訂藍圖,以便 BDA 為包含文字的影像檔案提供所需的輸出。

音訊檔案也支援每個專案的單一藍圖定義。