本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Bedrock Data Automation 專案
使用 Amazon Bedrock Data Automation (BDA) 處理檔案的一種方法是建立專案。專案是標準和自訂輸出組態的群組。專案中需要標準輸出,但自訂輸出是選用的。當您使用專案 ARN 呼叫 InvokeDataAutomationAsync API 時,系統會使用該專案中定義的組態設定自動處理檔案。接著會根據專案的組態產生輸出。
您可以為專案指定階段 (可以是 LIVE 或 DEVELOPMENT)。每個階段都是專案的唯一可變版本。這表示您可以使用 DEVELOPMENT 階段進行編輯或測試,並使用 LIVE 階段處理客戶請求。您無法在主控台中存取 DEVELOPMENT 專案,且必須透過 API 變更和調用那些專案。
專案可讓您針對多種檔案類型使用單一資源。例如,系統將使用專案 ABC 的音訊標準輸出組態,處理向 BDA 傳送的音訊檔案 (使用專案名稱 ABC)。系統將使用專案 ABC 的文件標準輸出組態處理向 BDA 傳送的文件 (使用專案名稱 ABC)。
專案可讓您在設定標準輸出時享有更大的彈性。每個標準輸出都有自己的一組可設定選項 (例如轉錄或摘要),而專案可讓您變更那些選項,以更符合使用案例。您也可以使用文件、音訊和影像的藍圖來設定專案,以定義自訂輸出。設定為產生自訂輸出的專案也會自動產生標準輸出。
以下各節將介紹幾個專案的使用範例。
將專案與標準輸出搭配使用
讓我們考慮以下使用案例:您只想擷取完整音訊和影片檔案的轉錄摘要。根據預設,將音訊和影片檔案傳送到 BDA 時,您會收到轉錄摘要,以及完整轉錄、場景層級摘要、偵測到的文字和其他資訊。對於此使用案例,您不想花費額外的時間和資源來收集不需要的資訊。對於此使用案例,您可以設定標準輸出專案,以僅啟用音訊和影片檔案的摘要功能。
若要使用 API 或主控台執行此操作,請建立專案與修改音訊和影片的標準輸出設定。對於影片,啟用完整影片摘要,但確保其他擷取 (例如,完整音訊轉錄、場景摘要、內容審核等) 是停用的。針對音訊重複此組態。將專案設定為僅產生摘要後,請儲存專案並記下專案的 Amazon Resource Name (ARN)。可將此 ARN 用於 InvokeDataAutomationAsync 操作,以大規模處理檔案。透過將音訊或影片檔案傳遞至 BDA,並指定此專案 ARN,您會僅收到每個檔案的摘要輸出。請注意,在此範例中,沒有對文件或影像執行的組態。這表示如果使用該專案 ARN 將影像或文件傳遞至 BDA,您將收到那些檔案的預設標準輸出。
使用專案搭配自訂輸出和標準輸出
針對此使用案例,假設您想要產生文件和音訊檔案的標準輸出摘要,以及從文件中擷取自訂欄位。建立專案之後,請設定音訊的標準輸出以啟用完整音訊摘要,並確保其他擷取是未啟用的狀態。針對文件重複此標準輸出組態。然後,您可以透過新增藍圖或從 BDA 全域目錄中選取預先存在的藍圖,來設定文件的自訂輸出。使用此專案 ARN 傳遞給 BDA 的文件將產生標準輸出完整文件摘要,以及已定義自訂欄位的藍圖輸出。使用此專案 ARN 傳遞至 BDA 的音訊檔案將產生完整摘要。
處理文件時,您可能想要針對傳遞給專案的不同文件類型使用多個藍圖。專案最多可連接 40 個文件藍圖。BDA 會自動將文件與專案中設定的適當藍圖比對,並使用該藍圖產生自訂輸出。此外,您可能想要大量傳遞文件。如果您傳遞的檔案內含多個文件,則可以選擇在建立專案時分割文件。如果您選擇這樣做,BDA 會掃描檔案,並根據內容將其分割成個別文件。隨後會將那些個別文件與正確的藍圖進行比對,以便進行處理。
目前,影像僅支援每個專案單一藍圖定義。影像檔案類型 JPG 和 PNG 可能會根據其內容被視為影像或掃描文件。我們建議您在處理文件的自訂輸出時建立影像的自訂藍圖,以便 BDA 為包含文字的影像檔案提供所需的輸出。
音訊檔案也支援每個專案的單一藍圖定義。