控制傳送給工作者的資料物件流程 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

控制傳送給工作者的資料物件流程

視您建立的標籤工作類型而定,Amazon SageMaker Ground Truth 會以批次或串流方式將資料物件傳送給員工。您可以使用下列方式,控制資料物件到工作者的流程:

  • 對於這兩種類型的標籤工作,您可以使用MaxConcurrentTaskCount控制標籤工作正在執行時,指定時間點所有工作者可用的資料物件總數。

  • 如為串流標籤工作,您可以透過監控和控制傳送至與標籤工作相關聯之 Amazon SQS 的資料物件數量,來控制資料物件到工作者的流程。

請參閱以下各節,進一步了解這些選項。

使用 MaxConcurrentTaskCount 控制資料物件的流程

MaxConcurrentTaskCount 定義工作者入口網站任務佇列中一次可用的資料物件數量上限。如果您使用主控台,則此參數會設定為 1,000。如果您使用 CreateLabelingJob,則可將此參數設定為介於 1 到 5,000 (含) 之間的任何整數。

使用下列範例,以進一步了解資訊清單檔案中的項目數量、NumberOfHumanWorkersPerDataObjectMaxConcurrentTaskCount 如何定義任務工作者在工作者入口網站 UI 中其任務佇列內看到的任務。

  1. 您有一個輸入資訊清單檔案具有 600 個項目。

  2. 對於輸入資訊清單檔案中的每個項目,您可以使用 NumberOfHumanWorkersPerDataObject 來定義將從輸入資訊清單檔案中標記項目的人力工作者數量。在此範例中,您將 NumberOfHumanWorkersPerDataObject 設定為等於 3。這將為輸入資訊清單檔案中的每個項目建立 3 個不同的任務。此外,若要標籤為成功標籤,則至少三個不同的工作者必須標記該物件。這會建立總共 1,800 個由工作者完成的任務 (600 x 3)。

  3. 您希望工作者在工作者入口網站 UI 內的佇列中一次只能看到 100 個任務。若要這樣做,請將 MaxConcurrentTaskCount 設定為等於 100。接著,Ground Truth 便會在工作者入口網站任務佇列中填入每個工作者 100 個任務。

  4. 接下來會發生什麼情況,取決於您要建立的標籤工作類型,以及是否為串流標籤工作。

    • 串流標籤工作:只要工作者可用的物件總數等於MaxConcurrentTaskCount,輸入資訊清單檔案中的所有剩餘資料集物件,以及您使用 Amazon SNS 即時傳送的所有資料集物件,都會置於 Amazon SQS 佇列中。當工作者可用的物件總數低於 MaxConcurrentTaskCount 減掉 NumberOfHumanWorkersPerDataObject 時,會使用佇列中的新資料物件來建立NumberOfHumanWorkersPerDataObject-任務,並立即傳送給工作者。

    • 非串流標籤工作:當工作者完成標籤一組物件後,最多會將MaxConcurrentTaskCount乘以NumberOfHumanWorkersPerDataObject件新任務傳送給工作者。這個程序會重複執行,直到輸入資訊清單檔案中的所有資料物件完成標籤為止。

使用 Amazon SQS 控制資料物件到串流標籤工作的流程

建立串流標籤工作時,系統會在您的帳戶中自動建立 Amazon SQS 佇列。只有當傳送給工作者的物件總數超過MaxConcurrentTaskCount時,資料物件才會新增至 Amazon SQS 佇列。否則,物件會直接傳送給工作者。

您可以使用此佇列來管理資料物件到標籤工作的流程。如需詳細資訊,請參閱 使用 Amazon SQS 佇列管理標籤請求