將資料傳送至串流標記任務 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將資料傳送至串流標記任務

當您使用輸入資訊清單檔案建立標籤工作時,您可以選用一次性提交輸入資料至串流標籤工作。在標籤工作開始且狀態為 InProgress 之後,您可以使用 Amazon SNS 輸入主題與 Amazon S3 事件通知,即時提交新資料物件至標籤工作。

在開始標籤工作時,提交資料物件 (一次性):

  • 使用輸入資訊清單檔案 – 在建立串流標籤工作時,您可以選擇性在 ManifestS3Uri 指定輸入資訊清單檔案 Amazon S3 URI。Ground Truth 會向工作者傳送資訊清單檔案的每個資料物件,以便在標籤工作開始時立即進行標籤。如需詳細資訊,請參閱 建立資訊清單檔案 (選用)

    在提交建立串流標籤工作的請求之後,其狀態將為 Initializing。在標籤工作處於作用中狀態之後,狀態會變更為 InProgress,您可以開始使用即時選項來提交其他資料物件以進行標籤。

即時提交資料物件:

  • 使用 Amazon SNS 訊息傳送資料物件 – 您可以透過傳送 Amazon SNS 訊息來傳送 Ground Truth 新資料物件至標籤。您會將此訊息傳送至 Amazon SNS 輸入主題 (您已在建立串流標籤工作時建立並指定該主題)。如需更多資訊,請參閱使用 Amazon SNS 傳送資料物件

  • 將資料物件放置在 Amazon S3 儲存貯體並加以傳送 – 每次將新資料物件新增至 Amazon S3 儲存貯體時,都可以提示 Ground Truth 處理該物件以進行標籤。若要這麼做,您可以新增事件通知至儲存貯體,以便在每次新增新物件至該儲存貯體 (或在其中建立) 時,通知您的 Amazon SNS 輸入主題。如需更多資訊,請參閱使用 Amazon S3 傳送資料物件。此選項不適用於以文字為基礎的標籤工作,例如文字分類及具名實體辨識。

    重要

    如果您使用 Amazon S3 組態,請勿將相同的 Amazon S3 位置用於輸入資料組態和輸出資料。您可以在建立標籤工作時指定輸出資料的 S3 字首。

使用 Amazon SNS 傳送資料物件

您可以使用 Amazon Simple Notification Service (Amazon SNS) 傳送資料物件至串流標籤工作。Amazon SNS 是一種 Web 服務,可協調和管理往返端點 (例如電子郵件地址或 AWS Lambda 函數) 的訊息傳遞。Amazon SNS 主題充當兩個或多個端點之間的通訊頻道。您可以使用 Amazon SNS 將新資料物件傳送或發佈InputConfigCreateLabelingJob 參數 SnsTopicArn 所指定的主題。這些訊息的格式與輸入資訊清單檔案的單一行相同。

例如,您可以透過發佈文字到輸入主題,傳送文字片段至活動中的文字分類標籤工作。您發佈的訊息可能類似下列內容:

{"source": "Lorem ipsum dolor sit amet"}

若要傳送新映像物件至影像分類標籤工作,您的訊息可能類似下列內容:

{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
注意

您還可以在 Amazon SNS 訊息包含自訂重複刪除 ID 與重複刪除金鑰。如需詳細資訊,請參閱 重複的訊息處理

當 Ground Truth 建立串流標籤工作時,其會訂閱您的 Amazon SNS 輸入主題。

使用 Amazon S3 傳送資料物件

您可以傳送一或多個新資料物件至串流標籤工作,方法是將其放在 Amazon SNS 事件通知設定的 Amazon S3 儲存貯體。您可以設定事件,以便隨時在儲存貯體建立新物件時通知 Amazon SNS 輸入主題。您必須在 InputConfigCreateLabelingJob 參數 SnsTopicArn 指定此相同 Amazon SNS 輸入主題。

每當您設定 Amazon S3 儲存貯體以傳送通知至 Amazon SNS 時,Ground Truth 都會發佈測試事件 "s3:TestEvent",以確保主題存在,且指定的 Amazon S3 儲存貯體擁有者具可發佈至指定主題的許可。建議您在開始進行串流標籤工作之前,先設定 Amazon S3 與 Amazon SNS 的連線。如果不這樣做,則此測試事件可能會註冊為資料物件,並傳送至 Ground Truth 進行標籤。

重要

如果您使用 Amazon S3 組態,請勿將相同的 Amazon S3 位置用於輸入資料組態和輸出資料。您可以在建立標籤工作時指定輸出資料的 S3 字首。

對於以映像為基礎的標籤工作,Ground Truth 要求所有 S3 儲存貯體都必須連接 CORS 政策。如需詳細資訊,請參閱 輸入影像資料的 CORS 需求

在設定 Amazon S3 儲存貯體並建立標籤工作之後,您可以新增物件至儲存貯體,Ground Truth 會傳送該物件給工作者,或將其置於 Amazon SQS 佇列。

如需詳細資訊,請參閱 根據標籤任務中定義的 Amazon SNS 建立 Amazon S3 型儲存貯體事件通知 Amazon SNS

重要

此選項不適用於以文字為基礎的標籤工作,例如文字分類及具名實體辨識。