

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 鏈結標記任務
<a name="sms-reusing-data"></a>

Amazon SageMaker Ground Truth 有兩種方式可重複使用先前工作的資料集：複製和串連。

*複製*會複製先前標籤工作的設定，並在開始執行工作之前，讓您先進行額外的變更。

*串連*不僅使用先前任務的設定，還使用結果。這可讓您繼續未完成的任務，並將標籤或資料物件新增到已完成的任務。串連是更複雜的操作。

若為資料處理：
+  複製會使用先前任務的*輸入*資訊清單 (可選擇是否要進行修改)，作為新任務的輸入資訊清單。
+  串連會使用先前工作的*輸出*資訊清單，作為新工作的輸入資訊清單。

當您需要執行下列動作時，串連很有用：
+ 繼續已手動停止的標籤工作。
+ 修正問題後，繼續標籤使 mid-job 失敗的標籤工作。
+ 在手動標籤部分任務之後，切換至自動化資料標籤 (或反之亦然)。
+ 將更多資料物件新增到已完成的任務，並從那裡開始執行任務。
+ 將另一個註釋新增到已完成的任務。例如，您有一組針對主題而標籤的字詞，然後想要依主題的潛在讀者將字詞分類，再重新運用這組字詞。

在 Amazon SageMaker Ground Truth 中，您可以使用主控台或 API 來設定串連的標籤工作。

## 重要術語：標籤屬性名稱
<a name="sms-reusing-data-LAN"></a>

在以工作者指派給資料物件的標籤所組成的金鑰值組中，*標籤屬性名稱* (在 API 中為 `LabelAttributeName`) 是用來作為金鑰的字串。

下列規則適用於標籤屬性名稱：
+ 它不能以 `-metadata` 結尾。
+ 名稱 `source` 和 `source-ref` 已保留，無法使用。
+ 對於語意分割標籤工作，它必須以 `-ref` 結尾。對於所有其他標籤工作，它*不能*以 `-ref` 結尾。如果您使用主控台建立任務，Amazon SageMaker Ground Truth 會自動將`-ref`附加到除語意分割任務以外的所有標籤屬性名稱。
+ 對於串連標籤工作，如果您使用來自原始工作的同一個標籤屬性名稱，並設定串連工作來使用自動標籤，則只要已在任何時候進入自動標籤模式，Ground Truth 就會使用來自原始工作的模型。

在輸出資訊清單中，標籤屬性名稱會出現，如下所示。

```
  "source-ref": "<{{S3 URI}}>",
  "<{{label attribute name}}>": {
    "annotations": [{
      "class_id": 0,
      "width": 99,
      "top": 87,
      "height": 62,
      "left": 175
    }],
    "image_size": [{
      "width": 344,
      "depth": 3,
      "height": 234
    }]
  },
  "<{{label attribute name}}>-metadata": {
    "job-name": "<{{job name}}>",
    "class-map": {
      "0": "<{{label attribute name}}>"
    },
    "human-annotated": "yes",
    "objects": [{
      "confidence": 0.09
    }],
    "creation-date": "<{{timestamp}}>",
    "type": "groundtruth/object-detection"
  }
```

如果您在主控台中建立任務，而且未明確設定標籤屬性名稱值，則 Ground Truth 會使用任務名稱作為任務的標籤屬性名稱。

## 啟動串連工作 (主控台)
<a name="sms-reusing-data-console"></a>

從現有工作清單中選擇已停止、失敗或完成的標籤工作。這樣會啟用**動作**功能表。

從**動作**功能表中，選擇**串連**。

### 任務概觀面板
<a name="sms-reusing-data-console-job-panel"></a>

在**工作概觀**面板中，將會根據您要串連到此工作的來源工作標題，設定新的**工作名稱**。您可以變更它。

您也可以指定不同於標籤工作名稱的標籤屬性名稱。

如果您從已完成的工作來串連，標籤屬性名稱會使用您設定的新工作的名稱。若要變更名稱，請選取此核取方塊。

如果您從已停止或失敗的工作來串連，標籤屬性名稱會使用您串連的來源工作的名稱。因為已勾選名稱核取方塊，查看和編輯值是很簡單的。

**屬性標籤命名考量**  
**預設**會使用 Ground Truth 已選取的標籤屬性名稱。沒有資料連接到該標籤屬性名稱的所有資料物件都會標籤。
如果**使用的標籤屬性名稱**不存在資訊清單中，則任務會處理資料集的*所有*物件。

在這種情況下，將自動選取**輸入資料集位置**作為串連工作的輸出資訊清單。輸入欄位不可用，因此無法變更。

**將資料物件新增到標籤工作**  
您不能指定替代資訊清單檔案。在開始串連的工作之前，手動編輯上一個工作的輸出資訊清單來新增新項目。Amazon S3 URI 協助您尋找在 Amazon S3 儲存貯體中存放資訊清單的位置。從那裡下載資訊清單檔案，在本機電腦上編輯，然後上傳新版本來取代它。請確保您在編輯期間沒有引入錯誤。建議您使用 JSON linter 檢查您的 JSON。許多熱門的文字編輯器和 IDE 都有 linter 外掛程式可用。

## 啟動串連工作 (API)
<a name="sms-reusing-data-API"></a>

與使用 `CreateLabelingJob` 設定新標籤工作的程序幾乎相同，除了兩個主要差異：
+ **資訊清單位置：** `DataSource` 中的 `ManifestS3Uri` 的值，應該指向先前標籤工作的*輸出資訊清單*的 Amazon S3 URI，而不是使用先前工作的原始資訊清單。
+ **標籤屬性名稱：**在這裡設定正確的 `LabelAttributeName` 值很重要。這正是鍵值組的索引鍵部分，而標籤資料是值。使用案例範例包括：
  + **新增新的或更加特定的標籤到已完成任務** — 設定新的標籤屬性名稱。
  + **標籤先前任務中未標籤的項目** — 使用來自先前任務的標籤屬性名稱。

## 使用部分標籤的資料集
<a name="sms-reusing-data-newdata"></a>

如果您使用已部分標籤的擴增資訊清單，則能享受一些串連好處。勾選**標籤屬性名稱**核取方塊，並將名稱設為符合您的資訊清單中的名稱。

如果您使用 API，則指示同於啟動已串連的工作。不過，請務必將資訊清單上傳到 Amazon S3 儲存貯體來使用，而不要使用先前任務的輸出資訊清單。

資訊清單中的 **標籤屬性名稱** 值必須遵循先前說明之命名考量。