

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 影片影格輸入資料
<a name="sms-video-frame-input-data-overview"></a>

當您建立影片影格物件偵測或物件追蹤標籤工作時，您可以選擇影片檔案 (MP4 檔案) 或影片影格作為輸入資料。所有工作者任務都是使用影片影格建立的，因此，如果您選擇影片檔案，請使用 Ground Truth 影格擷取工具，從影片檔中擷取影片影格 (映像)。

對這兩個選項，您可以透過 Amazon SageMaker AI 主控台 Ground Truth 區段的**自動化資料設定**選項，在 Ground Truth 和 Amazon S3 您的輸入資料之間設定連接，以便 Ground Truth 知道在建立標籤任務時要查找輸入資料的位置。這會在 Amazon S3 輸入資料集的位置建立並儲存輸入資訊清單檔案。如需詳細資訊，請參閱 [設定自動化影片影格輸入資料](sms-video-automated-data-setup.md)。

或者，您可以為每個要標籤的影片影格序列手動建立序列檔案，提供輸入資訊清單檔案的 Amazon S3 位置，並使用 `source-ref` 金鑰參考這些序列檔案。如需詳細資訊，請參閱 [建立影片影格輸入資訊清單檔案](sms-video-manual-data-setup.md#sms-video-create-manifest)。

**Topics**
+ [

# 為輸入資料選擇影片檔案或影片影格
](sms-point-cloud-video-input-data.md)
+ [

# 輸入資料設定
](sms-video-data-setup.md)

# 為輸入資料選擇影片檔案或影片影格
<a name="sms-point-cloud-video-input-data"></a>

建立影片影格物件偵測或物件追蹤標籤工作時，您可以提供一序列影片影格 (映像)，或者，您可以使用 Amazon SageMaker AI 主控台讓 Ground Truth 自動從影片檔案擷取影片影格。使用以下各章節以進一步了解這些選項。

## 提供影片影格
<a name="sms-video-provide-frames"></a>

影片影格是從影片檔案中擷取的映像序列。您可以建立一個 Ground Truth 標籤工作，讓工作者標籤多個影片影格序列。每個序列由單一影片中擷取的映像組成。

若要使用影片影格序列建立標籤工作，您必須在 Amazon S3 中使用專屬[金鑰名稱字首](https://docs.aws.amazon.com/AmazonS3/latest/dev/UsingMetadata.html#object-keys)儲存每個序列。在 Amazon S3 主控台內，金鑰名稱字首是資料夾。因此，在 Amazon S3 主控台內，每個影片影格畫面序列都必須位於 Amazon S3 內各自的資料夾內。

例如，如果您有兩個連續的影片影格，您可以使用金鑰名稱字首 `sequence1/` 和 `sequence2/` 以識別序列。在此範例中，您的序列可能位於 `s3://amzn-s3-demo-bucket/video-frames/sequence1/` 和 `s3://amzn-s3-demo-bucket/video-frames/sequence2/` 內。

如果您使用 Ground Truth 主控台建立一個輸入資訊清單檔案，則所有序列金鑰名稱字首都應位於 Amazon S3 內相同的位置。例如，在 Amazon S3 主控台中，每個序列都可以位於 `s3://amzn-s3-demo-bucket/video-frames/` 的資料夾內。在此範例中，您的第一個影片影格 (映像) 序列可能位於 `s3://amzn-s3-demo-bucket/video-frames/sequence1/` 內，而第二個序列可能位於 `s3://amzn-s3-demo-bucket/video-frames/sequence2/` 內。

**重要**  
即使您只有單一序列影片影格需要工作者標籤，該序列在 Amazon S3 中也必須有金鑰名稱字首。如果您使用的是 Amazon S3 主控台，這表示您的序列位於一個資料夾中。它不能位於 S3 儲存貯體的根目錄中。

使用影片影格序列建立工作者任務時，Ground Truth 每個任務使用一個序列。在每個任務中，Ground Truth 使用 [UTF-8](https://en.wikipedia.org/wiki/UTF-8) 二進位排序對您的影片影格排序。

例如，Amazon S3 中的影片影格可能會是以下的排序：

```
[0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg]
```

它們的排列順序如同在工作者任務中的順序：`0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg`。

也可以使用命名慣例來排序影格，如下所示：

```
[frame1.jpg, frame2.jpg, ..., frame11.jpg]
```

在這種情況下，在工作者任務中，`frame10.jpg` 和 `frame11.jpg` 在 `frame2.jpg` 之前。您的工作者會以下列排序查看您的影片影格：`frame1.jpg, frame10.jpg, frame11.jpg, frame2.jpg, ..., frame9.jpg`。

## 提供影片檔案
<a name="sms-point-cloud-video-frame-extraction"></a>

您可以透過使用 Ground Truth 影格分割功能從影片檔案 (MP4 檔案) 中擷取影片影格，在主控台中建立新的標籤工作。從單一影片檔案擷取的一系列影片影格稱為*影片影格序列*。

您可以讓 Ground Truth 自動從影片中擷取所有影格 (最多 2,000 個影格)，或者可以指定影格擷取的頻率。例如，您可以讓 Ground Truth 在影片中每10 個影格擷取一次。

您可以使用自動化資料設定擷取影格時，您最多可以提供 50 部影片，但是當您建立影片影格物件追蹤和影片影格物件偵測標籤工作時，輸入資訊清單檔案無法參考超過 10 個影片影格序列檔案。如果您使用自動化資料設定主控台工具，從 10 個以上的影片檔案擷取影片影格，您將需要修改工具產生的資訊清單檔案，或建立一個新檔案以包含 10 個或以下的影片影格序列檔案。若要進一步了解這些配額，請參閱[3D 點雲與影片影格標籤工作配額](input-data-limits.md#sms-input-data-quotas-other)。

若要使用影片影格擷取工具，請參閱[設定自動化影片影格輸入資料](sms-video-automated-data-setup.md)。

成功從影片擷取所有影片影格後，您會在 S3 輸入資料集的位置看到以下內容：
+ 以每部影片命名的金鑰名稱字首 (Amazon S3 主控台中的資料夾)。這些字首每一個都會導向：
  + 用於命名該字首、從影片中擷取的一個影片影格序列。
  + 一個序列檔案，用來識別組成該序列的所有映像。
+ 副檔名為 .manifest 的輸入資訊清單檔案。這會用來識別用於建立標籤工作的所有序列檔案。

從單一影片檔案中擷取的所有影格，都用於標籤任務。如果您從多個影片檔案擷取影片影格，則會針對標籤工作建立多個工作，每個影片影格序列各一個工作。

 Ground Truth 會使用專屬[金鑰名稱字首](https://docs.aws.amazon.com/AmazonS3/latest/dev/UsingMetadata.html#object-keys)，將擷取的每個影片影格序列儲存在 Amazon S3 的輸入資料集位置。在 Amazon S3 主控台內，金鑰名稱字首是資料夾。

# 輸入資料設定
<a name="sms-video-data-setup"></a>

建立影片影格標籤工作時，您需要讓 Ground Truth 知道在哪裡查找輸入資料。您可以使用兩種方式的其中一種來執行此動作：
+ 您可以將輸入資料儲存在 Amazon S3，並讓 Ground Truth 自動偵測用於標籤工作的輸入資料集。若要進一步了解此選項，請參閱[設定自動化影片影格輸入資料](sms-video-automated-data-setup.md)。
+ 您可以建立一個輸入資訊清單檔案和序列檔案，然後將它們上傳到 Amazon S3。若要進一步了解此選項，請參閱[手動設定影片影格輸入資料](sms-video-manual-data-setup.md)。

**Topics**
+ [

# 設定自動化影片影格輸入資料
](sms-video-automated-data-setup.md)
+ [

# 手動設定影片影格輸入資料
](sms-video-manual-data-setup.md)

# 設定自動化影片影格輸入資料
<a name="sms-video-automated-data-setup"></a>

您可以透過透過 Ground Truth 自動化資料設定，自動偵測 Amazon S3 儲存貯體中的影片檔案，並從這些檔案中擷取影片影格。如要了解如何使用，請參閱[提供影片檔案](sms-point-cloud-video-input-data.md#sms-point-cloud-video-frame-extraction)。

如果您已在 Amazon S3 中有影片影格，您可以透過自動化資料設定，在標籤工作中使用這些影片影格。對於此選項，單一影片中的所有影片影格都必須使用唯一的字首來儲存。若要了解使用此選項的需求，請參閱[提供影片影格](sms-point-cloud-video-input-data.md#sms-video-provide-frames)。

請在下列章節中選取一個，瞭解如何設定讓您的自動輸入資料集與 Ground Truth 連線。

## 提供影片檔案並擷取影格
<a name="sms-video-provide-files-auto-setup-console"></a>

使用下列程序將您的影片檔案與 Ground Truth 連接，並自動從這些檔案擷取影片影格，以進行影片影格物件偵測和物件追蹤標籤工作。

**注意**  
如果您使用自動化資料設定主控台工具，從 10 個以上的影片檔案擷取影片影格，您將需要修改工具產生的資訊清單檔案，或建立一個新檔案以包含 10 個或以下的影片影格序列檔案。如需進一步了解，請參閱[提供影片檔案](sms-point-cloud-video-input-data.md#sms-point-cloud-video-frame-extraction)。

請確定您的影片檔案儲存在 Amazon S3 儲存貯體中的位置，與執行自動化資料設定位於同一 AWS 區域中。

**使用 Ground Truth 自動連接 Amazon S3 中的影片檔案並擷取影片影格：**

1. 導覽至 Amazon SageMaker AI 主控台中的**建立標籤工作**頁面：[https://console.aws.amazon.com/sagemaker/groundtruth](https://console.aws.amazon.com//sagemaker/groundtruth)。

   您的輸入和輸出 S3 儲存貯體必須位於建立標籤工作的同一 AWS 區域。此連結會將您置於北維吉尼亞 (us-east-1) AWS 區域。如果您的輸入資料位於其他區域的 Amazon S3 儲存貯體中，請切換至該區域。若要變更您的 AWS 區域，請在[導覽列](https://docs.aws.amazon.com/awsconsolehelpdocs/latest/gsg/getting-started.html#select-region)上選擇目前顯示區域的名稱。

1. 選取**建立標籤工作**。

1. 輸入**工作名稱**。

1. 在**輸入資料設定**區段內，選取**自動化資料設定**。

1. 輸入**輸入資料集在 S3 的位置**的 Amazon S3 URI。S3 URI 如下所示：`s3://amzn-s3-demo-bucket/path-to-files/`。此 URI 應該會指向儲存影片檔案的 Amazon S3 位置。

1. 指定**輸出資料集在 S3 的位置**。這是您輸出資料的儲存位置。您可以選擇將輸出資料儲存在 **與輸入資料集同一位置**，或**指定新位置**，然後輸入要儲存輸出資料之位置的 S3 URI。

1. 使用下拉式清單在**資料類型**選擇**影片檔案**。

1. 選擇 **是的，為物件追蹤及偵測工作擷取影格**。

1. 在**影格擷取**選擇方法之一。
   + 當您選擇 **使用從影片擷取的所有影格建立標籤任務**時，Ground Truth 會從您的**輸入資料集在 S3 的位置**內所有的影片擷取影格，最多 2,000 個影格。如果輸入資料集中的影片包含 2,000 個以上的影格，則會擷取前 2,000 個影格用於該次標籤任務。
   + 當您選擇**使用影片中每第 *x* 個影格建立標示任務時**，Ground Truth 會從 **S3 輸入資料集位置**內所有影片擷取每第 *x* 個影格。

     例如，如果您的影片長度為 2 秒，且[畫面播放速率](https://en.wikipedia.org/wiki/Frame_rate)為每秒 30 影格，則影片中會有 60 個影格。如果您在此處指定 10，則 Ground Truth 會在您的影片擷取每第10 個影格。這代表擷取第 1 個、第 10 個、第 20 個、第 30 個、第 40 個、第 50 個和第 60 個影格。

1. 選擇或建立一個 IAM 執行角色。確保此角色有您的 Amazon S3 位置存取許可，以存取步驟 5 和 6 中指定的輸入和輸出資料。

1. 選取**完成資料設定**。

## 提供影片影格
<a name="sms-video-provide-frames-auto-setup-console"></a>

使用下列程序將您的影片影格序列與 Ground Truth 連接起來，以進行影片影格物件偵測和物件追蹤標籤工作。

請確定您的影片影格儲存在 Amazon S3 儲存貯體中，與執行自動化資料設定位於同一 AWS 區域。每個影片影格序列應具有唯一的字首。例如，如果您在 `s3://amzn-s3-demo-bucket/video-frames/sequences/` 內儲存了兩個序列，則每個序列都應該具有唯一的字首，例如 `sequence1` 和 `sequence2`，且都應該直接位於 `/sequences/` 字首之下。在上面的範例中，這兩個序列的位置是：`s3://amzn-s3-demo-bucket/video-frames/sequences/sequence1/` 和 `s3://amzn-s3-demo-bucket/video-frames/sequences/sequence2/`。

**使用 Ground Truth 自動連接您在 Amazon S3 中的影片影格：**

1. 導覽至 Amazon SageMaker AI 主控台中的**建立標籤工作**頁面：[https://console.aws.amazon.com/sagemaker/groundtruth](https://console.aws.amazon.com//sagemaker/groundtruth)。

   您的輸入和輸出 S3 儲存貯體必須位於建立標籤工作的同一 AWS 區域。此連結會將您置於北維吉尼亞 (us-east-1) AWS 區域。如果您的輸入資料位於其他區域的 Amazon S3 儲存貯體中，請切換至該區域。若要變更您的 AWS 區域，請在[導覽列](https://docs.aws.amazon.com/awsconsolehelpdocs/latest/gsg/getting-started.html#select-region)上選擇目前顯示區域的名稱。

1. 選取**建立標籤工作**。

1. 輸入**工作名稱**。

1. 在**輸入資料設定**區段內，選取**自動化資料設定**。

1. 在 **S3 location for input datasets**（輸入資料集在 S3 位置）輸入 Amazon S3 URI。

   這會是儲存您的序列的 Amazon S3 位置。例如，如果您有兩個序列儲存在 `s3://amzn-s3-demo-bucket/video-frames/sequences/sequence1/`、`s3://amzn-s3-demo-bucket/video-frames/sequences/sequence2/` 內，請在此輸入 `s3://amzn-s3-demo-bucket/video-frames/sequences/`。

1. 指定 **S3 location for output datasets**（輸出資料集在 S3 的位置）。這是您輸出資料的儲存位置。您可以選擇將輸出資料儲存在 **Same location as input dataset**（與輸入資料集同一位置），或 **Specify a new location**（指定新位置），然後輸入要儲存輸出資料之位置的 S3 URI。

1. 使用下拉式清單在**資料類型**選擇**影片影格**。

1. 選擇或建立一個 IAM 執行角色。確保此角色有您的 Amazon S3 位置存取許可，以存取步驟 5 和 6 中指定的輸入和輸出資料。

1. 選取 **Complete data setup**（完成資料設定）。

這些程序會在您在步驟 5 為輸入資料集指定的 Amazon S3 位置，建立輸入資訊清單。如果您要使用 SageMaker API AWS CLI或 或 AWS SDK 建立標籤工作，請使用此輸入資訊清單檔案的 Amazon S3 URI 做為參數 的輸入`ManifestS3Uri`。

# 手動設定影片影格輸入資料
<a name="sms-video-manual-data-setup"></a>

如果您已為每個影片影格序列建立序列檔案，並列出這些序列檔案參考的資訊清單檔案的清單，請選擇手動資料設定選項。

## 建立影片影格輸入資訊清單檔案
<a name="sms-video-create-manifest"></a>

 Ground Truth 在建立標籤工作時，會使用輸入資訊清單檔案來識別輸入資料集的位置。對於影片影格物件偵測和物件追蹤標籤工作，輸入資訊清單檔案中的每一行都用於識別影片影格序列檔案的位置。每個序列檔案用於識別單一影片影格序列中包含的映像。

請使用此頁面了解如何建立影片影格序列檔案，以及影片影格物件追蹤和物件偵測標籤工作的輸入資訊清單檔案。

如果您希望 Ground Truth 自動產生序列檔案和輸入資訊清單檔案，請參閱[設定自動化影片影格輸入資料](sms-video-automated-data-setup.md)。

### 建立影片影格序列輸入資訊清單
<a name="sms-video-create-input-manifest-file"></a>

在影片影格序列輸入資訊清單檔案中，資訊清單中的每一行都是 JSON 物件，其中包含一個參考序列檔案的 `"source-ref"` 金鑰。每個序列檔案用於識別一序列影片影格的位置。這正是所有影片影格標籤工作所需的資訊清單檔案格式。

以下範例示範輸入資訊清單檔案採用的語法：

```
{"source-ref": "s3://amzn-s3-demo-bucket/example-folder/seq1.json"}
{"source-ref": "s3://amzn-s3-demo-bucket/example-folder/seq2.json"}
```

### 建立影片影格序列檔案
<a name="sms-video-create-sequence-file"></a>

每一序列影片影格的資料，必須儲存在一個 JSON 資料物件中。以下是用於序列檔案的格式範例。每個影格的相關資訊都以 JSON 物件的形式納入，並列在 `frames` 清單中。以下的 JSON 已加入副檔名以便讀取。

```
{
 "seq-no": 1,
 "prefix": "s3://amzn-s3-demo-bucket/prefix/video1/",
 "number-of-frames": 3,
 "frames":[
   {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" },
   {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, 
   {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" }   
 ]
}
```

下表提供此程式碼範例中參數的詳細資訊。


****  

|  參數  |  必要  |  接受的值  |  Description  | 
| --- | --- | --- | --- | 
|  `seq-no`  |  是  |  Integer  |  序列的順序號碼。  | 
|  `prefix`  |  是  |  String **接受的值**： `s3://<bucket-name>/<prefix>/`  |  序列檔案所在的 Amazon S3 位置。 字首必須以正斜線結尾：`/`。  | 
|  `number-of-frames`  |  是  |  Integer  |  序列檔案包含的影格總數。此數字必須符合下一列的 `frames` 參數中列出的影格總數。  | 
|  `frames`  |  是  |  JSON 物件清單 **必要**： `frame-no`, `frame` **選用**： `unix-timestamp`  |  影格資料的清單。清單的長度必須等於 `number-of-frames`。在工作者介面中，序列中的影格會以 [UTF-8](https://en.wikipedia.org/wiki/UTF-8) 二進位順序排序。若要進一步了解此排序，請參閱[提供影片影格](sms-point-cloud-video-input-data.md#sms-video-provide-frames)。  | 
| frame-no |  是  |  Integer  |  影格排序號碼。這將決定序列中影格的排序。  | 
|  `unix-timestamp`  |  否  |  Integer  |  影格的 unix 時間戳記。自 1970 年 1 月 1 日至擷取影格的 UTC 時間前的秒數。  | 
| frame |  是  |  String  |  影片影格映像檔案的名稱。  | 