

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 步驟 1：將文件新增至 Amazon S3
<a name="tutorial-reviews-add-docs"></a>

開始 Amazon Comprehend 分析任務之前，您需要在 Amazon Simple Storage Service (Amazon S3) 中存放客戶評論的範例資料集。Amazon S3 會將您的資料託管在稱為儲存貯體的容器中。Amazon Comprehend 可以分析存放在儲存貯體中的文件，並將分析結果傳送至儲存貯體。在此步驟中，您會建立 S3 儲存貯體、在儲存貯體中建立輸入和輸出資料夾，以及將範例資料集上傳至儲存貯體。

**Topics**
+ [先決條件](#tutorial-reviews-add-docs-prereqs)
+ [下載範例資料](#tutorial-reviews-add-docs-download)
+ [建立 Amazon S3 儲存貯體](#tutorial-reviews-add-docs-bucket)
+ [（僅限主控台） 建立資料夾](#tutorial-reviews-add-docs-folders)
+ [上傳輸入資料](#tutorial-reviews-add-docs-upload)

## 先決條件
<a name="tutorial-reviews-add-docs-prereqs"></a>

開始之前，請檢閱[教學課程：使用 Amazon Comprehend 分析客戶評論的洞見](tutorial-reviews.md)並完成先決條件。

## 下載範例資料
<a name="tutorial-reviews-add-docs-download"></a>

下列範例資料集包含從大型資料集「Amazon review - Full」取得的 Amazon 檢閱，該資料集是以文章「Character-level Convolutional Networks for Text Classification」 (Xiang Zhang et al.， 2015) 發佈。將資料集下載至您的電腦。

**取得範例資料**

1. 將 zip 檔案 [tutorial-reviews-data.zip](samples/tutorial-reviews-data.zip) 下載至您的電腦。

1. 在電腦上解壓縮 zip 檔案。有兩個檔案。檔案`THIRD_PARTY_LICENSES.txt`是 Xiang Zhang et al. 所發佈資料集的開放原始碼授權。檔案`amazon-reviews.csv`是您在教學課程中分析的資料集。

## 建立 Amazon S3 儲存貯體
<a name="tutorial-reviews-add-docs-bucket"></a>

下載範例資料集後，請建立 Amazon S3 儲存貯體來存放您的輸入和輸出資料。您可以使用 Amazon S3 主控台或 () 建立 S3 儲存貯體 AWS Command Line Interface AWS CLI。 Amazon S3 

### 建立 Amazon S3 儲存貯體 （主控台）
<a name="tutorial-reviews-add-docs-bucket-console"></a>

在 Amazon S3 主控台中，您可以建立在所有 中具有唯一名稱的儲存貯體 AWS。

**建立 S3 儲存貯體 （主控台）**

1. 登入 AWS 管理主控台 ，並在 [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)：// 開啟 Amazon S3 主控台。

1. 在**儲存貯**體中，選擇**建立儲存貯體**。

1. 針對**儲存貯體名稱**，輸入描述儲存貯體用途的全域唯一名稱。

1. 針對**區域**，選擇您要建立儲存貯體 AWS 的區域。您選擇的區域必須支援 Amazon Comprehend。若要減少延遲，請選擇最接近 Amazon Comprehend 支援的地理位置 AWS 的區域。如需支援 Amazon Comprehend 的區域清單，請參閱 *全球基礎設施指南*中的[區域表](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/)。

1. 保留**物件擁有權**的預設設定、**封鎖公開存取的儲存貯體設定**、**儲存貯體版本控制**和**標籤**。

1. 針對**預設加密**，選擇**停用**。
**提示**  
雖然本教學課程不使用加密，但您可能想要在分析重要資料時使用加密。對於end-to-end加密，您可以在 儲存貯體中以及執行分析任務時加密靜態資料。如需使用 加密的詳細資訊 AWS，請參閱[什麼是 AWS Key Management Service？](https://docs.aws.amazon.com/kms/latest/developerguide/overview.html) 《 *AWS Key Management Service 開發人員指南*》中的 。

1. 檢閱您的儲存貯體組態，然後選擇**建立儲存貯**體。

### 建立 Amazon S3 儲存貯體 (AWS CLI)
<a name="tutorial-reviews-add-docs-bucket-cli"></a>

開啟 之後 AWS CLI，您可以執行 `create-bucket`命令來建立儲存貯體，以存放輸入和輸出資料。

**建立 Amazon S3 儲存貯體 (AWS CLI)**

1. 若要建立儲存貯體，請在 中執行下列命令 AWS CLI。使用所有 中唯一的儲存貯體名稱取代 amzn-s3-demo-bucket AWS。

   ```
   aws s3api create-bucket --bucket amzn-s3-demo-bucket
   ```

   根據預設， `create-bucket`命令會在 `us-east-1` AWS 區域中建立儲存貯體。若要在 AWS 區域 以外的 中建立儲存貯體`us-east-1`，請新增 `LocationConstraint` 參數以指定您的 區域。例如，下列命令會在 `us-west-2` 區域中建立儲存貯體。

   ```
   aws s3api create-bucket --bucket amzn-s3-demo-bucket
   --region us-west-2 --create-bucket-configuration LocationConstraint=us-west-2
   ```

   請注意，只有特定區域支援 Amazon Comprehend。如需支援 Amazon Comprehend 的區域清單，請參閱 *全球基礎設施指南*中的[區域表](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/)。

1. 若要確保您的儲存貯體已成功建立，請執行下列命令。命令會列出與您的帳戶相關聯的所有 S3 儲存貯體。

   ```
   aws s3 ls
   ```

## （僅限主控台） 建立資料夾
<a name="tutorial-reviews-add-docs-folders"></a>

接著，在您的 S3 儲存貯體中建立兩個資料夾。第一個資料夾適用於您的輸入資料。第二個資料夾是 Amazon Comprehend 傳送分析結果的位置。如果您使用 Amazon S3 主控台，則必須手動建立資料夾。如果您使用 AWS CLI，您可以在上傳範例資料集或執行分析任務時建立資料夾。因此，我們提供僅針對主控台使用者建立資料夾的程序。如果您使用 AWS CLI，您將在 [上傳輸入資料](#tutorial-reviews-add-docs-upload)和 中建立資料夾[步驟 3：在 Amazon S3 中的文件上執行分析任務](tutorial-reviews-analysis.md)。

**在 S3 儲存貯體中建立資料夾 （主控台）**

1. 開啟位於 [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) 的 Amazon S3 主控台。

1. 在**儲存貯**體中，從儲存貯體清單中選擇儲存貯體。

1. 在**概觀**索引標籤中，選擇**建立資料夾**。

1. 針對新的資料夾名稱，輸入 `input`。

1. 針對加密設定，選擇**無 （使用儲存貯體設定）**。

1. 選擇**儲存**。

1. 重複步驟 3 到 6 為分析任務的輸出建立另一個資料夾，但在步驟 4 中，輸入新的資料夾名稱 `output`。

## 上傳輸入資料
<a name="tutorial-reviews-add-docs-upload"></a>

現在您已擁有儲存貯體，請上傳範例資料集 `amazon-reviews.csv`。您可以使用 Amazon S3 主控台或 將資料上傳至 S3 儲存貯體 AWS CLI。 Amazon S3 

### 將範例文件上傳至儲存貯體 （主控台）
<a name="tutorial-reviews-add-docs-upload-console"></a>

在 Amazon S3 主控台中，將範例資料集檔案上傳至輸入資料夾。

**上傳範例文件 （主控台）**

1. 開啟位於 [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) 的 Amazon S3 主控台。

1. 在**儲存貯**體中，從儲存貯體清單中選擇儲存貯體。

1. 選擇 `input` 資料夾，然後選擇**上傳**。

1. 選擇**新增檔案**，然後在電腦上選擇`amazon-reviews.csv`檔案。

1. 將其他設定保留為其預設值。

1. 選擇**上傳**。

### 將範例文件上傳至儲存貯體 (AWS CLI)
<a name="tutorial-reviews-add-docs-upload-cli"></a>

在 S3 儲存貯體中建立輸入資料夾，然後使用 `cp`命令將資料集檔案上傳至新資料夾。

**上傳範例文件 (AWS CLI)**

1. 若要將`amazon-reviews.csv`檔案上傳至儲存貯體中的新資料夾，請執行下列 AWS CLI 命令。將 amzn-s3-demo-bucket 取代為您的儲存貯體名稱。透過`/input/`在結尾新增路徑，Amazon S3 會自動在儲存貯體`input`中建立一個名為 的新資料夾，並將資料集檔案上傳到該資料夾。

   ```
   aws s3 cp amazon-reviews.csv s3://amzn-s3-demo-bucket/input/
   ```

1. 若要確保您的檔案已成功上傳，請執行下列命令。命令會列出儲存貯體`input`資料夾的內容。

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/input/
   ```

現在，您有 S3 儲存貯體，其`amazon-reviews.csv`檔案位於名為 的資料夾中`input`。如果您使用 主控台，則儲存貯體中也會有一個 `output` 資料夾。如果您使用 AWS CLI，您將在執行 Amazon Comprehend 分析任務時建立輸出資料夾。