

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立 Amazon S3 資料集
<a name="create-a-data-set-s3-procedure"></a>

**若要建立 Amazon S3 資料集**

1. 檢查 [資料來源配額](data-source-limits.md) 以確保您的目標檔案集不超過資料來源配額。

1. 使用[支援的 Amazon S3 清單檔案格式](supported-manifest-file-format.md)指定的其中一種格式建立資訊清單檔案，以識別您想要匯入的文字檔案。

1. 請將清單檔案儲存到本機目錄，或上傳到 Amazon S3。

1. 在快速入門頁面上，選擇**資料**。

1. 在**資料**頁面上，選擇**建立**然後**新增資料集**。

1. 選擇 Amazon S3 圖示，然後選擇**下一步**。

1. 針對 **Data source name (資料來源名稱)**，輸入資料來源的描述。此名稱應該協助您區分此資料來源和其他資料來源。

1. 針對 **Upload a manifest file (上傳資訊清單檔案)**，執行以下其中一個動作：
   + 若要使用本機資訊清單檔案，請選擇 **Upload (上傳)**，然後選擇 **Upload a JSON manifest file (上傳 JSON 資訊清單檔案)**。針對 **Open (開啟)**，選擇檔案，然後選擇 **Open (開啟)**。
   + 若要使用 Amazon S3 的清單檔案，請選擇 **URL**，並輸入清單檔案的 URL。若要在 Amazon S3 主控台尋找既有清單檔案的 URL，請瀏覽到適當的檔案並選擇。這時會顯示屬性面板，包含連結 URL。您可以複製 URL 並將其貼到 Quick Sight 中。

1. 選擇**連線**。

1. 為了確保連線完成，請選擇 **Edit/Preview data (編輯/預覽資料)**。否則，請選擇**視覺化**，以直接依資料現狀來建立分析。

   如果選擇**編輯/預覽資料**，您可以在準備資料時指定資料集名稱。否則，資料集名稱將與清單檔案的名稱相符。

   如要進一步了解資料準備，請參閱[在 Amazon Quick Sight 中準備資料](preparing-data.md)。

## 根據多個 Amazon S3 檔案建立資料集
<a name="data-sets-based-on-multiple-s3-files"></a>

您可以使用數種方法之一，在 Quick Sight 中合併或合併來自 Amazon S3 儲存貯體的檔案：
+ **使用清單檔案來結合檔案** – 在這種情況下，檔案必須有相同的欄位 (資料欄) 數量。在檔案中相同位置的欄位之間，資料類型必須相符。例如，每個檔案中的第一個欄位必須是相同的資料類型。第二個欄位、第三個欄位，以此類推，也都必須如此。Quick Sight 會從第一個檔案取得欄位名稱。

  資訊清單中必須明確列出檔案。不過，檔案不需要在相同的 Amazon S3 儲存貯體內。

  此外，檔案必須遵循[支援的 Amazon S3 清單檔案格式](supported-manifest-file-format.md)中所述的規則。

  如需有關使用資訊清單來結合檔案的詳細資訊，請參閱[使用 Amazon S3 檔案建立資料集](create-a-data-set-s3.md)。
+ **在不使用清單檔案的情況下合併檔案** – 若要將多個檔案合併成一個檔案，而不必在清單檔案中將其逐個列出，您可以使用 Athena。如果使用這個方法，您可以直接查詢文字檔案，就像在資料庫的表格中一樣。如需詳細資訊，請參閱大數據部落格中的文章：[Analyzing data in Amazon S3 using Athena](https://aws.amazon.com/blogs/big-data/analyzing-data-in-s3-using-amazon-athena/)。
+ **匯入之前使用指令碼來附加檔案** – 您可以使用為了上傳之前合併檔案而設計的指令碼。