

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 設定 Amazon EMR 叢集輸出的位置
<a name="emr-plan-output"></a>

 最常見的 Amazon EMR 叢集輸出格式為文字檔案 (壓縮或未壓縮)。一般而言，這些是寫入至 Amazon S3 儲存貯體的。此儲存貯體必須在叢集啟動前建立。當您啟動叢集時，指定 S3 儲存貯體做為輸出位置。

如需詳細資訊，請參閱下列主題：

**Topics**
+ [建立並設定 Amazon S3 儲存貯體](#create-s3-bucket-output)
+ [Amazon EMR 可以傳回什麼格式？](emr-plan-output-formats.md)
+ [如何將資料寫入非使用 Amazon EMR 擁有的 Amazon S3 儲存貯體](emr-s3-acls.md)
+ [壓縮 Amazon EMR 叢集輸出的方法](emr-plan-output-compression.md)

## 建立並設定 Amazon S3 儲存貯體
<a name="create-s3-bucket-output"></a>

Amazon EMR 使用 Amazon S3 來儲存輸入資料、日誌檔案和輸出資料。Amazon S3 將這些儲存位置視為*儲存貯體*。為了符合 Amazon S3 和 DNS 需求，儲存貯體有特定的約束與限制。如需詳細資訊，請參閱《Amazon Simple Storage Service 開發人員指南》**中的[儲存貯體限制與局限](https://docs.aws.amazon.com/AmazonS3/latest/userguide/BucketRestrictions.html)。

若要建立 Amazon S3 儲存貯體，請遵循《Amazon Simple Storage Service 開發人員指南》**中的[建立儲存貯體](https://docs.aws.amazon.com/AmazonS3/latest/userguide/create-bucket-overview.html)頁面上的指示進行操作。

**注意**  
 如果您在**建立儲存貯體**精靈中啟用日誌記錄，則僅啟用儲存貯體存取日誌而非叢集日誌。

**注意**  
如需指定區域特定儲存貯體的詳細資訊，請參閱《*Amazon Simple Storage Service 開發人員指南*[》中的儲存貯](https://docs.aws.amazon.com/AmazonS3/latest/dev/LocationSelection.html)體和區域，以及[適用於 AWS SDKs可用區域端點。 ](https://aws.amazon.com/articles/available-region-endpoints-for-the-aws-sdks/)

 建立儲存貯體之後，您可以在其上設定適當的許可。通常，您會授予自己 (擁有者) 讀取和寫入存取權。強烈建議您在設定儲存貯體時遵循 [Amazon S3 的安全最佳實務](https://docs.aws.amazon.com/AmazonS3/latest/userguide/security-best-practices.html)。

 所需的 Amazon S3 儲存貯體必須先存在，您才能夠建立叢集。您必須將所需指令碼和叢集中參考的資料上傳至 Amazon S3。下表說明了資料、指令碼和日誌檔案位置的範例。


| 資訊 | Amazon S3 上的位置範例 | 
| --- | --- | 
| 指令碼或程式 |  s3://amzn-s3-demo-bucket1/script/MapperScript.py  | 
| 日誌檔案 |  s3://amzn-s3-demo-bucket1/logs  | 
| 輸入資料 |  s3://amzn-s3-demo-bucket1/input  | 
| 輸出資料 |  s3://amzn-s3-demo-bucket1/output  | 