

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 准备输入数据以供 Amazon EMR 处理
<a name="emr-plan-input"></a>

多数集群会先加载输入数据，然后再处理这些数据。为加载数据，必须定位在集群可以访问的位置，并且格式必须为集群可以处理的类型。最常见的情形是将输入数据上载至 Amazon S3。Amazon EMR 为您的集群提供了从 Amazon S3 导入或读取数据的工具。

Hadoop 中的默认输入格式是文本文件，然而您也可以自定义 Hadoop 从而使用工具导入以其它格式存储的数据。

**Topics**
+ [Amazon EMR 可以接受的输入类型](emr-plan-input-accept.md)
+ [将数据导入 Amazon EMR 的不同方法](emr-plan-get-data-in.md)