

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 为您的 Amazon EMR 集群选择一个 AWS 区域
<a name="emr-plan-region"></a>

Amazon Web Services 在全球范围内的数据中心的服务器上运行。数据中心按地理区域进行管理。启动 Amazon EMR 集群时，必须指定区域。您可以选择一个区域，以便减少延迟、尽可能降低成本或满足法规要求。有关 Amazon EMR 支持的所有区域和端点的列表，请参阅《Amazon Web Services 一般参考》** 中的 [Regions and endpoints](https://docs.aws.amazon.com/general/latest/gr/#emr_region)。

为了获得最佳性能，您应在与您的数据相同的区域启动集群。例如，如果存储您的输入数据的 Amazon S3 存储桶位于美国西部（俄勒冈州）区域，那么您应在美国西部（俄勒冈州）区域启动集群，以避免缴纳跨区域数据传输费。如果您使用 Amazon S3 存储桶接收集群输出，那么也应该在美国西部（俄勒冈州）区域创建该集群输出。

如果您打算将某个 Amazon EC2 密钥对与集群相关联（这是使用 SSH 登录主节点所必需的操作），那么必须在集群所在区域创建密钥对。与之类似，Amazon EMR 创建的用以管理集群的安全组也应在集群所在区域内创建。

如果您 AWS 账户 在 2017 年 5 月 17 日当天或之后注册的，则访问资源时的默认区域为美国东部（俄亥俄州）(us-east-2)；对于较旧的账户，默认区域 AWS 管理控制台 是美国西部（俄勒冈）(us-west-2) 或美国东部（弗吉尼亚北部）(us-east-1)。有关更多信息，请参阅[区域和端点](https://docs.aws.amazon.com/general/latest/gr/rande.html)。

某些 AWS 功能仅在有限的地区可用。例如，集群计算实例仅在美国东部（弗吉尼亚州北部）区域可用，而亚太地区（悉尼）区域仅支持 Hadoop 1.0.3 及更高版本。当您选择一个区域时，请核实该区域是否支持您想要使用的功能。

为了获得最佳性能，请将要用于集群的所有 AWS 资源使用相同的区域。下表列出了区域名称和服务的映射关系。有关 Amazon EMR 区域的列表，请参阅《Amazon Web Services 一般参考》** 中的 [AWS 区域 and endpoints](https://docs.aws.amazon.com/general/latest/gr/rande.html#emr_region)。

## 使用控制台选择区域
<a name="emr-dev-specify-region-console"></a>

默认区域显示在导航栏上账户信息的左侧。要在新旧控制台中切换区域，请选择“区域”下拉菜单并选择一个新选项。

## 使用指定区域 AWS CLI
<a name="emr-dev-specify-region-cli"></a>

 AWS CLI 使用**aws configure**命令或`AWS_DEFAULT_REGION`环境变量在中指定默认区域。有关更多信息，请参阅[《*AWS Command Line Interface 用户指南》*中的配置 AWS 区域](https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-started.html#cli-installing-specifying-region)。

## 选择一个使用 SDK 或 API 的区域
<a name="emr-dev-specify-region-api"></a>

要使用软件开发工具包选择区域，请将应用程序配置为使用该区域的端点。如果您正在使用 AWS SDK 创建客户端应用程序，那么您可以通过调用 `setEndpoint` 来变更客户终端节点，如下例所示：

```
1. client.setEndpoint("elasticmapreduce.us-west-2.amazonaws.com");
```

在您的应用程序通过设置端点指定一个区域后，您可以为集群的 EC2 实例设置可用区。可用区是专用于隔离其他可用区内故障的区分位置，可向相同区域中的其他可用区提供低延迟的便宜网络连接。一个区域包含一个或多个可用区。为了优化性能和降低延迟，所有资源应与使用它们的集群位于同一可用区。