

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 選擇自動擴展方法
<a name="scaling"></a>

彈性是使用 Amazon EMR 的主要優勢之一。有兩種主要選項可自動擴展您的資源：
+ 受管擴展
+ 自訂擴展政策

透過受管擴展或自訂自動擴展政策，您可以向內擴展和向外擴展節點，以便只使用所需的資源。當您需要更多容量時，擴展用於新增更多資源。擴展會移除未使用的資源，進而產生成本效益。在 Amazon EMR 服務中，Amazon CloudWatch 指標會啟用以監控您的資源，讓您可以擴展叢集。CloudWatch 每 5 分鐘會取得一次資料點。

每個自動擴展方法都有不同的考量。

## Amazon EMR 受管擴展功能
<a name="managed"></a>

如果您的工作負載符合下列條件，請使用 [EMR 受管擴展](https://docs.aws.amazon.com/emr/latest/ManagementGuide/managed-scaling-console.html)：
+ 需要受管體驗。
+ 使用 Amazon EMR 5.330 或更新版本。
+ 您需要 1 分鐘的評估頻率。
+ 解決方案使用執行個體機群來擁有一到五個執行個體選項。
+ 應用程式是以 Apache Spark、Apache Hive 或 Apache Hadoop YARN 為基礎。

## 自訂自動擴展
<a name="custom"></a>

如果您的工作負載符合下列條件，請使用[自訂自動擴展政策](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-automatic-scaling.html)：
+ 您必須控制擴展的 指標。
+ 使用 Amazon EMR 4.0\+。
+ 不需要高評估頻率。
+ 不需要控制連續調整大小之間的冷卻時間。
+ 請務必控制擴展時要新增或移除的執行個體數量。
+ 解決方案需要自訂擴展動作。例如，您可能想要在一個 5 分鐘的期間內擴展多個節點。或者，您可能想要調整冷卻時間。
+ 在執行個體群組中使用不同的即時類型沒有限制。

## 將自動擴展新增至叢集的提示
<a name="scaling-tips"></a>
+ 請注意您將處理的資料量。使用具有最大資料大小的案例進行預測。
+ [正確調整叢集的大小](capacity.md)。
+ 選擇符合您需求的[儲存類型](storage.md)。
+ 了解 Amazon EMR 叢集的[指標](https://docs.aws.amazon.com/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)。
+ 了解如何判斷擴展叢集的[正確指標](https://aws.amazon.com/blogs/big-data/best-practices-for-resizing-and-automatic-scaling-in-amazon-emr/)。
+ 決定您要使用 Spot 執行個體、統一執行個體群組或執行個體機群。
+ 根據資訊和限制，決定您偏好的擴展方法類型、Amazon EMR 受管擴展或自訂自動擴展政策。
+ 設定受管擴展或自訂政策。
+ 如果您選擇自訂自動擴展政策，請監控 Amazon EMR 指標以調校政策的閾值。