

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon EMR 叢集錯誤：HDFS 複寫因素錯誤
<a name="emr-hdfs-insufficient-replication"></a>

當您從核心[執行個體群組](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-uniform-instance-group.html)或[執行個體機群](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-instance-fleet.html)移除核心節點時，Amazon EMR 可能會遇到 HDFS 複寫錯誤。當您移除核心節點，且核心節點數目低於 Hadoop 分散式檔案系統 (HDFS) 設定的 [dfs.replication 係數](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hdfs-config.html)時，就會發生此錯誤。因此，Amazon EMR 無法安全地執行操作。若要判斷`dfs.replication`組態的預設值，[HDFS 組態](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hdfs-config.html)。

## 可能原因
<a name="emr-hdfs-insufficient-replication-possible-causes"></a>

請參閱下列 HDFS 複寫因素錯誤的可能原因：
+ 如果您[手動調整核心執行個體群組或執行個體機群的大小](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-manage-resize.html)低於設定的`dfs.replication`因素。
+ 受[管擴展](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-scaling.html)或[自動擴展](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-automatic-scaling.html)的政策可能允許擴展，以減少核心節點的數量低於 的閾值`dfs.replication`。
+ 當叢集具有 定義的最小核心節點數量時，如果 Amazon EMR 嘗試[取代](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-node-replacement.html)運作狀態不佳的核心節點，也可能發生此錯誤[]()。

## 解決方案和最佳實務
<a name="emr-hdfs-insufficient-replication-best-practices"></a>

如需解決方案和最佳實務，請參閱下列內容：
+ 當您手動調整 Amazon EMR 叢集的大小時，請勿縮減到低於 的大小，`dfs.replication`因為 Amazon EMR 無法安全地完成調整大小。
+ 當您使用受管擴展或自動擴展時，請確定叢集的最小容量不低於 `dfs.replication`係數。
+ 核心執行個體的數量應至少`dfs.replication`加 1。如果您啟用運作狀態不佳的核心取代，這可確保 Amazon EMR 可以成功取代運作狀態不佳的核心節點。

**重要**  
如果您`dfs.replication`將 設定為 1，單一核心節點故障可能會導致 HDFS 資料遺失。如果您的叢集有 HDFS 儲存體，建議您為生產工作負載設定至少四個核心節點的叢集，以避免資料遺失，並將`dfs.replication`係數設定為至少 2。