

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 可靠性支柱
<a name="reliability-pillar"></a>

 AWS Well-Architected Framework [可靠性支柱](https://docs.aws.amazon.com/wellarchitected/latest/framework/reliability.html)包含工作負載在預期情況下正確且一致地執行其預期函數的能力。這包括在整個生命週期中操作和測試工作負載的能力。

可靠的工作負載始於對軟體和基礎設施的前期設計決策。您的架構選擇會影響所有 Well-Architected 支柱的工作負載行為。為了可靠性，您必須遵循特定模式，如本節所述。

可靠性支柱著重於下列關鍵領域：
+ 工作負載架構，包括服務配額和部署模式
+ 變更管理
+ 故障管理

## 了解 Neptune 服務配額
<a name="service-quotas"></a>

 AWS 您的帳戶具有每個 的預設配額 （先前稱為*限制*) AWS 服務。除非另有說明，否則每個配額都是區域特定規定。您可以請求提高部分配額，但並非所有配額。

若要尋找 Neptune Analytics 的配額，請開啟 [Service Quotas 主控台](https://console.aws.amazon.com/servicequotas/home)。在導覽窗格中，選擇 **AWS 服務**，然後選取 **Amazon Neptune Analytics**。請注意圖表和快照數量的配額、圖表的最大佈建記憶體，以及 API 請求率。

如果最大佈建記憶體不足以容納您的資料集，請評估哪些節點和邊緣類型對您的預期分析使用量至關重要。載入一部分的資料，以便在允許的佈建容量內進行分析。許多分析工作負載，特別是執行圖形演算法的工作負載，只需要具有有限屬性集的拓撲，而不是完整的交易圖形。（如需交易工作負載與分析工作負載之間差異的討論，請參閱[效能效率支柱](performance-efficiency-pillar.md)一節。)

如果圖形數量上限不足以滿足您的預期用途：
+ 考慮合併具有類似用途的圖形。
+ 評估在特定時間必須執行的圖形數量。如果您有暫時性分析使用案例，請快照並在不再需要圖形時將其刪除。這會減少針對配額的圖形數量。
+ 考慮在不同的 中佈建圖形 AWS 帳戶。

## 了解 Neptune 部署模式
<a name="deployment-patterns"></a>

當您計劃部署 Neptune Analytics 圖形時，請了解下列決策點：
+ **植入**：使用來自 Amazon S3、現有 Neptune 資料庫叢集或現有 Neptune 資料庫快照的資料，決定是否建立空白圖形或在建立時將資料載入其中。

  建議：如果來源是 Neptune 叢集或快照，您必須在圖形建立時載入其資料。如果來源是 Amazon S3，則在建立時載入資料，如果載入資料的工作是重要的，且最好作為基礎設施佈建活動執行。如果您偏好將資料載入為資料工程或應用程式活動，請建立空白圖形，稍後再從 Amazon S3 載入資料。
+ **容量**：根據資料大小和預期的應用程式用量，估計圖形所需的佈建容量。

  建議：在建立時，[指定最大佈建記憶體](https://docs.aws.amazon.com/neptune-analytics/latest/apiref/API_CreateGraphUsingImportTask.html)以限制圖形大小。此設定是強制性的。您可以視需要稍後變更容量。
+ **可用性和容錯能力**：決定是否需要複本才能使用。複本可做為暖待命，以便在圖形故障時進行復原。具有複本的圖形復原速度比不含複本的圖形更快。另請考量圖形需要多長時間、是否僅用於暫時性分析，以及何時將其移除。

  建議：建立圖形之前，請先判斷可用性需求，例如圖形無法使用的時間長度以及可以移除的時間。
+ **網路和安全性**：判斷您是否需要公有連線、私有連線或兩者，以及是否要加密資料。

  建議**：**在建立圖形之前，了解組織需求，例如是否允許公有連線，以及圖形用戶端應用程式將部署的位置。
+ **備份和復原**：確定是否應建立快照，如果是，則確定何時或在哪些條件下建立快照。考慮您的組織是否具有災難復原 (DR) 要求。

  建議：建立快照是一種手動活動。在建立圖形之前，決定何時建立快照並考慮您的 DR 需求。

## 管理和擴展 Neptune 叢集
<a name="clusters"></a>

Neptune Analytics 圖形包含單一的記憶體最佳化執行個體。執行個體的容量 (m-NCU) 是在建立時設定。透過[管理動作](https://docs.aws.amazon.com/neptune-analytics/latest/apiref/API_UpdateGraph.html)增加佈建容量，即可垂直擴展執行個體；也可以減少佈建容量。複本是被動容錯移轉目標，因此不會增加圖形的規模。在此方面，圖形複本與 [Neptune 資料庫僅供讀取複本](https://docs.aws.amazon.com/neptune/latest/userguide/manage-console-add-replicas.html)不同，Neptune 叢集中的作用中執行個體可以處理來自應用程式的讀取操作。

複本會產生成本。複本是以圖形的 m-NCU 速率定價。例如，如果為 128 m-NCU 佈建圖形且具有單一複本，則成本為沒有複本之對等圖形的兩倍。

在分析中，擴展有兩個主要原因：
+ 為了為分析查詢和演算法提供更多記憶體和 CPU，因為個別查詢的成本很高，要執行的圖形演算法本質上很複雜，並且需要更多的資源，或者並行請求率很高。如果這類查詢遇到out-of-memory錯誤，向上擴展是合理的補救措施。
+ 支援比您計劃更大的圖形大小。例如，如果目前佈建的容量為 128 m-NCU 以支援 60 GB 的來源資料，而且您需要額外的 40 GB 的來源資料，則需要增加到 256 m-NCU。

監控 Neptune Analytics 的 CloudWatch `NumOpenCypherRequestsPerSec`指標，例如 `NumQueuedRequestsPerSec`、`GraphSizeBytes`、、 `GraphStorageUsagePercent`和 `CPUUtilization`，以判斷是否需要擴展。您可以透過 主控台 AWS CLI或 SDKs 更新圖形的組態。（如需範例和最佳實務，請參閱[卓越營運支柱](operational-excellence-pillar.md)一節。)

## 管理備份和容錯移轉事件
<a name="failover"></a>

使用複本來確保圖形在故障時仍然可用。圖形使用以日誌為基礎的持久性來遞交 中可用區域之間的變更 AWS 區域。複本可做為暖待命，並可存取此資料。如果發生故障，圖形會繼續對複本執行操作。應用程式會繼續使用相同的端點來連線至圖形。故障期間進行中的請求會產生*服務無法使用*例外狀況的錯誤。請考慮在應用程式程式碼中使用[具有退避模式的重試](https://docs.aws.amazon.com/prescriptive-guidance/latest/cloud-design-patterns/retry-backoff.html)來捕捉錯誤，並在短暫間隔後再試一次。在容錯移轉期間提出的新請求會排入佇列，並可能會遇到較長的延遲。

如果未設定複本且圖形失敗，Neptune Analytics 會從持久性儲存體復原，但復原需要更長的時間，因為 Neptune 必須重新初始化資源。

建立圖形的快照。(Neptune Analytics 不會拍攝自動快照。) 如果在建立之後定期修改圖形，請經常拍攝快照以擷取其目前狀態。如果不需要還原至較早的時間點，請刪除較舊的快照。

您可以與其他 帳戶和跨 共用快照 AWS 區域。如果您有 DR 需求，請考慮在快照的不同區域中還原圖形是否符合您的復原時間目標 (RTO) 和復原點目標 (RPO) 需求。