View a markdown version of this page

管理 Lustre 版本 - FSx for Lustre

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

管理 Lustre 版本

FSx for Lustre 目前支援 Lustre 社群發行的多個長音支援 (LTS) Lustre 版本。較新的 LTS 版本提供效能增強、新功能,以及支援用戶端執行個體的最新 Linux 核心版本等優點。您可以使用 AWS 管理主控台 AWS CLI或 SDK,在幾分鐘內將檔案系統升級至較新的 Lustre 版本 AWS SDKs 。

FSx for Lustre 目前支援 Lustre LTS 2.10、2.12 和 2.15 版。您可以使用 AWS 管理主控台 或使用 describe-file-systems AWS CLI 命令來判斷 FSx for Lustre 檔案系統的 LTS 版本。

在您執行 Lustre 版本升級之前,建議您遵循中所述的步驟Lustre 版本升級的最佳實務

Lustre 版本升級的最佳實務

升級 FSx for Lustre 檔案系統的 Lustre 版本之前,我們建議您遵循下列最佳實務:

  • 在非生產環境中測試:在升級生產檔案系統之前,在生產檔案系統的複本上測試 Lustre 版本升級。這可確保生產工作負載的升級程序順暢。

  • 確保用戶端相容性:確認在用戶端執行個體上執行的 Linux 核心版本與您計劃升級的 Lustre 版本相容。如需詳細資訊,請參閱 Lustre 檔案系統和用戶端核心相容性

  • 備份您的資料:

    • 對於未連結至 S3 的檔案系統:我們建議您在升級 Lustre 版本之前建立 FSx 備份,以便擁有檔案系統的已知還原點。如果您的檔案系統已啟用自動每日備份,Amazon FSx 會在升級之前自動建立檔案系統的備份。

    • 對於連結至 S3 的檔案系統,建議您確保所有變更都已匯出至 S3,再升級。如果您已啟用自動匯出,請檢查 AgeOfOldestQueuedMessage AutoExport 指標是否為零,以確認所有變更都已成功匯出至 S3。如果您尚未啟用自動匯出,則可以執行手動資料儲存庫任務 (DRT) 匯出,以在升級之前將檔案系統與 S3 儲存貯體同步。

  • 規劃檔案系統停機時間:為了讓升級成功,所有用戶端都必須在升級開始之前中斷連線,並在升級完成之前保持中斷連線。總停機時間取決於識別和卸載所有用戶端的時間、升級程序本身 (大多數檔案系統通常不到 30 分鐘),以及升級完成後重新掛載用戶端和恢復工作負載的時間。用戶端卸載和重新掛載持續時間取決於您的環境和用戶端數量。

執行升級

若要將 FSx for Lustre 檔案系統升級到較新版本,請遵循下列步驟:

  1. 卸載所有用戶端:在開始升級之前,您必須從存取檔案系統的所有用戶端執行個體卸載檔案系統。您可以在 Amazon CloudWatch 上使用 ClientConnections 指標來驗證所有用戶端是否已成功卸載 - 此指標應顯示零連線。如果有任何用戶端保持與檔案系統的連線,升級程序將不會成功。

    您可以在存放在檔案系統根目錄的 .fsx/clientConnections 檔案中,檢視連線至檔案系統的用戶端網路識別符 (NIDs) 清單。此檔案每 5 分鐘更新一次。您可以使用 cat命令來顯示檔案的內容,如本範例所示:

    cat /test/.fsx/clientConnections
  2. 升級 Lustre 版本:您可以使用 Amazon FSx 主控台 AWS CLI、 或 Amazon FSx API 來升級 FSx for Lustre 檔案系統的 Lustre 版本。建議您將檔案系統升級至 FSx for Lustre 支援的最新 Lustre 版本。

    更新檔案系統的 Lustre 版本 (主控台)

    1. https://console.aws.amazon.com/fsx/:// 開啟 Amazon FSx 主控台。

    2. 在左側導覽窗格中選擇檔案系統。在檔案系統清單中,選擇您要更新 Lustre 版本的 FSx for Lustre 檔案系統。

    3. 針對動作,選擇更新檔案系統 Lustre 版本。或者,在摘要面板中,選擇檔案系統的 Lustre 版本欄位旁的更新更新檔案系統 Lustre 版本對話方塊隨即出現。更新檔案系統 Lustre 版本對話方塊隨即出現。

    4. 選取新的 Lustre 版本欄位中,選擇 Lustre 版本。您選擇的值必須比目前的 Lustre 版本更新。

    5. 選擇更新

    更新檔案系統的 Lustre 版本 (CLI)

    若要更新 FSx for Lustre 檔案系統的 Lustre 版本,請使用 AWS CLI 命令 update-file-system。(同等 API 動作為 UpdateFileSystem。) 設定下列參數:

    • --file-system-id設定為您要更新之檔案系統的 ID。

    • 針對您要更新的檔案系統,將 --file-system-type-version設定為較新的 Lustre 版本。

    下列範例會將檔案系統的 Lustre 版本從 2.12 更新至 2.15:

    aws fsx update-file-system \ --file-system-id fs-0123456789abcdef0 \ --file-system-type-version "2.15"

    如果升級工作流程失敗 (例如,如果用戶端仍連接到檔案系統),檔案系統會自動復原至其原始 Lustre 版本和狀態。在這種情況下,管理動作事件將包含失敗訊息,指導如何在重試升級之前解決問題。

  3. 掛載所有用戶端:您可以使用 Amazon FSx 主控台或 中的更新索引標籤來監控 Lustre 版本更新的進度describe-file-systems AWS CLI。一旦 Lustre 版本升級狀態顯示為 Completed,您就可以在用戶端執行個體上安全地重新掛載檔案系統,並繼續工作負載。