AWS ParallelCluster AMI 自訂 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS ParallelCluster AMI 自訂

在某些情況下AWS ParallelCluster,需要為 建置自訂 AMI。本節涵蓋建置自訂AWS ParallelCluster AMI 時的考量事項。

您可以使用下列其中一種方法來建置自訂AWS ParallelCluster AMI:

  1. 建立建置映像組態檔案,然後使用 pcluster CLI 搭配 EC2 Image Builder 建置映像。此程序是自動化、可重複的,並支援監控。如需詳細資訊,請參閱pcluster映像命令。

  2. 從AWS ParallelCluster AMI 建立執行個體,然後登入執行個體並進行手動修改。最後,使用 Amazon EC2 從修改的執行個體建立新的 AMI。此程序花費的時間較少。不過,它不是自動化或可重複的,也不支援使用 pcluster CLI 映像監控命令。

如需這些方法的詳細資訊,請參閱 建置自訂 AWS ParallelCluster AMI

AWS ParallelCluster AMI 自訂考量事項

無論您如何建立自訂映像,我們都建議您執行初步驗證測試,並包含監控所建立映像狀態的規定。

若要使用 建置自訂 AMIpcluster,您可以使用 EC2 Image Builder 用來建置自訂映像的 和 區段來建立建置映像組態檔案Build ImageBuild 區段指定建置映像所需的映像建置器。這包括 ParentImage(基礎映像) 和 Components映像建置器元件定義在建立映像之前自訂執行個體或測試由建立映像啟動的執行個體所需的一系列步驟。如需詳細資訊,請參閱 EC2 Image Builder 使用者指南中的使用映像建置器建立自訂元件

從叢集呼叫 build-image 以建立自訂映像時,映像建置器會使用建置映像組態搭配AWS ParallelCluster技術指南,在您的AWS ParallelCluster上引導ParentImage。Image Builder 會下載元件、執行建置和驗證階段、建立 AMI、從 AMI 啟動執行個體,以及執行測試。程序完成時,Image Builder 接著會產生新的映像或停止訊息。

執行自訂元件驗證測試

在組態中包含映像建置器元件之前,請使用下列其中一種方法進行測試和驗證。由於映像建置器程序最多可能需要 1 小時,我們建議您事先測試元件。這可以為您節省大量時間。

指令碼案例

在建置映像程序以外的執行中執行個體中測試指令碼,並確認指令碼以結束碼 0 結束。

Amazon Resource Name (ARN) 案例

在建置映像程序之外,在執行中的執行個體中測試元件文件。如需需求清單,請參閱《映像建置器使用者指南》中的元件管理員

成功驗證後,將 元件新增至建置映像組態

驗證自訂元件是否正常運作後,將其新增至建置映像組態檔案

使用 pcluster命令監控映像建置器程序,以協助偵錯

describe-image

使用此命令來監控建置映像狀態。

list-image-log-streams

使用此命令可取得日誌串流IDs,您可以使用 來擷取日誌事件get-image-log-events

get-image-log-events

使用此命令可取得建置映像程序事件的日誌串流。

例如,您可以使用下列命令來結束建置映像事件。

$ watch -n 1 'pcluster get-image-log-events -i <image-id> \ --log-stream-name/1 <pcluster-version> \ --query "events[*].message" | tail -n 50'

get-image-stack-events

使用此命令來擷取映像建置器建立之堆疊的映像堆疊事件。

export-image-logs

使用此命令儲存映像日誌。

如需AWS ParallelCluster日誌和 Amazon CloudWatch 的詳細資訊,請參閱 Amazon CloudWatch Logs 建置映像日誌Amazon CloudWatch 儀表板

其他考量

新AWS ParallelCluster版本和自訂 AMIs

如果您建置並使用自訂 AMI,則必須在每個新AWS ParallelCluster版本中重複用來建立自訂 AMI 的步驟。

自訂引導操作

檢閱 自訂引導操作區段,判斷您要進行的修改是否可以編寫指令碼,並支援未來的AWS ParallelCluster版本。

使用自訂 AMIs

您可以在 / CustomAmiImage / Scheduling / SlurmQueues - Name/ Image / CustomAmi區段的叢集組態中指定自訂 AMIs。

若要對自訂 AMI 驗證警告進行疑難排解,請參閱 對自訂 AMI 問題進行故障診斷