本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
[cluster] 區段
定義可用於建立叢集的叢集範本。組態檔案可以包含多個[cluster]區段。
相同的叢集範本可用來建立多個叢集。
格式是 [cluster 。依預設會使用 [cluster]區段中由 cluster_template設定命名的[global]區段,但可以在pcluster命令列上覆寫。cluster-template-name]
cluster-template-name 必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
[cluster default]
主題
additional_cfn_template
(選用) 定義要與叢集一起啟動的其他AWS CloudFormation範本。此額外範本用於建立叢集外但屬於叢集生命週期一部分的資源。
此值必須是公有範本的 HTTP URL,並提供所有參數。
沒有預設值。
additional_cfn_template = https://<bucket-name>.s3.amazonaws.com/my-cfn-template.yaml
additional_iam_policies
(選用) 指定 Amazon EC2 IAM 政策的 Amazon Resource Name (ARNs) 清單。除了以逗號AWS ParallelCluster分隔 所需的許可之外,此清單還會連接到叢集中使用的根角色。IAM 政策名稱及其 ARN 不同。名稱不能用作 的引數additional_iam_policies。
如果您的意圖是將額外政策新增至叢集節點的預設設定,建議您使用 additional_iam_policies設定傳遞額外的自訂 IAM 政策,而不是使用 ec2_iam_role設定來新增特定 EC2 政策。這是因為 additional_iam_policies 已新增至AWS ParallelCluster所需的預設許可。現有的 ec2_iam_role 必須包含所有必要的許可。不過,由於在新增功能時,所需的許可通常會從發行版本變更為發行版本,因此現有 ec2_iam_role可能會淘汰。
沒有預設值。
additional_iam_policies = arn:aws:iam::123456789012:policy/CustomEC2Policy
注意
additional_iam_policies 2.5.0 AWS ParallelCluster版中已新增 的支援。
base_os
(必要) 指定將哪個作業系統類型用於叢集。
可用選項如下:
-
alinux2 -
centos7 -
ubuntu1804 -
ubuntu2004
注意
對於以AWS Graviton 為基礎的執行個體,僅ubuntu2004支援 ubuntu1804、 alinux2或 。
注意
2.11.4 AWS ParallelCluster版已centos8移除 的支援。ubuntu2004 新增 的支援,並在 2.11.0 AWS ParallelCluster版中ubuntu1604移除 alinux和 的支援。centos8 已新增 的支援,並在 2.10.0 AWS ParallelCluster版centos6中移除 的支援。2.6.0 版中alinux2AWS ParallelCluster已新增 的支援。ubuntu1804 已新增 的支援,並在 2.5.0 AWS ParallelCluster版ubuntu1404中移除 的支援。
除了下表中AWS 區域提及不支援 的特定 之外centos7。所有其他AWS商業區域都支援下列所有作業系統。
| 分割區 (AWS 區域) | alinux2 |
centos7 |
ubuntu1804 和 ubuntu2004 |
|---|---|---|---|
| 商業 (AWS 區域未特別提及) | True | True | True |
AWS GovCloud (美國東部) (us-gov-east-1) |
True | False | True |
AWS GovCloud (美國西部) (us-gov-west-1) |
True | False | True |
中國 (北京) (cn-north-1) |
True | False | True |
中國 (寧夏) (cn-northwest-1) |
True | False | True |
注意
base_os 參數也會決定用來登入叢集的使用者名稱。
-
centos7:centos -
ubuntu1804和ubuntu2004:ubuntu -
alinux2:ec2-user
注意
在 2.7.0 AWS ParallelCluster版之前, base_os 參數為選用,預設值為 alinux。從 2.7.0 版開始AWS ParallelCluster,需要 base_os 參數。
注意
如果 scheduler 參數為 awsbatch,則僅支援 alinux2。
base_os = alinux2
cluster_resource_bucket
(選用) 指定用於託管叢集建立時產生的資源的 Amazon S3 儲存貯體名稱。儲存貯體必須已啟用版本控制。如需詳細資訊,請參閱《Amazon Simple Storage Service 使用者指南》中的使用版本控制。此儲存貯體可用於多個叢集。儲存貯體必須與叢集位於相同的區域。
如果未指定此參數,則會在建立叢集時建立新的儲存貯體。新儲存貯體的名稱為 parallelcluster-。在此名稱中,random_stringRandom_string 是英數字元的隨機字串。所有叢集資源都會存放在格式為 的路徑中。 bucket_name/resource_directoryresource_directory的格式為 ,其中 stack_name-random_stringstack_name 是 使用的其中一個CloudFormation堆疊的名稱AWS ParallelCluster。您可以在parallelcluster-堆疊輸出中的 值中找到 clusternamebucket_name ResourcesS3Bucket的值。您可以在相同堆疊的ArtifactS3RootDirectory輸出值中找到 resource_directory 的值。
預設值為 parallelcluster-。random_string
cluster_resource_bucket = amzn-s3-demo-bucket
注意
cluster_resource_bucket 2.10.0 AWS ParallelCluster版已新增 的支援。
更新政策:如果變更此設定,則不允許更新。無法強制更新此設定。
cluster_type
(選用) 定義要啟動的叢集類型。如果已定義queue_settings設定,則必須將此設定取代為[queue]區段中的compute_type設定。
有效選項為:ondemand 和 spot。
預設值為 ondemand。
如需 Spot 執行個體的詳細資訊,請參閱 使用 競價型執行個體。
注意
使用 Spot 執行個體需要AWSServiceRoleForEC2Spot服務連結角色存在於您的帳戶中。若要使用 在帳戶中建立此角色AWS CLI,請執行下列命令:
aws iam create-service-linked-role --aws-service-name spot.amazonaws.com
如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的 Spot 執行個體請求的服務連結角色。
cluster_type = ondemand
compute_instance_type
(選用) 定義用於叢集運算節點的 Amazon EC2 執行個體類型。執行個體類型的架構必須與用於 master_instance_type設定的架構相同。如果已定義queue_settings設定,則必須將此設定取代為[compute_resource]區段中的instance_type設定。
如果您使用的是awsbatch排程器,請參閱 UI AWS Batch中的運算環境建立,以取得支援的執行個體類型清單。
當排程器為 awsbatch 時,預設為 t2.micro、optimal。
compute_instance_type = t2.micro
注意
2.8.0 AWSAWS ParallelCluster版中已新增對 Graviton 型執行個體 (包括 A1和 C6g執行個體) 的支援。
compute_root_volume_size
(選用) 以 GB (GiB) 為單位指定 ComputeFleet 根磁碟區大小。AMI 必須支援 growroot。
預設值為 35。
注意
對於 2.5.0 和 2.10.4 之間的AWS ParallelCluster版本,預設值為 25。在 2.5.0 AWS ParallelCluster版之前,預設值為 20。
compute_root_volume_size = 35
custom_ami
(選用) 指定要用於前端和運算節點的自訂 AMI ID,而非預設發佈AMIs
沒有預設值。
custom_ami = ami-00d4efc81188687a0
如果自訂 AMI 需要其他許可才能啟動,則必須將這些許可新增至使用者和前端節點政策。
例如,如果自訂 AMI 具有與其相關聯的加密快照,則使用者和前端節點政策都需要下列其他政策:
cw_log_settings
(選用) 使用 CloudWatch Logs 組態識別 [cw_log]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [cw_log] 區段、 Amazon CloudWatch 儀表板和 與 Amazon CloudWatch Logs 的整合。
例如,以下設定指定 啟動的 區段[cw_log custom-cw]用於 CloudWatch Logs 組態。
cw_log_settings = custom-cw
注意
2.6.0 AWS ParallelCluster版已cw_log_settings新增 的支援。
dashboard_settings
(選用) 使用 CloudWatch 儀表板組態識別 [dashboard]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [dashboard]一節。
例如,以下設定指定[dashboard custom-dashboard啟動 區段用於 CloudWatch 儀表板組態。
dashboard_settings = custom-dashboard
注意
dashboard_settings 2.10.0 AWS ParallelCluster版已新增 的支援。
dcv_settings
(選用) 使用 Amazon DCV 組態識別 [dcv]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [dcv]一節。
例如,下列設定指定 [dcv custom-dcv] 啟動的 區段用於 Amazon DCV 組態。
dcv_settings = custom-dcv
注意
在以AWS Graviton 為基礎的執行個體上,僅在 上支援 Amazon DCValinux2。
注意
2.5.0 AWS ParallelCluster版已dcv_settings新增 的支援。
desired_vcpus
(選用) 指定運算環境中所需的 vCPUs 數量。僅在排程器是 awsbatch 時才使用。
預設值為 4。
desired_vcpus = 4
disable_cluster_dns
(選用) 指定是否不應建立叢集的 DNS 項目。根據預設,AWS ParallelCluster會建立 Route 53 託管區域。如果 disable_cluster_dns 設定為 true,則不會建立託管區域。
預設值為 false。
disable_cluster_dns = true
警告
叢集需要名稱解析系統才能正常運作。如果 disable_cluster_dns 設定為 true,則還必須提供額外的名稱解析系統。
重要
disable_cluster_dns = true只有在指定 queue_settings設定時才支援。
注意
2.9.1 AWS ParallelCluster版已disable_cluster_dns新增 的支援。
disable_hyperthreading
(選用) 停用頭部和運算節點上的超執行緒。並非所有執行個體類型都可以停用超執行緒。如需支援停用超執行緒的執行個體類型清單,請參閱《Amazon EC2 使用者指南》中的每個執行個體類型的 CPU 核心和每個 CPU 核心的執行緒。如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的disable_hyperthreading設定。
預設值為 false。
disable_hyperthreading = true
注意
disable_hyperthreading 只會在 時影響前端節點scheduler = awsbatch。
注意
2.5.0 AWS ParallelCluster版中disable_hyperthreading已新增 的支援。
ebs_settings
(選用) 使用安裝在前端節點上的 Amazon EBS 磁碟區來識別[ebs]區段。使用多個 Amazon EBS 磁碟區時,請在清單中輸入這些參數,每個參數以逗號分隔。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
最多支援五 (5) 個額外的 Amazon EBS 磁碟區。
如需詳細資訊,請參閱 [ebs]一節。
例如,下列設定指定 Amazon EBS 磁碟區啟動[ebs custom1]和[ebs custom2]使用的區段。
ebs_settings = custom1, custom2
ec2_iam_role
(選用) 定義連接至叢集中所有執行個體的 Amazon EC2 現有 IAM 角色的名稱。IAM 角色名稱及其 Amazon Resource Name (ARN) 是不同的。ARNs 無法用作 的引數ec2_iam_role。
如果指定此選項,則會忽略 additional_iam_policies 設定。如果您的意圖是將額外的政策新增至叢集節點的預設設定,建議您使用 additional_iam_policies設定傳遞額外的自訂 IAM 政策,而不是使用 ec2_iam_role設定。
如果未指定此選項,則會使用AWS ParallelCluster Amazon EC2 的預設 IAM 角色。如需詳細資訊,請參閱AWS Identity and Access Management 中的 角色 AWS ParallelCluster。
沒有預設值。
ec2_iam_role = ParallelClusterInstanceRole
efs_settings
(選用) 指定與 Amazon EFS 檔案系統相關的設定。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [efs]一節。
例如,下列設定指定 啟動的 區段[efs customfs]用於 Amazon EFS 檔案系統組態。
efs_settings = customfs
enable_efa
(選用) 如果存在,請指定已為運算節點啟用 Elastic Fabric Adapter (EFA)。若要檢視支援 EFA 的 EC2 執行個體清單,請參閱《Amazon EC2 Linux 執行個體使用者指南》中的支援的執行個體類型。如需詳細資訊,請參閱Elastic Fabric Adapter。如果已定義queue_settings設定,則可以定義此設定,也可以定義 [queue]區段中的enable_efa設定。應使用叢集置放群組以充分減少執行個體之間的延遲。如需詳細資訊,請參閱placement及placement_group。
enable_efa = compute
注意
在 2.10.1 AWS ParallelCluster版中新增了對以 Arm 為基礎的 Graviton2 執行個體的 EFA 支援。
enable_efa_gdr
(選用) 從 2.11.3 AWS ParallelCluster版開始,此設定沒有效果。如果執行個體類型和作業系統都支援 GPUDirect RDMA (遠端直接記憶體存取),則一律會啟用 Elastic Fabric Adapter (EFA) 支援。
注意
AWS ParallelCluster 2.10.0 版到 2.11.2 版:如果 compute,請指定為運算節點啟用 GPUDirect RDMA (遠端直接記憶體存取) 的 Elastic Fabric Adapter (EFA) 支援。將此設定設為 compute需要將 enable_efa設定設為 compute。特定作業系統 ( 為 alinux2、ubuntu1804、 或 p4d.24xlarge) 上的特定執行個體類型 (base_os) 支援對 GPUDirect RDMA centos7的 EFA 支援ubuntu2004。如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的enable_efa_gdr設定。應使用叢集置放群組以充分減少執行個體之間的延遲。如需詳細資訊,請參閱placement及placement_group。
enable_efa_gdr = compute
注意
2enable_efa_gdr.10.0 AWS ParallelCluster版已新增 的支援。
enable_intel_hpc_platform
(選用) 如果存在,表示接受 Intel Parallel Studio 的最終使用者授權合約 = centos7) 支援此 enable_intel_hpc_platform 設定。
預設值為 false。
enable_intel_hpc_platform = true
注意
enable_intel_hpc_platform 參數與 Graviton AWS型執行個體不相容。
注意
2.5.0 AWS ParallelCluster版已enable_intel_hpc_platform新增 的支援。
encrypted_ephemeral
(選用) 使用 LUKS (Linux 統一金鑰設定),以不可復原的記憶體內金鑰加密暫時性執行個體存放區磁碟區。
如需詳細資訊,請參閱https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md
預設值為 false。
encrypted_ephemeral = true
ephemeral_dir
(選用) 定義使用執行個體存放區磁碟區的掛載路徑。
預設值為 /scratch。
ephemeral_dir = /scratch
extra_json
(選用) 定義合併到 Chef 的額外 JSONdna.json。如需詳細資訊,請參閱建置自訂 AWS ParallelCluster AMI。
預設值為 {}。
extra_json = {}
注意
從 2.6.1 AWS ParallelCluster版開始,大多數安裝配方在啟動節點時預設會略過,以改善啟動時間。若要以啟動時間的費用執行所有安裝配方以獲得更佳的回溯相容性,請將 "skip_install_recipes" : "no"新增至 extra_json設定中的 cluster金鑰。例如:
extra_json = { "cluster" : { "skip_install_recipes" : "no" } }
fsx_settings
(選用) 指定定義 FSx for Lustre 組態的區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [fsx]一節。
例如,以下設定指定 啟動的 區段[fsx fs]用於 FSx for Lustre 組態。
fsx_settings = fs
iam_lambda_role
(選用) 定義現有AWS Lambda執行角色的名稱。此角色會連接到叢集中的所有 Lambda 函數。如需詳細資訊,請參閱《AWS Lambda開發人員指南》中的 AWS Lambda執行角色。
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
IAM 角色名稱及其 Amazon Resource Name (ARN) 是不同的。ARNs 無法用作 的引數iam_lambda_role。如果同時定義 iam_lambda_role ec2_iam_role和 ,且 scheduler為 sge、 slurm或 torque,則不會建立任何角色。如果 scheduler是 awsbatch,則會在 期間建立角色pcluster start。如需範例政策,請參閱 ParallelClusterLambdaPolicy 使用 SGE、 Slurm或 Torque和 ParallelClusterLambdaPolicy 使用 awsbatch。
沒有預設值。
iam_lambda_role = ParallelClusterLambdaRole
注意
2.10.1 AWS ParallelCluster版已iam_lambda_role新增 的支援。
initial_queue_size
(選用) 設定要作為叢集中運算節點啟動的 Amazon EC2 執行個體初始數量。如果已定義queue_settings設定,則必須移除此設定,並由[compute_resource]區段中的initial_count設定取代。
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
此設定僅適用於傳統排程器 (SGE、Slurm 和 Torque)。如果maintain_initial_size設定為 true,則initial_queue_size設定必須至少為一 (1)。
如果排程器是 awsbatch,請改用 min_vcpus。
預設為 2。
initial_queue_size = 2
key_name
(選用) 為現有的 Amazon EC2 金鑰對命名,以啟用對執行個體的 SSH 存取。
key_name = mykey
注意
在 2.11.0 AWS ParallelCluster版之前, key_name是必要的設定。
maintain_initial_size
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
(選用) 維持傳統排程器的 Auto Scaling 群組初始大小 (SGE、 Slurm和 Torque)。
如果排程器是 awsbatch,請改用 desired_vcpus。
此設定是布林值旗標。如果設定為 true,Auto Scaling 群組的成員不會比 的值少initial_queue_size,且 的值initial_queue_size必須是一 (1) 或更高。叢集仍可擴充至 max_queue_size 值。如果cluster_type = spot這樣,Auto Scaling 群組可以中斷執行個體,而且大小可以降至 以下initial_queue_size。
如果設定為 false,Auto Scaling 群組可以縮減為零 (0) 個成員,以防止資源在不需要時閒置。
如果已定義 queue_settings 設定,則必須移除此設定,並由[compute_resource]區段中的 initial_count和 min_count設定取代。
預設為 false。
maintain_initial_size = false
master_instance_type
(選用) 定義用於前端節點的 Amazon EC2 執行個體類型。執行個體類型的架構必須與用於 compute_instance_type設定的架構相同。
在具有 免費方案AWS 區域的 中, 預設為 免費方案執行個體類型 (t2.micro 或 t3.micro)。在沒有免費方案AWS 區域的 中, 預設為 t3.micro。如需AWS免費方案的詳細資訊,請參閱 AWS免費方案FAQs
master_instance_type = t2.micro
注意
在 2.10.1 AWS ParallelCluster版之前, t2.micro 全部預設為AWS 區域。在 2.10.0 AWS ParallelCluster版中,前端節點p4d.24xlarge不支援 。2.8.0 AWSAWS ParallelCluster版中已新增對 Graviton 型執行個體 (例如 A1和 C6g) 的支援。
master_root_volume_size
(選用) 以 GB (GiB) 為單位指定前端節點根磁碟區大小。AMI 必須支援 growroot。
預設值為 35。
注意
對於 2.5.0 和 2.10.4 之間的AWS ParallelCluster版本,預設值為 25。在 2.5.0 AWS ParallelCluster版之前,預設值為 20。
master_root_volume_size = 35
max_queue_size
(選用) 設定可在叢集中啟動的 Amazon EC2 執行個體數量上限。如果已定義queue_settings設定,則必須移除此設定,並由各[compute_resource]區段中的max_count設定取代。
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
此設定僅適用於傳統排程器 (SGE、Slurm 和 Torque)。
如果排程器是 awsbatch,請改用 max_vcpus。
預設為 10。
max_queue_size = 10
更新政策:此設定可以在更新期間變更,但如果值減少,則應該停止運算機群。否則,現有的節點可能會終止。
max_vcpus
(選用) 指定運算環境中 vCPUs的數量上限。僅在排程器是 awsbatch 時才使用。
預設值為 20。
max_vcpus = 20
min_vcpus
(選用) 維護awsbatch排程器 Auto Scaling 群組的初始大小。
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
如果排程器是 SGE、Slurm 或 Torque,請改用 maintain_initial_size。
運算環境的成員數不得少於 min_vcpus 的值。
預設為 0。
min_vcpus = 0
placement
(選用) 定義叢集置放群組邏輯,讓整個叢集或只有運算執行個體可以使用叢集置放群組。
如果已定義queue_settings設定,則應移除此設定,並以每個[queue]區段placement_group的設定取代。如果相同的置放群組用於不同的執行個體類型,則請求可能會因為容量不足錯誤而失敗。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的執行個體容量不足。多個佇列只有在預先建立並在每個佇列placement_group的設定中設定時,才能共用置放群組。如果每個[queue]區段都定義了placement_group設定,則前端節點不能位於佇列的置放群組中。
有效選項為 cluster 或 compute。
當排程器為 時,不會使用此參數awsbatch。
預設值為 compute。
placement = compute
placement_group
(選用) 定義叢集置放群組。如果已定義queue_settings設定,則應移除此設定,並以[queue]區段中的placement_group設定取代。
有效選項為下列值:
-
DYNAMIC -
現有的 Amazon EC2 叢集置放群組名稱
設為 DYNAMIC 時,即會建立唯一的置放群組,並在叢集堆疊過程將其刪除。
當排程器為 時,不會使用此參數awsbatch。
如需置放群組的詳細資訊,請參閱《Amazon EC2 使用者指南》中的置放群組。如果相同的置放群組用於不同的執行個體類型,則請求可能會因為容量不足錯誤而失敗。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的執行個體容量不足。
沒有預設值。
並非所有執行個體類型都支援叢集置放群組。例如, 的預設執行個體類型t3.micro不支援叢集置放群組。如需有關支援叢集置放群組的執行個體類型清單的資訊,請參閱《Amazon EC2 使用者指南》中的叢集置放群組規則和限制。如需使用置放群組的秘訣,請參閱 置放群組和執行個體啟動問題。
placement_group = DYNAMIC
post_install
(選用) 指定在所有節點引導操作完成後執行的安裝後指令碼 URL。如需詳細資訊,請參閱自訂引導操作。
使用 awsbatch做為排程器時,安裝後指令碼只會在前端節點上執行。
參數格式可以是 http:// 或 hostname/path/to/script.shs3://。bucket-name/path/to/script.sh
沒有預設值。
post_install = s3://<bucket-name>/my-post-install-script.sh
post_install_args
(選用) 指定要傳遞至安裝後指令碼的引數引號清單。
沒有預設值。
post_install_args = "argument-1argument-2"
pre_install
(選用) 指定在啟動任何節點部署引導操作之前執行的預先安裝指令碼 URL。如需詳細資訊,請參閱自訂引導操作。
使用 awsbatch做為排程器時,預先安裝指令碼只會在前端節點上執行。
參數格式可以是 http:// 或 hostname/path/to/script.shs3://。bucket-name/path/to/script.sh
沒有預設值。
pre_install = s3://bucket-name/my-pre-install-script.sh
pre_install_args
(選用) 指定要傳遞至預先安裝指令碼的引數引號清單。
沒有預設值。
pre_install_args = "argument-3argument-4"
proxy_server
(選用) 定義 HTTP 或 HTTPS 代理伺服器,通常為 http://。x.x.x.x:8080
沒有預設值。
proxy_server = http://10.11.12.13:8080
queue_settings
(選用) 指定叢集使用佇列而非同質運算機群,以及使用哪些[queue]區段。列出的第一個[queue]區段是預設排程器佇列。queue 區段名稱必須以小寫字母開頭,包含不超過 30 個字元,且僅包含小寫字母、數字和連字號 (-)。
重要
queue_settings 只有在 scheduler 設定為 時,才支援 slurm。不得指定 cluster_type、compute_instance_type、initial_queue_size、maintain_initial_sizemax_queue_size、placement、placement_group、 和 spot_price設定。您可以在 [cluster]區段或 [queue]區段中指定 disable_hyperthreading和 enable_efa設定,但不能同時指定兩者。
最多支援五 (5) 個[queue]區段。
如需詳細資訊,請參閱 [queue]一節。
例如,下列設定指定使用啟動 [queue q1]和 [queue q2] 的區段。
queue_settings = q1, q2
注意
2.9.0 AWS ParallelCluster版已queue_settings新增 的支援。
raid_settings
(選用) 使用 Amazon EBS 磁碟區 RAID 組態識別 [raid]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [raid]一節。
例如,以下設定指定[raid rs]開始用於 Auto Scaling 組態的 區段。
raid_settings = rs
s3_read_resource
(選用) 指定將AWS ParallelCluster節點授予唯讀存取權的 Amazon S3 資源。
例如, arn:aws:s3:::提供 my_corporate_bucket*my_corporate_bucket 儲存貯體和儲存貯體中物件的唯讀存取權。
如需格式的詳細資訊,請參閱使用 Amazon S3。
沒有預設值。
s3_read_resource = arn:aws:s3:::my_corporate_bucket*
s3_read_write_resource
(選用) 指定 Amazon S3 資源,哪些AWS ParallelCluster節點獲得讀取/寫入存取權。
例如, arn:aws:s3::: 提供 my_corporate_bucket/Development/*my_corporate_bucket 儲存貯體 Development 資料夾中所有物件的讀取/寫入存取權。
如需格式的詳細資訊,請參閱使用 Amazon S3。
沒有預設值。
s3_read_write_resource = arn:aws:s3:::my_corporate_bucket/*
scaling_settings
使用 Auto Scaling 組態識別 [scaling]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [scaling]一節。
例如,下列設定會指定 Auto Scaling 組態使用的 [scaling custom] 區段。
scaling_settings = custom
scheduler
(必要) 定義叢集的排程器。
有效選項為下列值:
awsbatch-
AWS Batch
如需
awsbatch排程器的詳細資訊,請參閱聯網設定和AWS Batch (awsbatch)。 sge-
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
Son of Grid Engine (SGE)
slurm-
Slurm Workload Manager (Slurm)
torque-
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
Torque Resource Manager (Torque)
注意
在 2.7.0 AWS ParallelCluster版之前, scheduler 參數為選用,預設值為 sge。從 2.7.0 AWS ParallelCluster版開始,需要 scheduler 參數。
scheduler = slurm
shared_dir
(選用) 定義掛載共用 Amazon EBS 磁碟區的路徑。
請勿將此選項與多個 Amazon EBS 磁碟區搭配使用。反之,請在每個[ebs]區段下提供shared_dir值。
如需使用多個 Amazon EBS 磁碟區的詳細資訊,請參閱[ebs]一節。
預設值為 /shared。
下列範例顯示掛載在 的共用 Amazon EBS 磁碟區/myshared。
shared_dir = myshared
spot_bid_percentage
(選用) 當 awsbatch是排程器時,設定用於計算 ComputeFleet Spot 價格上限的隨需百分比。
如果未指定,則會選取目前的 Spot 市價,上限為隨需價格。
spot_bid_percentage = 85
spot_price
注意
從 2.11.5 版開始,AWS ParallelCluster不支援使用 SGE或 Torque排程器。
(選用) 在傳統排程器上設定 ComputeFleet 的最高 Spot 價格 (SGE、 Slurm和 Torque)。僅在 cluster_type 設定設為 spot 時使用。如果您未指定值,則會向您收取 Spot 價格,以隨需價格為上限。如果已定義queue_settings設定,則必須移除此設定,並由[compute_resource]各區段中的spot_price設定取代。
如果排程器是 awsbatch,請改用 spot_bid_percentage。
如需尋找符合您需求的 Spot 執行個體的協助,請參閱 Spot 執行個體顧問
spot_price = 1.50
注意
在 2.5.0 AWS ParallelCluster版中,如果spot_price但未指定 cluster_type = spot ,則 ComputeFleet 的執行個體啟動會失敗。這是在 2.5.1 AWS ParallelCluster版中修正的。
tags
(選用) 定義要使用的標籤CloudFormation。
如果透過 --tags 指定命令列標籤,則會使用組態標籤來合併它們。
命令列標籤會覆寫具有相同金鑰的組態標籤。
標籤採用 JSON 格式。請勿在大括號外使用引號。
如需詳細資訊,請參閱AWS CloudFormation《 使用者指南》中的CloudFormation資源標籤類型。
tags = {"key" : "value", "key2" : "value2"}
注意
更新政策不支援將 2.8.0 版tags的設定AWS ParallelCluster變更為 2.9.1 版。
對於 2.10.0 到 2.11.7 版,支援變更tags設定的列出的更新政策並不準確。不支援修改此設定時的叢集更新。
template_url
(選用) 定義用於建立叢集之AWS CloudFormation範本的路徑。
更新使用原先建立堆疊所用的範本。
預設為 https://。aws_region_name-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version.cfn.json
警告
這是進階參數。此設定的任何變更都會由您自行承擔風險。
template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.9.cfn.json
vpc_settings
(必要) 使用部署叢集的 Amazon VPC 組態來識別 [vpc]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。
如需詳細資訊,請參閱 [vpc]一節。
例如,下列設定指定 [vpc public] 啟動的 區段用於 Amazon VPC 組態。
vpc_settings = public