

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# オンデマンドキャパシティ予約 (ODCR) またはゾーンレベルのリザーブドインスタンスを設定しました。
<a name="compute-node-initialization-odcr-v3"></a>

## P4d, P4deT AWS rainium (Trn) など、複数のネットワークインターフェイスを持つインスタンスを含む ODCRs
<a name="compute-node-initialization-odcr-multi-ni-v3"></a>

クラスター設定ファイルで、`HeadNode` がパブリックサブネットにあり、コンピューティングノードがプライベートサブネットにあることを確認します。

## ODCR が ターゲット ODCRS
<a name="compute-node-initialization-odcr-targeted-v3"></a>

### [オンデマンドキャパシティ予約 (ODCR) を使用してインスタンスを起動する](launch-instances-odcr-v3.md) の指示に従って既に `/opt/slurm/etc/pcluster/run_instances_overrides.json` を配置したのに `Unable to read file '/opt/slurm/etc/pcluster/run_instances_overrides.json'.` が表示されている
<a name="compute-node-initialization-odcr-targeted-noread-v3"></a>

ターゲット ODCRs で AWS ParallelCluster バージョン 3.1.1 から 3.2.1 を使用していて、[実行インスタンスも JSON ファイルを上書き](launch-instances-odcr-v3.md)する場合、JSON ファイルが正しくフォーマットされていない可能性があります。`clustermgtd.log` で次のようなエラーが表示されることがあります。

```
Unable to read file '/opt/slurm/etc/pcluster/run_instances_overrides.json'. 
Using default: {} in  /var/log/parallelcluster/clustermgtd.
```

次を実行して、JSON ファイル形式が正しいことを確認します。

```
$ echo /opt/slurm/etc/pcluster/run_instances_overrides.json | jq
```

### クラスターの作成に失敗したときは `clustermgtd.log` で、またはジョブの実行に失敗したときは `slurm_resume.log` で `Found RunInstances parameters override.` が表示されている
<a name="compute-node-initialization-odcr-targeted-override-v3"></a>

[JSON ファイルをオーバーライドしてインスタンスを実行する](launch-instances-odcr-v3.md)を使用している場合は、`/opt/slurm/etc/pcluster/run_instances_overrides.json` ファイルでキュー名とコンピューティングリソース名を正しく設定していることを確認します。

### ジョブの実行に失敗したとき `slurm_resume.log` で、またはクラスターの作成に失敗したとき `clustermgtd.log` で `An error occurred (InsufficientInstanceCapacity)` が表示されている
<a name="compute-node-initialization-odcr-ii-capacity-v3"></a>

#### PG-ODCR (プレイスメントグループ ODCR) を使用する
<a name="compute-node-initialization-odcr-ii-pg-capacity-v3"></a>

関連するプレイスメントグループを使用して ODCR を作成する場合、設定ファイルでは同じプレイスメントグループ名を使用する必要があります。クラスター設定で対応する[プレイスメントグループ名](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup)を設定します。

#### ゾーンレベルのリザーブドインスタンスを使用する
<a name="compute-node-initialization-odcr-ii-zonal-capacity-v3"></a>

クラスター設定で `PlacementGroup`/`Enabled` を `true` としてゾーンレベルのリザーブドインスタンスを使用している場合、次のようなエラーが表示されることがあります。

```
We currently do not have sufficient trn1.32xlarge capacity in the Availability Zone you requested (us-east-1d). Our system will be working on provisioning additional capacity. 
You can currently get trn1.32xlarge capacity by not specifying an Availability Zone in your request or choosing us-east-1a, us-east-1b, us-east-1c, us-east-1e, us-east-1f.
```

これは、ゾーンレベルのリザーブドインスタンスが同じ UC (またはスパイン) に配置されていないために発生することがあります。プレイスメントグループを使用しているときに、容量不足エラー (ICE) が発生することがあります。クラスター設定の `PlacementGroup` グループ設定を無効にして、クラスターがインスタンスを割り当てることができるかどうかを判断することにより、このケースについて確認できます。