PCS でのカスタム Slurm AWS 設定のトラブルシューティング - AWS PCS

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

PCS でのカスタム Slurm AWS 設定のトラブルシューティング

Slurm カスタム設定で AWS PCS リソースを作成または更新するときにエラーが発生した場合は、ログ記録を使用して問題を診断して解決できます。

互換性のない Slurm カスタム設定のトラブルシューティング

問題: クラスター、コンピューティングノードグループ、またはキューオペレーションを実行すると、次のようなエラーメッセージが表示されます。

{OPERATION} failed. The Slurm custom settings of the cluster might be incompatible. Check the settings and try again.

このエラーは、次のオペレーションで発生する可能性があります。

  • CreateCluster

  • CreateComputeNodeGroup

  • UpdateComputeNodeGroup

  • CreateQueue

  • UpdateQueue

解決策: ログ記録を有効にして特定の問題を理解し、互換性のない設定のトラブルシューティングを行います。

互換性のない Slurm カスタム設定をトラブルシューティングするには
  1. クラスターがまだ存在しない場合は作成するか、既存のクラスターがログ記録を有効にできる状態であることを確認します。

  2. クラスターのログ記録を有効にします。詳細な手順については、「PCS AWS のログ記録とモニタリング」を参照してください。

    注記

    ログ記録は、クラスターの作成後に有効にできます。

  3. ログを確認して、非互換性の原因となっている特定の Slurm 設定の問題を特定します。

  4. ログ情報に基づいて互換性のないカスタム設定を修正し、オペレーションを再試行します。

サポートされている Slurm カスタム設定の詳細については、以下を参照してください。