Dépannage AWS des mises à jour du cluster - AWS PCS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Dépannage AWS des mises à jour du cluster

Cette rubrique vous aide à identifier et à résoudre les problèmes courants qui peuvent survenir lors de la mise à jour des configurations de cluster.

La mise à jour échoue en raison d'une erreur de configuration comptable

Cause courante

Le cluster entre en UPDATE_FAILED état et le message d'erreur indique un problème de configuration comptable. Cela se produit généralement lorsque la configuration de gestion des comptes est incompatible avec la version actuelle de Slurm ou contient des paramètres non valides.

Résolution

Vérifiez la compatibilité de vos paramètres de comptabilité avec la version Slurm de votre cluster et soumettez une demande de mise à jour corrigée avec des paramètres de configuration valides.

La mise à jour échoue avec une erreur de paramètres personnalisés

Cause courante

Le cluster entre en UPDATE_FAILED état et le message d'erreur indique un problème de paramètres personnalisés de Slurm. Cela se produit lorsque vous fournissez des valeurs de paramètres Slurm non valides ou des combinaisons de paramètres non prises en charge.

Résolution

Validez vos paramètres personnalisés Slurm par rapport aux paramètres pris en charge et soumettez une demande de mise à jour corrigée avec des valeurs et des combinaisons de paramètres valides.

Impossible de soumettre une demande de mise à jour

Cause courante

Le bouton de mise à jour est désactivé dans la console ou l'API renvoie une erreur de niveau 400. Cela se produit lorsque le cluster n'est pas dans un état approprié, que les ressources associées ne sont pas actives ou que votre configuration présente des échecs de validation.

Résolution

Attendez que le cluster et toutes les ressources associées atteignent leur ACTIVE état, puis vérifiez que votre configuration ne comporte aucune erreur de validation avant de soumettre à nouveau la demande de mise à jour.

Erreurs de validation

Cause courante

La commande revient immédiatement avec une erreur HTTP de niveau 400 et un message descriptif. Cela se produit en raison d'un état du cluster, d'un état de ressource ou de paramètres de configuration non valides.

Résolution

Corrigez l'erreur de validation spécifique mentionnée dans la réponse et réessayez l'opération de mise à jour.