Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Registri di Scheduler in PCS AWS
Puoi configurare AWS PCS per inviare dati di registrazione dettagliati dal tuo programma di pianificazione del cluster ad Amazon CloudWatch Logs, Amazon Simple Storage Service (Amazon S3) e Amazon Data Firehose. Questo può aiutare nel monitoraggio e nella risoluzione dei problemi.
Indice
Prerequisiti
Il responsabile IAM che gestisce il cluster AWS PCS deve consentire l'pcs:AllowVendedLogDeliveryForResourceazione.
Il seguente esempio di politica IAM concede le autorizzazioni richieste.
Configura i registri dello scheduler
È possibile configurare i registri dello scheduler per il cluster AWS PCS con o. Console di gestione AWS AWS CLI
I percorsi e i nomi dei flussi di log di Scheduler
Il percorso e il nome dei log dello scheduler AWS PCS dipendono dal tipo di destinazione.
-
CloudWatch Log
-
Uno stream CloudWatch Logs segue questa convenzione di denominazione.
AWSLogs/PCS/${cluster_id}/${log_name}_${scheduler_major_version}.logEsempio
AWSLogs/PCS/abcdef0123/slurmctld_24.05.log
-
-
Bucket S3
-
Un percorso di output del bucket S3 segue questa convenzione di denominazione:
AWSLogs/${account-id}/PCS/${region}/${cluster_id}/${log_name}/${scheduler_major_version}/yyyy/MM/dd/HH/Esempio
AWSLogs/111111111111/PCS/us-east-2/abcdef0123/slurmctld/24.05/2024/09/01/00.
-
Il nome di un oggetto S3 segue questa convenzione:
PCS_${log_name}_${scheduler_major_version}_#{expr date 'event_timestamp', format: "yyyy-MM-dd-HH"}_${cluster_id}_${hash}.logEsempio
PCS_slurmctld_24.05_2024-09-01-00_abcdef0123_0123abcdef.log
-
Esempio di record di log dello scheduler
AWS I log dello scheduler PCS sono strutturati. Includono campi come l'identificatore del cluster, il tipo di scheduler, le versioni principali e di patch, oltre al messaggio di registro emesso dal processo del controller Slurm. Ecco un esempio.
{
"resource_id": "s3431v9rx2",
"resource_type": "PCS_CLUSTER",
"event_timestamp": 1721230979,
"log_level": "info",
"log_name": "slurmctld",
"scheduler_type": "slurm",
"scheduler_major_version": "25.05",
"scheduler_patch_version": "3",
"node_type": "controller_primary",
"message": "[2024-07-17T15:42:58.614+00:00] Running as primary controller\n"
}