Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzare le regole di profilazione integrate gestite da Amazon SageMaker Debugger
Le regole di profilazione integrate di Debugger Amazon SageMaker analizzano i parametri di sistema e le operazioni del framework raccolte durante l'addestramento di un modello. Debugger offre il l’operazione API ProfilerRule che aiuta a configurare le regole per monitorare l’addestramento, le risorse e le operazioni di calcolo e rilevare anomalie. Ad esempio, le regole di profilazione possono aiutarti a rilevare eventuali problemi computazionali quali colli di bottiglia della CPU, tempi di attesa I/O eccessivi, carico di lavoro squilibrato tra gli addetti alla GPU e sottoutilizzo delle risorse di calcolo. Per visualizzare l'elenco completo delle regole di profilazione integrate disponibili, consulta Elenco delle regole del profiler integrate di Debugger. I seguenti argomenti mostrano come utilizzare le regole integrate di Debugger con le impostazioni dei parametri predefinite e i valori dei parametri personalizzati.
Nota
Le regole integrate vengono fornite tramite container di elaborazione Amazon SageMaker e gestite completamente da Debugger SageMaker senza costi aggiuntivi. Per ulteriori informazioni sulla fatturazione, consulta la pagina Prezzi di Amazon SageMaker
Argomenti
Usa le regole di profilazione integrate di Debugger SageMaker con le relative impostazioni dei parametri predefinite
Per aggiungere regole integrate di Debugger SageMaker in uno strumento di valutazione, è necessario configurare un oggetto di elenco rules. Il codice di esempio seguente mostra la struttura di base dell'elenco delle regole integrate di Debugger SageMaker.
from sagemaker.debugger import Rule, ProfilerRule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_1()), ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_2()), ... ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_n()), ... # You can also append more debugging rules in the Rule.sagemaker(rule_configs.*()) format. ] estimator=Estimator( ... rules=rules )
Per un elenco completo delle regole integrate, consulta Elenco delle regole del profiler integrate di Debugger.
Per utilizzare le regole di profilazione e controllare le prestazioni di calcolo e l'avanzamento del processo di addestramento, aggiungi la regola ProfilerReport di Debugger SageMaker. Questa regola attiva tutte le regole integrate della famiglia Debugger ProfilerRule ProfilerRule. Inoltre, questa regola genera un report di profilazione aggregato. Per ulteriori informazioni, consulta Report di profilazione generato con Debugger SageMaker. Puoi utilizzare il codice seguente per aggiungere la regola del report di profilazione allo strumento di valutazione dell’addestramento.
from sagemaker.debugger import Rule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.ProfilerReport()) ]
Quando avviii il processo di addestramento con la regola ProfilerReport, Debugger raccoglie i dati sull'utilizzo delle risorse ogni 500 millisecondi. Debugger analizza l'utilizzo delle risorse per identificare se il modello presenta problemi di collo di bottiglia. Se le regole rilevano anomalie di addestramento, lo stato di valutazione della regola cambia in IssueFound. Puoi configurare azioni automatizzate, come la notifica dei problemi di addestramento e l'interruzione dei processi di addestramento utilizzando Eventi Amazon CloudWatch e AWS Lambda. Per ulteriori informazioni, consulta Azione sulle regole di Amazon SageMaker Debugger.
Usa le regole integrate di Debugger con valori di parametro personalizzati
Se desideri modificare i valori dei parametri delle regole integrate e personalizzare l'espressione regolare della raccolta di tensori, configura i parametri base_config e rule_parameters per i metodi di classe ProfilerRule.sagemaker e Rule.sagemaker. Nel caso dei metodi di classe Rule.sagemaker, puoi anche personalizzare le raccolte di tensori tramite il parametro. collections_to_save Per istruzioni su come utilizzare la classe CollectionConfig, consulta Configurazione delle raccolte di tensori con l’API CollectionConfig.
Utilizza il seguente modello di configurazione per le regole integrate per personalizzare i valori dei parametri. Modificando i parametri delle regole come si desidera, è possibile regolare la sensibilità delle regole da avviare.
-
L'argomento
base_configè il punto in cui si chiamano i metodi delle regole integrate. -
L'argomento
rule_parametersconsiste nel modificare i valori chiave predefiniti delle regole integrate elencate in Elenco delle regole del profiler integrate di Debugger.
Per ulteriori informazioni sulla classe di regole Debugger, sui metodi e sui parametri, consulta SageMaker AI Debugger Rule class
from sagemaker.debugger import Rule, ProfilerRule, rule_configs, CollectionConfig rules=[ ProfilerRule.sagemaker( base_config=rule_configs.BuiltInProfilerRuleName(), rule_parameters={ "key": "value" } ) ]
Le descrizioni dei parametri e gli esempi di personalizzazione dei valori sono disponibili per ogni regola in Elenco delle regole del profiler integrate di Debugger.
Per una configurazione JSON di basso livello delle regole integrate di Debugger che utilizzano l'API CreateTrainingJob, consulta Configurazione di Debugger utilizzando l’API SageMaker.