本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 CollectionConfig API 設定張量集合
使用 CollectionConfig API 作業設定張量集合。如果使用 Debugger 支援的深度學習架構和機器學習演算法,Debugger 提供預先構建的張量集合,涵蓋各種參數的正規表示式 (regex)。如下列範例程式碼所示,新增您要偵錯的內建張量集合。
from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig(name="weights"), CollectionConfig(name="gradients") ]
前面的集合設定了 Debugger 勾點,基於預設的 "save_interval" 值,每 500 個步驟儲存張量。
如需可用 Debugger 內建集合的完整清單,請參閱 Debugger 內建集合
如果您想自訂內建集合,例如變更儲存間隔和張量規則表達式,請使用下列 CollectionConfig 範本調整參數。
from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="tensor_collection", parameters={ "key_1": "value_1", "key_2": "value_2", ... "key_n": "value_n" } ) ]
如需可用參數索引鍵的更多相關資訊,請參閱 Amazon SageMaker Python SDK
from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="losses", parameters={ "train.save_interval": "100", "eval.save_interval": "10" } ) ]
提示
此張量集合組態物件可同時用於 DebuggerHookConfig 和 Rule API 作業。