Abilitazione di metriche avanzate Instance-level metriche di utilizzo Metriche di chiamata a livello di istanza e contenitore Container-level metriche di utilizzo Frequenza metrica configurabile Esempi di codice: configura metriche avanzate

Parametri avanzati di Amazon SageMaker AI per gli endpoint di inferenza

Le metriche avanzate forniscono dati di monitoraggio a livello di istanza e contenitore per gli endpoint Amazon AI in tempo reale. SageMaker Quando abiliti i parametri avanzati, i parametri di Amazon CloudWatch possono includere InstanceId e AcceleratorId dimensioni (la disponibilità varia in base allo spazio dei nomi) per una visibilità granulare per istanza, per contenitore e per GPU. ContainerId Sono disponibili metriche avanzate per endpoint e componenti di inferenza a modello singolo. Multi-Container Gli endpoint (MCE) supportano metriche avanzate a livello di istanza ma non metriche a livello di contenitore.

Caratteristiche chiave delle metriche avanzate:

Instance-level granularità. Le metriche di utilizzo e invocazione includono una InstanceId dimensione che identifica l'istanza specifica che ospita l'endpoint. È disponibile per tutti gli endpoint in tempo reale.
Container-level granularità. Per gli endpoint che utilizzano componenti di inferenza, le metriche includono una ContainerId dimensione che identifica il contenitore specifico che esegue il modello. Container-level le dimensioni vengono visualizzate sia nello spazio dei AWS/SageMaker nomi (metriche di invocazione) che nello spazio dei nomi (metriche di utilizzo). /aws/sagemaker/InferenceComponents
Per-GPU granularità. Le metriche di utilizzo della GPU includono una AcceleratorId dimensione che identifica la GPU specifica su un'istanza.
Frequenza di pubblicazione configurabile. Puoi configurare l'intervallo di pubblicazione delle metriche su 10, 30, 60, 120, 180, 240 o 300 secondi. Il valore predefinito è 60 secondi. Questo intervallo si applica alle metriche di utilizzo indipendentemente dal fatto che le metriche avanzate siano abilitate. Con le metriche avanzate abilitate, si applica anche alle metriche di invocazione.

Abilitazione di metriche avanzate

Puoi abilitare le metriche avanzate impostando EnableEnhancedMetrics su True nel MetricsConfigparametro quando chiami l'CreateEndpointConfigAPI.

Il MetricsConfig parametro ha i seguenti campi:

MetricsConfig parametri
Parametro	Tipo	Obbligatorio	Predefinita	Description
`EnableEnhancedMetrics`	Boolean	No	`False`	Abilita le dimensioni metriche a livello di istanza e di contenitore.
`MetricPublishFrequencyInSeconds`	Numero intero	No	`60`	L'intervallo, in secondi, in base al quale le metriche vengono pubblicate su Amazon. CloudWatch L’impostazione predefinita è `60`. Valori validi:`10`,`30`,`60`,, `120180`,`240`. `300` Quando `EnableEnhancedMetrics` è impostato su`False`, questo intervallo si applica solo alle metriche di utilizzo; le metriche di chiamata continuano a essere pubblicate all'intervallo predefinito di 60 secondi. Se impostato su, questo intervallo si applica sia alle metriche di utilizzo che di `True` invocazione.

Nota

MetricsConfigè impostato a livello di configurazione dell'endpoint. Non è possibile configurare impostazioni diverse per i singoli componenti di inferenza sullo stesso endpoint.

Per abilitare metriche avanzate su un endpoint esistente, crea una nuova configurazione dell'endpoint con MetricsConfig le impostazioni desiderate, quindi chiama UpdateEndpointcon il nuovo nome di configurazione dell'endpoint. Ciò attiva una distribuzione progressiva. blue/green Le metriche avanzate non vengono visualizzate fino al completamento della distribuzione. Lo stesso processo si applica quando si modificano MetricsConfig le impostazioni su un endpoint già configurato.

Quando si configuraMetricsConfig, entrambi DescribeEndpointConfigrestituiscono DescribeEndpointMetricsConfigla risposta.

Quando abiliti metriche avanzate, l' SageMaker intelligenza artificiale aggiunge dimensioni aggiuntive alle metriche in tre CloudWatch namespace: /aws/sagemaker/Endpoints per le metriche di utilizzo, AWS/SageMaker per le metriche di invocazione e per le metriche di utilizzo dei componenti di inferenza. /aws/sagemaker/InferenceComponents

Instance-level metriche di utilizzo

Il /aws/sagemaker/Endpoints namespace include metriche di utilizzo per tutti gli endpoint in tempo reale, compresi quelli che utilizzano componenti di inferenza. Quando abiliti le metriche avanzate, le dimensioni InstanceId and AcceleratorId (solo metriche GPU) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. SageMaker Metriche degli endpoint AI

Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:

Dimensioni aggiuntive per le metriche di utilizzo a livello di istanza
Dimensione	Description
`InstanceId`	Filtra le metriche di utilizzo per un'istanza specifica.
`AcceleratorId`	(Solo metriche GPU) Filtra le metriche di utilizzo per una GPU specifica.

Metriche di chiamata a livello di istanza e contenitore

Il AWS/SageMaker namespace include metriche di invocazione. Quando abiliti le metriche avanzate, le dimensioni InstanceId and ContainerId (solo componenti di inferenza) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. SageMaker Metriche di invocazione degli endpoint AI

Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:

Dimensioni aggiuntive per le metriche di invocazione
Dimensione	Description
`InstanceId`	Filtra le metriche di chiamata per un'istanza specifica.
`ContainerId`	(Solo componenti di inferenza) Filtra le metriche di invocazione per un contenitore specifico.

Container-level metriche di utilizzo

Il /aws/sagemaker/InferenceComponents namespace include metriche di utilizzo per gli endpoint che utilizzano componenti di inferenza. Quando abiliti le metriche avanzate, le dimensioni InstanceIdContainerId, e AcceleratorId (solo metriche GPU) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. SageMaker Metriche dei componenti di inferenza AI

Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:

Dimensioni aggiuntive per le metriche di utilizzo a livello di contenitore
Dimensione	Description
`InstanceId`	Filtra le metriche di utilizzo per un'istanza specifica.
`ContainerId`	Filtra le metriche di utilizzo per un contenitore specifico.
`AcceleratorId`	(Solo metriche GPU) Filtra le metriche di utilizzo per una GPU specifica.

Frequenza metrica configurabile

È possibile configurare l'intervallo in cui vengono pubblicate le metriche. CloudWatch La frequenza predefinita è 60 secondi.

Valori validi: 10, 30, 60, 120, 180, 240 o 300 secondi.

Quando EnableEnhancedMetrics è impostata suFalse, questa frequenza si applica solo alle metriche di utilizzo; le metriche di invocazione continuano a essere pubblicate all'intervallo predefinito di 60 secondi. Se impostata suTrue, questa frequenza si applica sia alle metriche di utilizzo che a quelle di invocazione.

Nota

Le metriche pubblicate a intervalli inferiori a 60 secondi (alta risoluzione) vengono conservate per 3 ore.

CloudWatch I prezzi standard si applicano per metrica per combinazione di dimensioni unica. Le metriche avanzate aumentano il numero di flussi di metriche perché ogni istanza, contenitore e GPU crea combinazioni di dimensioni aggiuntive. Per i dettagli sui prezzi, consulta la pagina CloudWatch dei prezzi di Amazon.

Esempi di codice: configura metriche avanzate

Gli esempi seguenti mostrano come creare una configurazione di endpoint con metriche avanzate abilitate e come verificare la configurazione.

Crea una configurazione degli endpoint con metriche avanzate

Verifica la configurazione avanzata delle metriche

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Metriche in CloudWatch

CloudWatch registri

Parametri avanzati di Amazon SageMaker AI per gli endpoint di inferenza

Abilitazione di metriche avanzate

Nota

Instance-level metriche di utilizzo

Metriche di chiamata a livello di istanza e contenitore

Container-level metriche di utilizzo

Frequenza metrica configurabile

Nota

Esempi di codice: configura metriche avanzate

Crea una configurazione degli endpoint con metriche avanzate

Esempio Crea una configurazione degli endpoint con metriche avanzate

Esempio Crea una configurazione degli endpoint con metriche avanzate

Verifica la configurazione avanzata delle metriche

Esempio Verifica la configurazione avanzata delle metriche

Esempio Verifica la configurazione avanzata delle metriche