Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Parametri avanzati di Amazon SageMaker AI per gli endpoint di inferenza
Le metriche avanzate forniscono dati di monitoraggio a livello di istanza e contenitore per gli endpoint Amazon AI in tempo reale. SageMaker Quando abiliti i parametri avanzati, i parametri di Amazon CloudWatch possono includere InstanceId e AcceleratorId dimensioni (la disponibilità varia in base allo spazio dei nomi) per una visibilità granulare per istanza, per contenitore e per GPU. ContainerId Sono disponibili metriche avanzate per endpoint e componenti di inferenza a modello singolo. Multi-Container Gli endpoint (MCE) supportano metriche avanzate a livello di istanza ma non metriche a livello di contenitore.
Caratteristiche chiave delle metriche avanzate:
-
Instance-level granularità. Le metriche di utilizzo e invocazione includono una
InstanceIddimensione che identifica l'istanza specifica che ospita l'endpoint. È disponibile per tutti gli endpoint in tempo reale. -
Container-level granularità. Per gli endpoint che utilizzano componenti di inferenza, le metriche includono una
ContainerIddimensione che identifica il contenitore specifico che esegue il modello. Container-level le dimensioni vengono visualizzate sia nello spazio deiAWS/SageMakernomi (metriche di invocazione) che nello spazio dei nomi (metriche di utilizzo)./aws/sagemaker/InferenceComponents -
Per-GPU granularità. Le metriche di utilizzo della GPU includono una
AcceleratorIddimensione che identifica la GPU specifica su un'istanza. -
Frequenza di pubblicazione configurabile. Puoi configurare l'intervallo di pubblicazione delle metriche su 10, 30, 60, 120, 180, 240 o 300 secondi. Il valore predefinito è 60 secondi. Questo intervallo si applica alle metriche di utilizzo indipendentemente dal fatto che le metriche avanzate siano abilitate. Con le metriche avanzate abilitate, si applica anche alle metriche di invocazione.
Abilitazione di metriche avanzate
Puoi abilitare le metriche avanzate impostando EnableEnhancedMetrics su True nel MetricsConfigparametro quando chiami l'CreateEndpointConfigAPI.
Il MetricsConfig parametro ha i seguenti campi:
| Parametro | Tipo | Obbligatorio | Predefinita | Description |
|---|---|---|---|---|
EnableEnhancedMetrics |
Boolean | No | False |
Abilita le dimensioni metriche a livello di istanza e di contenitore. |
MetricPublishFrequencyInSeconds |
Numero intero | No | 60 |
L'intervallo, in secondi, in base al quale le metriche vengono pubblicate su Amazon. CloudWatch L’impostazione predefinita è |
Nota
MetricsConfigè impostato a livello di configurazione dell'endpoint. Non è possibile configurare impostazioni diverse per i singoli componenti di inferenza sullo stesso endpoint.
Per abilitare metriche avanzate su un endpoint esistente, crea una nuova configurazione dell'endpoint con MetricsConfig le impostazioni desiderate, quindi chiama UpdateEndpointcon il nuovo nome di configurazione dell'endpoint. Ciò attiva una distribuzione progressiva. blue/green Le metriche avanzate non vengono visualizzate fino al completamento della distribuzione. Lo stesso processo si applica quando si modificano MetricsConfig le impostazioni su un endpoint già configurato.
Quando si configuraMetricsConfig, entrambi DescribeEndpointConfigrestituiscono DescribeEndpointMetricsConfigla risposta.
Quando abiliti metriche avanzate, l' SageMaker intelligenza artificiale aggiunge dimensioni aggiuntive alle metriche in tre CloudWatch namespace: /aws/sagemaker/Endpoints per le metriche di utilizzo, AWS/SageMaker per le metriche di invocazione e per le metriche di utilizzo dei componenti di inferenza. /aws/sagemaker/InferenceComponents
Instance-level metriche di utilizzo
Il /aws/sagemaker/Endpoints namespace include metriche di utilizzo per tutti gli endpoint in tempo reale, compresi quelli che utilizzano componenti di inferenza. Quando abiliti le metriche avanzate, le dimensioni InstanceId and AcceleratorId (solo metriche GPU) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. SageMaker Metriche degli endpoint AI
Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:
| Dimensione | Description |
|---|---|
InstanceId |
Filtra le metriche di utilizzo per un'istanza specifica. |
AcceleratorId |
(Solo metriche GPU) Filtra le metriche di utilizzo per una GPU specifica. |
Metriche di chiamata a livello di istanza e contenitore
Il AWS/SageMaker namespace include metriche di invocazione. Quando abiliti le metriche avanzate, le dimensioni InstanceId and ContainerId (solo componenti di inferenza) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. SageMaker Metriche di invocazione degli endpoint AI
Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:
| Dimensione | Description |
|---|---|
InstanceId |
Filtra le metriche di chiamata per un'istanza specifica. |
ContainerId |
(Solo componenti di inferenza) Filtra le metriche di invocazione per un contenitore specifico. |
Container-level metriche di utilizzo
Il /aws/sagemaker/InferenceComponents namespace include metriche di utilizzo per gli endpoint che utilizzano componenti di inferenza. Quando abiliti le metriche avanzate, le dimensioni InstanceIdContainerId, e AcceleratorId (solo metriche GPU) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. SageMaker Metriche dei componenti di inferenza AI
Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:
| Dimensione | Description |
|---|---|
InstanceId |
Filtra le metriche di utilizzo per un'istanza specifica. |
ContainerId |
Filtra le metriche di utilizzo per un contenitore specifico. |
AcceleratorId |
(Solo metriche GPU) Filtra le metriche di utilizzo per una GPU specifica. |
Frequenza metrica configurabile
È possibile configurare l'intervallo in cui vengono pubblicate le metriche. CloudWatch La frequenza predefinita è 60 secondi.
Valori validi: 10, 30, 60, 120, 180, 240 o 300 secondi.
Quando EnableEnhancedMetrics è impostata suFalse, questa frequenza si applica solo alle metriche di utilizzo; le metriche di invocazione continuano a essere pubblicate all'intervallo predefinito di 60 secondi. Se impostata suTrue, questa frequenza si applica sia alle metriche di utilizzo che a quelle di invocazione.
Nota
Le metriche pubblicate a intervalli inferiori a 60 secondi (alta risoluzione) vengono conservate per 3 ore.
CloudWatch I prezzi standard si applicano per metrica per combinazione di dimensioni unica. Le metriche avanzate aumentano il numero di flussi di metriche perché ogni istanza, contenitore e GPU crea combinazioni di dimensioni aggiuntive. Per i dettagli sui prezzi, consulta la pagina CloudWatch dei prezzi di Amazon
Esempi di codice: configura metriche avanzate
Gli esempi seguenti mostrano come creare una configurazione di endpoint con metriche avanzate abilitate e come verificare la configurazione.