Implementazione di modelli da JumpStart con Amazon SageMaker Studio
Le fasi seguenti mostrano come implementare i modelli da JumpStart con Amazon SageMaker Studio.
Prerequisiti
Verifica di aver configurato le funzionalità di inferenza sui cluster Amazon SageMaker HyperPod. Per ulteriori informazioni, consulta Configurazione dei cluster HyperPod per l’implementazione dei modelli.
Creazione di un’implementazione HyperPod
-
In Amazon SageMaker Studio, apri la pagina di destinazione JumpStart dal riquadro di navigazione a sinistra.
-
In Tutti i modelli pubblici, scegli un modello da implementare.
Nota
Se hai selezionato un modello gated, dovrai accettare il Contratto di licenza con l’utente finale (EULA).
-
Scegli SageMaker HyperPod.
-
In Impostazioni di implementazione, JumpStart consiglierà un’istanza per l’implementazione. Se necessario, puoi modificare queste impostazioni.
-
Se modifichi il tipo di istanza, assicurati che sia compatibile con il cluster HyperPod scelto. Se non ci sono istanze compatibili, dovrai selezionare un nuovo cluster HyperPod o contattare l’amministratore per aggiungere istanze compatibili al cluster.
-
Per dare priorità all’implementazione del modello, installa il componente aggiuntivo per la governance delle attività, crea allocazioni delle risorse di calcolo e imposta le classificazioni delle attività per la policy del cluster. Una volta completata questa operazione, dovrebbe apparire un’opzione per selezionare una priorità per l’implementazione del modello, che può essere utilizzata per la prelazione di altre implementazioni e attività nel cluster.
-
Inserisci il namespace al quale l’amministratore ti ha fornito l’accesso. Potrebbe essere necessario contattare direttamente l’amministratore per ottenere il namespace esatto. Una volta fornito un namespace valido, il pulsante Implementa dovrebbe diventare attivo per implementare il modello.
-
-
Scegli Implementa e attendi la creazione dell’endpoint.
-
Dopo aver creato l’endpoint, seleziona Testa inferenza.
Modifica di un’implementazione HyperPod
-
In Amazon SageMaker Studio, seleziona Calcolo e Cluster HyperPod dal riquadro di navigazione a sinistra.
-
In Implementazioni, scegli l’implementazione del cluster HyperPod da modificare.
-
Dall’icona con tre puntini verticali (⋮), scegli Modifica.
-
In Impostazioni di implementazione, puoi abilitare o disabilitare il dimensionamento automatico e modificare il numero massimo di repliche.
-
Seleziona Salva.
-
Lo stato diventa Aggiornamento in corso. Quando viene visualizzato di nuovo lo stato In servizio, le modifiche sono complete e viene visualizzato un messaggio di conferma.
Eliminazione di un’implementazione HyperPod
-
In Amazon SageMaker Studio, seleziona Calcolo e Cluster HyperPod dal riquadro di navigazione a sinistra.
-
In Implementazioni, scegli l’implementazione del cluster HyperPod da modificare.
-
Dall’icona con tre puntini verticali (⋮), scegli Elimina.
-
Nella finestra Elimina implementazione HyperPod, seleziona la casella di controllo.
-
Scegliere Delete (Elimina).
-
Lo stato diventa Eliminazione in corso. Una volta eliminata l’implementazione di HyperPod, vedrai un messaggio di conferma.