Come creare un endpoint di inferenza asincrona
Crea un endpoint asincrono nello stesso modo in cui creeresti un endpoint utilizzando i servizi di hosting SageMaker AI:
Crea un modello in SageMaker AI con
CreateModel.Crea una configurazione endpoint con
CreateEndpointConfig.Crea un endpoint HTTPS con
CreateEndpoint.
Per creare un endpoint, devi prima creare un modello con CreateModel, in cui punti all'artefatto del modello e a un percorso di registro Docker (immagine). Quindi crea una configurazione utilizzando CreateEndpointConfig in cui specifichi uno o più modelli creati utilizzando l’API CreateModel per l’implementazione e le risorse di cui desideri che SageMaker AI effettui il provisioning. Crea un endpoint con CreateEndpoint utilizzando la configurazione specificata nella richiesta. Puoi aggiornare un endpoint asincrono con l'API UpdateEndpoint. Invia e ricevi richieste di inferenza dal modello ospitato sull'endpoint con InvokeEndpointAsync. Puoi eliminare i tuoi endpoint con l'API DeleteEndpoint.
Per un elenco completo delle immagini SageMaker disponibili, consulta Available Deep Learning Containers Images