Come creare un endpoint di inferenza asincrona - Amazon SageMaker AI

Come creare un endpoint di inferenza asincrona

Crea un endpoint asincrono nello stesso modo in cui creeresti un endpoint utilizzando i servizi di hosting SageMaker AI:

  • Crea un modello in SageMaker AI con CreateModel.

  • Crea una configurazione endpoint con CreateEndpointConfig.

  • Crea un endpoint HTTPS con CreateEndpoint.

Per creare un endpoint, devi prima creare un modello con CreateModel, in cui punti all'artefatto del modello e a un percorso di registro Docker (immagine). Quindi crea una configurazione utilizzando CreateEndpointConfig in cui specifichi uno o più modelli creati utilizzando l’API CreateModel per l’implementazione e le risorse di cui desideri che SageMaker AI effettui il provisioning. Crea un endpoint con CreateEndpoint utilizzando la configurazione specificata nella richiesta. Puoi aggiornare un endpoint asincrono con l'API UpdateEndpoint. Invia e ricevi richieste di inferenza dal modello ospitato sull'endpoint con InvokeEndpointAsync. Puoi eliminare i tuoi endpoint con l'API DeleteEndpoint.

Per un elenco completo delle immagini SageMaker disponibili, consulta Available Deep Learning Containers Images. Per informazioni su come creare un'immagine Docker, consulta Container con codice di inferenza personalizzato.