Controllo preventivo della richiesta e della risposta degli endpoint per i dati di serie temporali - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Controllo preventivo della richiesta e della risposta degli endpoint per i dati di serie temporali

Si consiglia di implementare il modello su un endpoint di inferenza SageMaker AI in tempo reale e di inviare richieste all'endpoint. Esamina manualmente le richieste e le risposte per verificare che entrambe siano conformi ai requisiti nelle sezioni Richieste degli endpoint per i dati di serie temporali e Risposta degli endpoint per i dati di serie temporali. Se il container del modello supporta le richieste batch, puoi iniziare con una singola richiesta di record e quindi provare con due o più record.

I comandi seguenti mostrano come richiedere una risposta utilizzando la AWS CLI. AWS CLI È preinstallato nelle istanze Studio e Notebook. SageMaker Per installare AWS CLI, segui la guida all'installazione.

aws sagemaker-runtime invoke-endpoint \ --endpoint-name $ENDPOINT_NAME \ --content-type $CONTENT_TYPE \ --accept $ACCEPT_TYPE \ --body $REQUEST_DATA \ $CLI_BINARY_FORMAT \ /dev/stderr 1>/dev/null

I parametri sono definiti come segue:

  • $ENDPOINT NAME: il nome dell’endpoint.

  • $CONTENT_TYPE: il tipo MIME della richiesta (input del container del modello).

  • $ACCEPT_TYPE: il tipo MIME della risposta (output del container del modello).

  • $REQUEST_DATA: la stringa payload richiesta.

  • $CLI_BINARY_FORMAT: il formato del parametro dell’interfaccia a riga di comando (CLI). Per la AWS CLI versione 1, questo parametro deve rimanere vuoto. Per v2, questo parametro deve essere impostato su --cli-binary-format raw-in-base64-out.

Nota

AWS CLI Per impostazione predefinita, v2 passa i parametri binari come stringhe con codifica base64. I seguenti esempi di richiesta e risposta da e verso l'endpoint utilizzano v1. AWS CLI

Example 1

Nell’esempio di codice seguente, la richiesta è costituita da un solo record.

aws sagemaker-runtime invoke-endpoint \ --endpoint-name test-endpoint-json \ --content-type application/json \ --accept application/json \ --body '{"target": [1, 2, 3, 4, 5], "start": "2024-01-01 01:00:00"}' \ /dev/stderr 1>/dev/null

Il frammento seguente mostra l’output della risposta corrispondente.

{'predictions': {'mean': [1, 2, 3, 4, 5]}
Example 2

Nell’esempio di codice seguente, la richiesta contiene due record.

aws sagemaker-runtime invoke-endpoint \ --endpoint-name test-endpoint-json-2 \ --content-type application/json \ --accept application/json \ --body $'{"instances": [{"target":[1, 2, 3], "start":"2024-01-01 01:00:00", "dynamic_feat":[[1, 2, 3, 4, 5], [1, 2, 3, 4, 5]]}], {"target":[1, 2, 3], "start":"2024-01-02 01:00:00", "dynamic_feat":[[1, 2, 3, 4, 5], [1, 2, 3, 4, 5]]}]}' \ dev/stderr 1>/dev/null

Di seguito è riportato l’output della risposta.

{'predictions': [{'mean': [1, 2, 3, 4, 5]}, {'mean': [1, 2, 3, 4, 5]}]}