As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Invocar o endpoint
Depois que o endpoint estiver em execução, use a InvokeEndpointAPI SageMaker AI Runtime no serviço SageMaker AI Runtime para enviar solicitações ou invocar o endpoint. Em resposta, as solicitações são tratadas como solicitações de explicabilidade pelo explicador do SageMaker Clarify.
nota
Para chamar um endpoint, escolha uma das seguintes opções:
-
Para obter instruções sobre como usar o Boto3 ou AWS CLI para invocar um endpoint, consulte. Invocar modelos para inferência em tempo real
-
Para usar o SageMaker SDK para Python para invocar um endpoint, consulte a API Predictor.
Solicitação
A API InvokeEndpoint tem um parâmetro opcional EnableExplanations, que é mapeado para o cabeçalho X-Amzn-SageMaker-Enable-Explanations HTTP. Se esse parâmetro for fornecido, ele substituirá o parâmetro EnableExplanations do ClarifyExplainerConfig.
nota
Os parâmetros ContentType e Accept da API InvokeEndpoint são necessários. Os formatos compatíveis incluem o tipo MIME text/csv e application/jsonlines.
Use o sagemaker_runtime_client para enviar uma solicitação ao endpoint, da seguinte forma:
response = sagemaker_runtime_client.invoke_endpoint( EndpointName='name-of-your-endpoint', EnableExplanations='`true`', ContentType='text/csv', Accept='text/csv', Body='1,2,3,4', # single record (of four numerical features) )
Para endpoints multimodelo, passe um parâmetro adicional TargetModel na solicitação do exemplo anterior para especificar a qual modelo direcionar no endpoint. O endpoint multimodelo carrega dinamicamente os modelos de destino conforme necessário. Para obter mais informações sobre endpoints multimodelo, consulte Endpoints multimodelo. Consulte o caderno de amostra SageMaker Clarify Online Explicability on Multimodel Endpoint
Resposta
Se o endpoint for criado com ExplainerConfig, um novo esquema de resposta será usado. Esse novo esquema é diferente e não é compatível com um endpoint que não tem o parâmetro fornecido ExplainerConfig.
O tipo MIME da resposta é application/json, e a carga útil da resposta pode ser decodificada de bytes UTF-8 para um objeto JSON. Veja a seguir que os membros desse objeto JSON são os seguintes:
-
version: a versão do esquema de resposta em formato de string. Por exemplo, .1.0 -
predictions: as predições que a solicitação faz são as seguintes:-
content_type: o tipo MIME das predições, referindo-se àContentTypeda resposta do contêiner do modelo. -
data: a sequência de dados de predições fornecida como carga útil da resposta do contêiner do modelo para a solicitação.
-
-
label_headers: os cabeçalhos do rótulo do parâmetroLabelHeaders. Isso é fornecido na configuração do explicador ou na saída do contêiner do modelo. -
explanations: as explicações fornecidas na carga útil da solicitação. Se nenhum registro for explicado, esse membro retornará o objeto vazio{}. -
-
kernel_shap: uma chave que se refere a uma matriz de explicações do Kernel SHAP para cada registro na solicitação. Se um registro não for explicado, a explicação correspondente seránull.
-
O elemento kernel_shap tem os seguintes membros:
-
feature_header: o nome do cabeçalho dos atributos fornecidos pelo parâmetroFeatureHeadersna configuração do explicadorExplainerConfig. -
feature_type: o tipo de atributo inferido pelo explicador ou fornecido no parâmetroFeatureTypesnoExplainerConfig. Esse elemento só está disponível para problemas de explicabilidade da PNL. -
attributions: uma matriz de objetos de atribuição. Os atributos de texto podem ter vários objetos de atribuição, cada um para uma unidade. O objeto de atribuição tem os seguintes membros:-
attribution: uma lista de valores de probabilidade, fornecida para cada classe. -
description: a descrição das unidades de texto, disponível somente para problemas de explicabilidade da PNL.-
partial_text: a parte do texto explicada pelo explicador. -
start_idx: um índice baseado em zero para identificar a localização da matriz no início do fragmento de texto parcial.
-
-