Respuesta del punto de conexión para datos tabulares - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Respuesta del punto de conexión para datos tabulares

Una vez que el SageMaker trabajo de procesamiento de Clarify recibe la respuesta de una invocación del punto final de inferencia, deserializa la carga útil de la respuesta y extrae predicciones de la misma. Utilice el parámetro accept_type de configuración del análisis para especificar el formato de datos de la carga de respuesta. Si no accept_type se proporciona, el trabajo de procesamiento de SageMaker Clarify utilizará el valor del parámetro content_type como formato de salida del modelo. Para obtener más información acerca de accept_type, consulte Archivos de configuración del análisis.

Las predicciones pueden consistir en etiquetas predichas para el análisis de sesgo o en valores de probabilidad (puntuaciones) para el análisis de importancia de las características. En la configuración del análisis predictor, los tres parámetros siguientes extraen las predicciones.

  • El parámetro probability se utiliza para localizar los valores de probabilidad (puntuaciones) en la respuesta del punto de conexión.

  • El parámetro label se utiliza para localizar las etiquetas predichas en la respuesta del punto de conexión.

  • De forma opcional, el parámetro label_headers proporciona las etiquetas predichas para un modelo multiclase.

Las siguientes directrices se refieren a las respuestas de los puntos de conexión en los formatos CSV, JSON Lines y JSON.

Respuesta de punto de conexión en formato CSV

Si la carga útil de la respuesta está en formato CSV (tipo MIME:text/csv), el trabajo de procesamiento de Clarify SageMaker deserializa cada fila. A continuación, extrae las predicciones de los datos deserializados utilizando los índices de columna proporcionados en la configuración de análisis. Las filas en la carga de respuesta deben coincidir con los registros en la carga de solicitud.

Las siguientes tablas proporcionan ejemplos de datos de respuesta en diferentes formatos y para diferentes tipos de problemas. Los datos pueden diferir de estos ejemplos, siempre que las predicciones se puedan extraer de acuerdo con la configuración del análisis.

En las siguientes secciones, se muestran ejemplos de respuestas de punto de conexión en formato CSV.

La siguiente tabla es un ejemplo de respuesta de punto de conexión para problemas de regresión y clasificación binaria.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único.

'0,6'

Dos registros (los resultados están en una línea, separados una coma).

'0,6,0,3'

Dos registros (resultados en dos líneas).

'0,6\n0,3'

En el ejemplo anterior, el punto de conexión genera un único valor de probabilidad (puntuación) de la etiqueta predicha. Para extraer las probabilidades mediante el índice y utilizarlas para el análisis de la importancia de las características, defina el parámetro de configuración del análisis probability en el índice de columna 0. Estas probabilidades también se pueden usar para el análisis del sesgo si se convierten en valores binarios mediante el parámetro probability_threshold. Para obtener más información acerca de probability_threshold, consulte Archivos de configuración del análisis.

La siguiente tabla es un ejemplo de respuesta de punto de conexión para problemas multiclase.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único de un modelo multiclase (tres clases).

'0,1,0,6,0,3'

Dos registros de un modelo multiclase (tres clases).

'0,1,0,6,0,3\n0,2,0,5,0,3'

En el ejemplo anterior, el punto de conexión genera una lista de probabilidades (puntuaciones). Si no se proporciona ningún índice, se extraen todos los valores y se utilizan para el análisis de la importancia de las características. Si se proporciona el parámetro de configuración label_headers del análisis, Luego, el trabajo SageMaker de procesamiento de Clarify puede seleccionar el encabezado de la etiqueta de máxima probabilidad como etiqueta pronosticada, que se puede usar para el análisis de sesgos. Para obtener más información acerca de label_headers, consulte Archivos de configuración del análisis.

La siguiente tabla es un ejemplo de respuesta de punto de conexión para problemas de regresión y clasificación binaria.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'1'

Dos registros (los resultados están en una línea, separados una coma)

'1,0'

Dos registros (resultados en dos líneas)

'1\n0'

En el ejemplo anterior, el punto de conexión genera la etiqueta predicha en lugar de la probabilidad. Establezca el parámetro label de la configuración predictor en el índice de columna 0 para que las etiquetas predichas puedan extraerse mediante el índice y utilizarse para el análisis del sesgo.

La siguiente tabla es un ejemplo de respuesta de punto de conexión para problemas de regresión y clasificación binaria.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'1,0,6'

Dos registros

'1,0,6\n0,0,3'

En el ejemplo anterior, el punto de conexión genera la etiqueta predicha seguida de su probabilidad. Defina el parámetro label de la configuración predictor en el índice de columna 0 y establezca probability en el índice de columna 1 para extraer los valores de ambos parámetros.

Se puede configurar un modelo multiclase entrenado por Amazon SageMaker Autopilot para generar la representación en cadena de la lista de etiquetas y probabilidades pronosticadas. La siguiente tabla de ejemplo muestra un ejemplo de respuesta de punto de conexión de un modelo que está configurado para generar predicted_label, probability, labels y probabilities.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'"perro",0,6,"[\'gato\', \'perro\', \'pez\']","[0,1, 0,6, 0,3]"'

Dos registros

'"perro",0,6,"[\'gato\', \'perro\', \'pez\']","[0,1, 0,6, 0,3]"\n""gato",0,7,[\'gato\', \'perro\', \'pez\']","[0,7, 0,2, 0,1]"'

En el ejemplo anterior, el trabajo de procesamiento SageMaker de Clarify se puede configurar de las siguientes maneras para extraer las predicciones.

Para el análisis del sesgo, el ejemplo anterior se puede configurar como uno de los siguientes.

  • Defina el parámetro label de la configuración predictor en 0 para extraer la etiqueta predicha.

  • Defina el parámetro en 2 para extraer las etiquetas predichas y establezca probability en 3 para extraer las probabilidades correspondientes. El trabajo SageMaker de procesamiento de Clarify puede determinar automáticamente la etiqueta prevista identificando la etiqueta con el valor de probabilidad más alto. En relación con el ejemplo anterior de un único registro, el modelo predice tres etiquetas: cat, dog y fish, con probabilidades correspondientes de 0.1, 0.6 y 0.3. En función de estas probabilidades, la etiqueta predicha es dog, ya que tiene el valor de probabilidad más alto de 0.6.

  • Establezca probability en 3 para extraer las probabilidades. Si label_headers se proporciona, el trabajo de procesamiento SageMaker de Clarify puede determinar automáticamente la etiqueta prevista identificando el encabezado de la etiqueta con el valor de probabilidad más alto.

Para el análisis de la importancia de las características, el ejemplo anterior se puede configurar de la siguiente manera.

  • Defina probability en 3 para extraer las probabilidades de todas las etiquetas predichas. A continuación, se calcularán las atribuciones de características para todas las etiquetas. Si el cliente no especifica label_headers, las etiquetas predichas se utilizarán como encabezados de etiquetas en el informe de análisis.

Respuesta de punto de conexión en formato JSON Lines

Si la carga útil de respuesta está en formato de líneas JSON (tipo MIME:application/jsonlines), el trabajo de procesamiento de SageMaker Clarify deserializa cada línea como JSON. A continuación, extrae las predicciones de los datos deserializados mediante JMESPath las expresiones proporcionadas en la configuración de análisis. Las líneas en la carga de respuesta deben coincidir con los registros en la carga de solicitud. En las siguientes tablas, se muestran ejemplos de datos de respuesta en diferentes formatos. Los datos pueden diferir de estos ejemplos, siempre que las predicciones se puedan extraer de acuerdo con la configuración del análisis.

En las siguientes secciones, se muestran ejemplos de respuestas de punto de conexión en formato JSON Lines.

La siguiente tabla es un ejemplo de respuesta de punto de conexión que solo genera el valor de probabilidad (puntuación).

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'{"puntuación":0,6}'

Dos registros

'{"puntuación":0,6}\n{"puntuación":0,3}'

En el ejemplo anterior, defina el parámetro de configuración del análisis en probability la JMESPath expresión «score» para extraer su valor.

La siguiente tabla es un ejemplo de respuesta de punto de conexión que solo genera la etiqueta predicha.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'{"predicción":1}'

Dos registros

'{"predicción":1}\n{"predicción":0}'

En el ejemplo anterior, defina el label parámetro de la configuración del predictor en JMESPath expresiónprediction. A continuación, el trabajo de SageMaker procesamiento de Clarify puede extraer las etiquetas pronosticadas para el análisis de sesgo. Para obtener más información, consulte Archivos de configuración del análisis.

La siguiente tabla es un ejemplo de respuesta de punto de conexión que genera la etiqueta predicha y su puntuación.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'{"predicción":1,"puntuación":0,6}'

Dos registros

'{"predicción":1,"puntuación":0,6}\n{"predicción":0,"puntuación":0,3}'

En el ejemplo anterior, defina el label parámetro de la predictor configuración en la JMESPath expresión «predicción» para extraer las etiquetas pronosticadas. probabilityDefina la JMESPath expresión «score» para extraer la probabilidad. Para obtener más información, consulte Archivos de configuración del análisis.

La siguiente tabla es un ejemplo de la respuesta de punto de conexión de un modelo multiclase que genera lo siguiente:

  • Una lista de etiquetas predichas.

  • Probabilidades, y la etiqueta predicha seleccionada y su probabilidad.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'{"etiqueta_predicha":"perro","probabilidad":0,6,"etiquetas_predichas":["gato","perro","pez"],"probabilidades":[0,1,0,6,0,3]}'

Dos registros

'{"etiqueta_predicha":"perro","probabilidad":0,6,"etiquetas_predichas":["gato","perro","pez"],"probabilidades":[0,1,0,6,0,3]}\n{"etiqueta_predicha":"gato","probabilidad":0,7,"etiquetas_predichas":["gato","perro","pez"],"probabilidades":[0,7,0,2,0,1]}'

En el ejemplo anterior, el trabajo SageMaker de procesamiento de Clarify se puede configurar de varias formas para extraer las predicciones.

Para el análisis del sesgo, el ejemplo anterior se puede configurar como uno de los siguientes.

  • Defina el label parámetro de la predictor configuración en la JMESPath expresión «predicted_label» para extraer la etiqueta pronosticada.

  • Establezca el parámetro en la JMESPath expresión «predicted_labels» para extraer las etiquetas pronosticadas. probabilityConfigúrelo en JMESPath la expresión «probabilidades» para extraer sus probabilidades. El trabajo SageMaker de Clarify determina automáticamente la etiqueta prevista identificando la etiqueta con el valor de probabilidad más alto.

  • probabilityDefina la JMESPath expresión «probabilidades» para extraer sus probabilidades. Si label_headers se proporciona, el trabajo de procesamiento SageMaker de Clarify puede determinar automáticamente la etiqueta prevista identificando la etiqueta con el valor de probabilidad más alto.

Para un análisis de importancia de una característica, haga lo siguiente.

  • Utilice probability la JMESPath expresión «probabilidades» para extraer las probabilidades de todas las etiquetas pronosticadas. A continuación, se calcularán las atribuciones de características para todas las etiquetas.

Respuesta de punto de conexión en formato JSON

Si la carga útil de respuesta está en formato JSON (tipo MIME:application/json), el trabajo de procesamiento SageMaker Clarify deserializa toda la carga útil como JSON. A continuación, extrae las predicciones de los datos deserializados mediante JMESPath las expresiones proporcionadas en la configuración de análisis. Los registros en la carga de respuesta deben coincidir con los registros en la carga de solicitud.

En las siguientes secciones, se muestran ejemplos de respuestas de punto de conexión en formato JSON. Las secciones contienen tablas con ejemplos de datos de respuesta en diferentes formatos y para diferentes tipos de problemas. Los datos pueden diferir de estos ejemplos, siempre que las predicciones se puedan extraer de acuerdo con la configuración del análisis.

La siguiente tabla es un ejemplo de respuesta de un punto de conexión que solo genera el valor de probabilidad (puntuación).

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'[0,6]'

Dos registros

'[0,6,0,3]'

En el ejemplo anterior, no hay ningún salto de línea en la carga de respuesta. En su lugar, un único objeto JSON contiene una lista de puntuaciones, una para cada registro de la solicitud. Defina el parámetro probability de configuración del análisis en JMESPath la expresión «[*]» para extraer el valor.

La siguiente tabla es un ejemplo de respuesta de un punto de conexión que solo genera la etiqueta predicha.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'{"etiquetas_predichas":[1]}'

Dos registros

'{"etiquetas_predichas":[1,0]}'

Defina el label parámetro de la predictor configuración en la JMESPath expresión «predicted_labels» y, a continuación, el trabajo de procesamiento de SageMaker Clarify podrá extraer las etiquetas pronosticadas para realizar un análisis de sesgo.

La siguiente tabla es un ejemplo de respuesta de un punto de conexión que genera la etiqueta predicha y su puntuación.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'{"predicciones":[{"etiqueta":1,"puntuación":0,6}'

Dos registros

{"predicciones":[{"etiqueta":1,"puntuación":0,6},{"etiqueta":0,"puntuación":0,3}]}'

En el ejemplo anterior, defina el label parámetro de la predictor configuración en la JMESPath expresión «predictions [*] .label» para extraer las etiquetas pronosticadas. Defina probability la JMESPath expresión «predictions [*] .score» para extraer la probabilidad.

La siguiente tabla es un ejemplo de la respuesta de un punto de conexión de un modelo multiclase que genera lo siguiente:

  • Una lista de etiquetas predichas.

  • Probabilidades, y la etiqueta predicha seleccionada y su probabilidad.

Carga de solicitud de punto de conexión Carga de respuesta de punto de conexión (representación en cadena)

Registro único

'[{"etiqueta_predicha":"perro","probabilidad":0,6,"etiquetas_predichas":["gato","perro","pez"],"probabilidades":[0,1,0,6,0,3]}]'

Dos registros

'[{"etiqueta_predicha":"perro","probabilidad":0,6,"etiquetas_predichas":["gato","perro","pez"],"probabilidades":[0,1,0,6,0,3]},{"etiqueta_predicha":"gato","probabilidad":0,7,"etiquetas_predichas":["gato","perro","pez"],"probabilidades":[0,7,0,2,0,1]}]'

El trabajo SageMaker de procesamiento de Clarify se puede configurar de varias maneras para extraer las predicciones.

Para el análisis del sesgo, el ejemplo anterior se puede configurar como uno de los siguientes.

  • Defina el label parámetro de la predictor configuración en la JMESPath expresión «[*] .predicted_label» para extraer la etiqueta prevista.

  • Defina el parámetro en la JMESPath expresión «[*] .predicted_labels» para extraer las etiquetas pronosticadas. Defina probability la JMESPath expresión «[*] .probabilities» para extraer sus probabilidades. El trabajo SageMaker de procesamiento Clarify puede determinar automáticamente la etiqueta prevista identificando la etiqueta con el valor de proximidad más alto.

  • Defina probability la JMESPath expresión «[*] .probabilities» para extraer sus probabilidades. Si label_headers se proporciona, el trabajo de procesamiento de SageMaker Clarify puede determinar automáticamente la etiqueta prevista identificando la etiqueta con el valor de probabilidad más alto.

Para el análisis de la importancia de las características, probability defina la JMESPath expresión «[*] .probabilities» para extraer las probabilidades de todas las etiquetas pronosticadas. A continuación, se calcularán las atribuciones de características para todas las etiquetas.