Cuadernos de ejemplo de Piloto automático de Amazon SageMaker - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cuadernos de ejemplo de Piloto automático de Amazon SageMaker

Los siguientes cuadernos sirven como ejemplos prácticos y abordan varios casos de uso de Piloto automático.

Puede encontrar todos los cuadernos de Piloto automático en el directorio autopilot del repositorio de ejemplos de SageMaker AI GitHub.

Recomendamos clonar todo el repositorio de Git en Studio Classic para acceder a los cuadernos y ejecutarlos directamente. Para obtener información sobre cómo clonar un repositorio de Git en Studio Classic, consulte Clonar un repositorio de Git en Amazon SageMaker Studio Classic.

Caso de uso Descripción
Inferencia sin servidor

De forma predeterminada, Piloto automático permite implementar los modelos generados en puntos de conexión de inferencia en tiempo real. En este repositorio, el cuaderno ilustra cómo implementar modelos de Piloto automático entrenados con los modos ENSEMBLING y HYPERPARAMETER OPTIMIZATION (HPO) en puntos de conexión sin servidor. Los puntos de conexión sin servidor lanzan automáticamente los recursos informáticos y los amplían y reducen en función del tráfico, lo que elimina la necesidad de elegir tipos de instancias o de gestionar las políticas de escalado.

Selección de características personalizada

Piloto automático inspecciona su conjunto de datos y ejecuta una serie de candidatos para determinar la combinación óptima de pasos de preprocesamiento de datos, algoritmos de machine learning e hiperparámetros. Puede implementarlos fácilmente en un punto de conexión en tiempo real o para el procesamiento por lotes.

En algunos casos, es posible que desee tener la flexibilidad de llevar el código de procesamiento de datos personalizado a Piloto automático. Por ejemplo, sus conjuntos de datos pueden contener una gran cantidad de variables independientes, y es posible que desee incorporar un paso de selección de características personalizado para eliminar primero las variables irrelevantes. El conjunto de datos más pequeño resultante se puede usar luego para iniciar un trabajo de Piloto automático. En última instancia, también querrá incluir tanto el código de procesamiento personalizado como los modelos de Piloto automático para el procesamiento en tiempo real o por lotes.

Ejemplo de canalización

Si bien Piloto automático agiliza el proceso de creación de modelos ML, los ingenieros de MLOps siguen siendo responsables de crear, automatizar y gestionar los flujos de trabajo integrales de ML en la producción. SageMaker Pipelines puede ayudar a automatizar varios pasos del ciclo de vida del ML, como el preprocesamiento de datos, el entrenamiento del modelo, el ajuste de hiperparámetros, la evaluación del modelo y la implementación. Este cuaderno es una demostración de cómo incorporar Piloto automático en un flujo de trabajo de entrenamiento de AutoML integral de SageMaker Pipelines. Para lanzar un experimento de Piloto automático en Pipelines, debe crear un flujo de trabajo de creación de modelos escribiendo un código de integración personalizado con pasos de Pipelines, Lambda o Processing. Para obtener más información, consulte Move Amazon SageMaker Autopilot ML models from experimentation to production using Amazon SageMaker Pipelines.

Como alternativa, cuando utilice Piloto automático en el modo de ensamblaje, puede consultar el ejemplo de cuaderno que muestra cómo utilizar el paso AutoML nativo en el paso AutoML nativo de SageMaker Pipelines. Gracias a la compatibilidad con Piloto automático como paso nativo en Pipelines, ahora puede añadir un paso de entrenamiento automatizado (AutoMLStep) a su Pipelines e invocar un experimento de Piloto automático en el modo de ensamblaje.

Direct marketing with Amazon SageMaker Autopilot

Este cuaderno demuestra cómo se utiliza el conjunto de datos de marketing bancario para predecir si un cliente se inscribirá en un depósito a plazo fijo en un banco. Puede utilizar Piloto automático en este conjunto de datos para obtener la canalización ML más precisa explorando las opciones contenidas en varias canalizaciones candidatas. Piloto automático genera cada candidato en un procedimiento de dos pasos. El primer paso diseña características automatizadas en el conjunto de datos. El segundo paso entrena y ajusta un algoritmo para producir un modelo. El cuaderno contiene instrucciones sobre cómo entrenar el modelo y sobre cómo implementarlo para realizar inferencias por lotes utilizando el mejor candidato.

Customer Churn Prediction with Amazon SageMaker Autopilot

Este cuaderno describe el uso de machine learning para identificar automáticamente a los clientes descontentos; también se conoce como predicción de abandono de clientes. El ejemplo muestra cómo analizar un conjunto de datos disponible públicamente y cómo aplicarle ingeniería de características. A continuación se muestra cómo ajustar un modelo seleccionando la canalización de mejor rendimiento junto con los hiperparámetros óptimos para el algoritmo de entrenamiento. Por último, muestra cómo implementar el modelo en un punto de conexión alojado y cómo evaluar sus predicciones en comparación con la realidad. Sin embargo, los modelos de ML rara vez ofrecen predicciones perfectas. Es por eso que este cuaderno también muestra cómo incorporar los costos relativos de los errores de predicción al determinar el resultado financiero del uso de ML.

Top Candidates Customer Churn Prediction with Amazon SageMaker Autopilot and Batch Transform (Python SDK)

Este cuaderno describe el uso de machine learning para identificar automáticamente a los clientes descontentos; también se conoce como predicción de abandono de clientes. Este cuaderno muestra cómo configurar el modelo para obtener la probabilidad de inferencia, seleccionar los N modelos principales y realizar la transformación por lotes en un conjunto de pruebas de espera para su evaluación.

nota

El cuaderno funciona con el SDK de Python para SageMaker >= 1.65.1 (publicado el 19 de junio de 2020).

Bringing your own data processing code to Amazon SageMaker Autopilot

Este cuaderno muestra cómo incorporar e implementar código de procesamiento de datos personalizado al utilizar Piloto automático de Amazon SageMaker. Añade un paso de selección de características personalizado para eliminar las variables irrelevantes de un trabajo de Piloto automático. A continuación, se muestra cómo implementar tanto el código de procesamiento personalizado como los modelos generados por Piloto automático en un punto de conexión en tiempo real o para el procesamiento por lotes.

Más cuadernos

Puede encontrar más cuadernos que ilustran otros casos de uso, como batch transform, time-series forecasting y otros en el directorio raíz.