

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# SageMaker referencia del SDK de Python para tamizado inteligente
<a name="train-smart-sifting-pysdk-reference"></a>

Esta página proporciona una referencia de los módulos de Python que necesita para aplicar el tamizado SageMaker inteligente a su script de entrenamiento.

## SageMaker módulos de configuración de tamizado inteligente
<a name="train-smart-sifting-pysdk-base-config-modules"></a>

**`class smart_sifting.sift_config.sift_configs.RelativeProbabilisticSiftConfig()`**

La clase de configuración de tamizado SageMaker inteligente.

**Parámetros**
+ `beta_value` (float): un valor beta (constante). Se utiliza para calcular la probabilidad de seleccionar una muestra para entrenamiento en función del percentil de la pérdida en el historial de valores de pérdida. Si se reduce el valor beta, se disminuye el porcentaje de los datos seleccionados y, al aumentarlo, se obtiene un porcentaje superior de datos seleccionados. No hay un valor mínimo ni máximo para el valor beta, salvo que debe ser un valor positivo. En la siguiente tabla de referencia se proporciona información sobre las tasas de selección con respecto a `beta_value`.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/train-smart-sifting-pysdk-reference.html)
+ `loss_history_length` (int): el número de pérdidas de entrenamiento previas que se almacenarán para el muestreo basado en la pérdida de umbral relativa.
+ `loss_based_sift_config`(dictado o un `LossConfig` objeto): especifique un `LossConfig` objeto que devuelva la configuración de la interfaz SageMaker Smart Sifting Loss.

**`class smart_sifting.sift_config.sift_configs.LossConfig()`**

La clase de configuración para el parámetro `loss_based_sift_config` de la clase `RelativeProbabilisticSiftConfig`.

**Parámetros**
+ `sift_config` (dict o un objeto `SiftingBaseConfig`): especifique un objeto `SiftingBaseConfig` que devuelva un diccionario de configuración base de la selección.

**`class smart_sifting.sift_config.sift_configs.SiftingBaseConfig()`**

La clase de configuración para el parámetro `sift_config` de `LossConfig`.

**Parámetros**
+ `sift_delay` (int): el número de pasos de entrenamiento que hay que esperar antes de empezar la selección. Le recomendamos que empiece la selección después de que todas las capas del modelo tengan una vista suficiente de los datos de entrenamiento. El valor predeterminado es `1000`.
+ `repeat_delay_per_epoch` (bool): especifique si desea retrasar la selección de cada época. El valor predeterminado es `False`.

## SageMaker tamizado inteligente (módulos de transformación por lotes) de datos
<a name="train-smart-sifting-pysdk-batch-transform-modules"></a>

`class smart_sifting.data_model.data_model_interface.SiftingBatchTransform`

Un módulo de Python de filtrado SageMaker inteligente para definir cómo realizar la transformación por lotes. Con esto, puedes configurar una clase de transformación por lotes que convierta el formato de datos de tus datos de entrenamiento en `SiftingBatch` formato. SageMaker El tamizado inteligente puede filtrar y acumular datos en este formato en un lote tamizado.

`class smart_sifting.data_model.data_model_interface.SiftingBatch`

Interfaz para definir un tipo de datos por lotes que se puede seleccionar y acumular

`class smart_sifting.data_model.list_batch.ListBatch`

Módulo para realizar un seguimiento de un lote de listas para su selección

`class smart_sifting.data_model.tensor_batch.TensorBatch`

Módulo para realizar un seguimiento de un lote de tensores para su selección.

## SageMaker módulo de implementación de pérdidas por tamizado inteligente
<a name="train-smart-sifting-pysdk-loss-interface-moddule"></a>

`class smart_sifting.loss.abstract_sift_loss_module.Loss`

Un módulo contenedor para registrar la interfaz de tamizado SageMaker inteligente en la función de pérdida de un PyTorch modelo basado.

## SageMaker módulo contenedor y cargador de datos de cribado inteligente
<a name="train-smart-sifting-pysdk-dataloader-wrapper-module"></a>

`class smart_sifting.dataloader.sift_dataloader.SiftingDataloader`

Un módulo contenedor para registrar la interfaz de filtrado SageMaker inteligente en el cargador de datos de un modelo basado. PyTorch

El iterador del cargador de datos de selección principal selecciona las muestras de entrenamiento de un cargador de datos en función de una configuración de selección.

**Parámetros**
+ `sift_config` (dict o un objeto `RelativeProbabilisticSiftConfig`): un objeto `RelativeProbabilisticSiftConfig`.
+ `orig_dataloader`(un PyTorch DataLoader objeto): especifique el objeto PyTorch Dataloader que se va a empaquetar.
+ `batch_transforms`(un `SiftingBatchTransform` objeto): (opcional) Si la transformación predeterminada de la biblioteca de filtrado SageMaker inteligente no admite el formato de datos, debe crear una clase de transformación por lotes mediante el módulo. `SiftingBatchTransform` Este parámetro se usa para pasar la clase de transformación por lotes. Esta clase se utiliza `SiftingDataloader` para convertir los datos a un formato que el algoritmo de SageMaker filtrado inteligente pueda aceptar. 
+ `model`(un objeto PyTorch modelo): el modelo original PyTorch
+ `loss_impl`(una función de pérdida de tamizado de`smart_sifting.loss.abstract_sift_loss_module.Loss`): función de pérdida de tamizado que se configura con el `Loss` módulo y envuelve la PyTorch función de pérdida.
+ `log_batch_data` (bool): especifique si desea registrar los datos por lotes. Si está configurada`True`, el tamizado SageMaker inteligente registra los detalles de los lotes que se guardan o se tamizan. Le recomendamos que lo active solo para un trabajo de entrenamiento de pilotos. Cuando se activa el registro, las muestras se cargan en la GPU y se transfieren a la CPU, lo que supone una sobrecarga. El valor predeterminado es `False`.