

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Tienda de funciones
<a name="feature-store"></a>

El uso de [SageMaker AI Feature Store](https://aws.amazon.com/sagemaker/feature-store/) aumenta la productividad del equipo, ya que disocia los límites de los componentes (por ejemplo, el almacenamiento y el uso). También permite la reutilización de funciones en los diferentes equipos de ciencia de datos de la organización.

## Utilice consultas sobre viajes en el tiempo
<a name="time-travel"></a>

Las funciones de viaje en el tiempo de Feature Store ayudan a reproducir la creación de modelos y a respaldar prácticas de gobierno más sólidas. Esto puede resultar útil cuando una organización quiere evaluar el linaje de datos, de forma similar a como las herramientas de control de versiones, como Git, evalúan el código. Las consultas sobre viajes en el tiempo también ayudan a las organizaciones a proporcionar datos precisos para las comprobaciones de conformidad. Para obtener más información, consulte [Comprender las capacidades clave de Amazon SageMaker AI Feature Store](https://aws.amazon.com/blogs/machine-learning/understanding-the-key-capabilities-of-amazon-sagemaker-feature-store/) en el blog AWS Machine Learning.

## Uso de roles de IAM
<a name="iam-roles"></a>

Feature Store también ayuda a mejorar la seguridad sin afectar a la productividad ni a la innovación del equipo. Puedes usar funciones AWS Identity and Access Management (IAM) para conceder o restringir el acceso granular a funciones específicas para usuarios o grupos específicos. 

Por ejemplo, la siguiente política restringe el acceso a una función confidencial de Feature Store.

```
{
    "Version": "2012-10-17", 		 	 	 		 	 	 
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "arn:aws:s3:::amzn-s3-demo-bucket--usw2-az1--x-s3/12345678910/sagemaker/us-east-2/offline-store/doctor-appointments"
        }
    ]
}
```

Para obtener más información sobre la seguridad y el cifrado de los datos mediante Feature Store, consulte [Seguridad y control de acceso](https://docs.aws.amazon.com/sagemaker/latest/dg/feature-store-security.html) en la documentación sobre SageMaker IA.

## Utilice las pruebas unitarias
<a name="unit-testing"></a>

Cuando los científicos de datos crean modelos basados en algunos datos, suelen hacer suposiciones sobre la distribución de los datos o realizan un análisis exhaustivo para comprender completamente las propiedades de los datos. Cuando se implementan estos modelos, con el tiempo se vuelven obsoletos. Cuando el conjunto de datos queda desactualizado, los científicos de datos, los ingenieros de aprendizaje automático y (en algunos casos) los sistemas automatizados rediseñan el modelo con nuevos datos que se obtienen de una tienda en línea o fuera de línea.

Sin embargo, es posible que la distribución de estos nuevos datos haya cambiado, lo que podría afectar al rendimiento del algoritmo actual. Una forma automática de comprobar este tipo de problemas consiste en utilizar el concepto de *pruebas unitarias* de la ingeniería de software. Entre los factores que más se suelen comprobar se incluyen el porcentaje de valores faltantes, la cardinalidad de las variables categóricas y si las columnas con valores reales se ajustan a alguna distribución esperada mediante un marco como la estadística de las pruebas de hipótesis (prueba [https://en.wikipedia.org/wiki/Student%27s_t-test](https://en.wikipedia.org/wiki/Student%27s_t-test)). Es posible que también desee validar el esquema de datos para asegurarse de que no ha cambiado y que no generará entidades de entrada no válidas de forma silenciosa. 

Las pruebas unitarias requieren comprender los datos y su dominio para poder planificar las afirmaciones exactas que se van a realizar como parte del proyecto de aprendizaje automático. Para obtener más información, consulte [Probar la calidad de los datos a escala PyDeequ](https://aws.amazon.com/blogs/big-data/testing-data-quality-at-scale-with-pydeequ/) en el blog sobre AWS macrodatos.