Utilice consultas sobre viajes en el tiempo Uso de roles de IAM Utilice las pruebas unitarias

Tienda de funciones

El uso de SageMaker AI Feature Store aumenta la productividad del equipo, ya que disocia los límites de los componentes (por ejemplo, el almacenamiento y el uso). También permite la reutilización de funciones en los diferentes equipos de ciencia de datos de la organización.

Utilice consultas sobre viajes en el tiempo

Las funciones de viaje en el tiempo de Feature Store ayudan a reproducir la creación de modelos y a respaldar prácticas de gobierno más sólidas. Esto puede resultar útil cuando una organización quiere evaluar el linaje de datos, de forma similar a como las herramientas de control de versiones, como Git, evalúan el código. Las consultas sobre viajes en el tiempo también ayudan a las organizaciones a proporcionar datos precisos para las comprobaciones de conformidad. Para obtener más información, consulte Comprender las capacidades clave de Amazon SageMaker AI Feature Store en el blog AWS Machine Learning.

Uso de roles de IAM

Feature Store también ayuda a mejorar la seguridad sin afectar a la productividad ni a la innovación del equipo. Puedes usar funciones AWS Identity and Access Management (IAM) para conceder o restringir el acceso granular a funciones específicas para usuarios o grupos específicos.

Por ejemplo, la siguiente política restringe el acceso a una función confidencial de Feature Store.


{
    "Version": "2012-10-17", 		 	 	 		 	 	 
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "arn:aws:s3:::amzn-s3-demo-bucket--usw2-az1--x-s3/12345678910/sagemaker/us-east-2/offline-store/doctor-appointments"
        }
    ]
}

Para obtener más información sobre la seguridad y el cifrado de los datos mediante Feature Store, consulte Seguridad y control de acceso en la documentación sobre SageMaker IA.

Utilice las pruebas unitarias

Cuando los científicos de datos crean modelos basados en algunos datos, suelen hacer suposiciones sobre la distribución de los datos o realizan un análisis exhaustivo para comprender completamente las propiedades de los datos. Cuando se implementan estos modelos, con el tiempo se vuelven obsoletos. Cuando el conjunto de datos queda desactualizado, los científicos de datos, los ingenieros de aprendizaje automático y (en algunos casos) los sistemas automatizados rediseñan el modelo con nuevos datos que se obtienen de una tienda en línea o fuera de línea.

Sin embargo, es posible que la distribución de estos nuevos datos haya cambiado, lo que podría afectar al rendimiento del algoritmo actual. Una forma automática de comprobar este tipo de problemas consiste en utilizar el concepto de pruebas unitarias de la ingeniería de software. Entre los factores que más se suelen comprobar se incluyen el porcentaje de valores faltantes, la cardinalidad de las variables categóricas y si las columnas con valores reales se ajustan a alguna distribución esperada mediante un marco como la estadística de las pruebas de hipótesis (prueba t). Es posible que también desee validar el esquema de datos para asegurarse de que no ha cambiado y que no generará entidades de entrada no válidas de forma silenciosa.

Las pruebas unitarias requieren comprender los datos y su dominio para poder planificar las afirmaciones exactas que se van a realizar como parte del proyecto de aprendizaje automático. Para obtener más información, consulte Probar la calidad de los datos a escala PyDeequ en el blog sobre AWS macrodatos.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Divisiones y fugas de datos

Formación