Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Tienda de funciones
El uso de SageMaker AI Feature Store
Utilice consultas sobre viajes en el tiempo
Las funciones de viaje en el tiempo de Feature Store ayudan a reproducir la creación de modelos y a respaldar prácticas de gobierno más sólidas. Esto puede resultar útil cuando una organización quiere evaluar el linaje de datos, de forma similar a como las herramientas de control de versiones, como Git, evalúan el código. Las consultas sobre viajes en el tiempo también ayudan a las organizaciones a proporcionar datos precisos para las comprobaciones de conformidad. Para obtener más información, consulte Comprender las capacidades clave de Amazon SageMaker AI Feature Store
Uso de roles de IAM
Feature Store también ayuda a mejorar la seguridad sin afectar a la productividad ni a la innovación del equipo. Puedes usar funciones AWS Identity and Access Management (IAM) para conceder o restringir el acceso granular a funciones específicas para usuarios o grupos específicos.
Por ejemplo, la siguiente política restringe el acceso a una función confidencial de Feature Store.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Deny", "Action": "*", "Resource": "arn:aws:s3:::us-east-2-12345678910-features/12345678910/sagemaker/us-east-2/offline-store/doctor-appointments" } ] }
Para obtener más información sobre la seguridad y el cifrado de los datos mediante Feature Store, consulte Seguridad y control de acceso en la documentación sobre SageMaker IA.
Utilice las pruebas unitarias
Cuando los científicos de datos crean modelos basados en algunos datos, suelen hacer suposiciones sobre la distribución de los datos o realizan un análisis exhaustivo para comprender completamente las propiedades de los datos. Cuando se implementan estos modelos, con el tiempo se vuelven obsoletos. Cuando el conjunto de datos queda desactualizado, los científicos de datos, los ingenieros de aprendizaje automático y (en algunos casos) los sistemas automatizados rediseñan el modelo con nuevos datos que se obtienen de una tienda en línea o fuera de línea.
Sin embargo, es posible que la distribución de estos nuevos datos haya cambiado, lo que podría afectar al rendimiento del algoritmo actual. Una forma automática de comprobar este tipo de problemas consiste en utilizar el concepto de pruebas unitarias de la ingeniería de software. Entre los factores que más se suelen comprobar se incluyen el porcentaje de valores faltantes, la cardinalidad de las variables categóricas y si las columnas con valores reales se ajustan a alguna distribución esperada mediante un marco como la estadística de las pruebas de hipótesis (prueba t
Las pruebas unitarias requieren comprender los datos y su dominio para poder planificar las afirmaciones exactas que se van a realizar como parte del proyecto de aprendizaje automático. Para obtener más información, consulte Probar la calidad de los datos a escala PyDeequ