Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Verificaciones de la calidad de los datos
La calidad de los datos es una parte integral del proceso de limpieza de datos, que a menudo se omite. En el diagrama siguiente se muestra cómo se integran los controles de calidad de los datos en el ciclo de vida de la ingeniería de datos, la automatización y el control de acceso.
En la tabla siguiente se proporciona información general de las soluciones diferentes de calidad de datos según el caso de uso.
Caso de uso |
Solución |
Ejemplo |
Solución sin código para agregar condiciones de calidad a nivel de columna o tabla |
Verifica si todos los valores de las columnas se encuentran entre 1 y 12, o si una tabla o columna está vacía |
|
Código personalizado agregado a un trabajo de AWS Glue o a una solución sin código (en versión preliminar) para agregar condiciones de calidad a nivel de columna o tabla |
Comprueba si la columna no |
|
Verificaciones personalizadas |
ETL de su elección, como AWS Lambda |
Verifica si el valor de la columna A es siempre mayor que el valor correspondiente de las columnas B y C, o si el valor de la columna |
Solución sofisticada con un informe de métricas, validación de restricciones y sugerencias de restricciones |
Verifica si |