

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Contrôles de qualité des données
<a name="data-quality-checks"></a>

La qualité des données fait partie intégrante mais souvent négligée du processus de nettoyage des données. Le schéma suivant montre comment les contrôles de qualité des données s'intègrent dans le cycle de vie de l'automatisation de l'ingénierie des données et du contrôle d'accès.

![\[Schéma de qualité des données\]](http://docs.aws.amazon.com/fr_fr/prescriptive-guidance/latest/modern-data-centric-use-cases/images/data_quality_checks.png)


Le tableau suivant fournit un aperçu des différentes solutions de qualité des données en fonction des cas d'utilisation.


|  |  |  | 
| --- |--- |--- |
| **Cas d'utilisation** | **Solution** | **Exemple** | 
| Solution sans code pour ajouter des conditions de qualité au niveau des colonnes ou des tables | [AWS Glue DataBrew](https://aws.amazon.com/glue/features/databrew/) | Vérifie si toutes les valeurs des colonnes sont comprises entre 1 et 12, ou si une table ou une colonne est vide | 
| Code personnalisé ajouté à une tâche AWS Glue ou à une solution sans code (en version préliminaire) pour ajouter des conditions de qualité au niveau des colonnes ou des tables | [Qualité des données AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/glue-data-quality.html) | Vérifie si la colonne n'`first_name`est pas nulle ou si elle `phone_number` contient uniquement des nombres ou un opérateur « \$1 », and/or des fonctions statistiques, telles que la moyenne ou la somme | 
| Chèques personnalisés | [ETL de votre choix, tel qu'[AWS Lambda](https://aws.amazon.com/lambda/), [AWS Glue ou Amazon EMR](https://aws.amazon.com/glue/)](https://aws.amazon.com/emr/) | Vérifie si la valeur de la colonne A est toujours supérieure à la valeur correspondante des colonnes B et C, ou si la valeur de la colonne `continent` est toujours correcte géographiquement et dérivée de la `city` colonne | 
| Solution sophistiquée avec un rapport de métriques, une validation des contraintes et des suggestions de contraintes | [Deeque](https://aws.amazon.com/blogs/big-data/test-data-quality-at-scale-with-deequ/) | Vérifie si la `CompletenessConstraint` métrique d'exhaustivité de la colonne `review_id` est égale à `1` | 