

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Prüfungen der Datenqualität
<a name="data-quality-checks"></a>

Die Datenqualität ist ein integraler, aber oft übersehener Bestandteil des Datenbereinigungsprozesses. Das folgende Diagramm zeigt, wie Datenqualitätsprüfungen in den Lebenszyklus der Datentechnik, Automatisierung und Zugriffskontrolle passen.

![\[Diagramm zur Datenqualität\]](http://docs.aws.amazon.com/de_de/prescriptive-guidance/latest/modern-data-centric-use-cases/images/data_quality_checks.png)


Die folgende Tabelle bietet je nach Anwendungsfall einen Überblick über verschiedene Datenqualitätslösungen.


|  |  |  | 
| --- |--- |--- |
| **Anwendungsfall** | **Lösung** | **Beispiel** | 
| Lösung ohne Code zum Hinzufügen von Qualitätsbedingungen auf Spalten- oder Tabellenebene | [AWS Glue DataBrew](https://aws.amazon.com/glue/features/databrew/) | Prüft, ob alle Spaltenwerte zwischen 1 und 12 liegen oder ob eine Tabelle oder Spalte leer ist | 
| Benutzerdefinierter Code, der zu einem AWS Glue Glue-Job oder einer No-Code-Lösung (in der Vorschauversion) hinzugefügt wurde, um Qualitätsbedingungen auf Spalten- oder Tabellenebene hinzuzufügen | [AWS Glue Datenqualität](https://docs.aws.amazon.com/glue/latest/dg/glue-data-quality.html) | Prüft, ob die Spalte nicht Null `first_name` ist oder ob die Spalte nur Zahlen oder einen „\$1“ and/or -Operator `phone_number` enthält, z. B. Durchschnitt oder Summe | 
| Benutzerdefinierte Prüfungen | ETL der Wahl, wie [AWS Lambda](https://aws.amazon.com/lambda/), [AWS Glue](https://aws.amazon.com/glue/) oder [Amazon EMR](https://aws.amazon.com/emr/) | Überprüft, ob der Wert von Spalte A immer größer als der entsprechende Wert von Spalte B und Spalte C ist oder ob der Wert der Spalte immer geografisch korrekt `continent` ist und aus der Spalte abgeleitet wird `city` | 
| Durchdachte Lösung mit einem Metrikbericht, Einschränkungsvalidierung und Einschränkungsvorschlägen | [Deequ](https://aws.amazon.com/blogs/big-data/test-data-quality-at-scale-with-deequ/) | Prüft, ob die Metrik `CompletenessConstraint` für die Vollständigkeit der Spalte gleich `review_id` ist `1` | 