— Datentypen —DataSource DataQualityRulesetListDetails DataQualityTargetTable DataQualityRulesetEvaluationRunDescription DataQualityRulesetEvaluationRunFilter DataQualityEvaluationRunAdditionalRunOptions DataQualityRuleRecommendationRunDescription DataQualityRuleRecommendationRunFilter DataQualityResult DataQualityAnalyzerResult DataQualityObservation MetricBasedObservation DataQualityMetricValues DataQualityRuleResult DataQualityResultDescription DataQualityResultFilterCriteria DataQualityRulesetFilterCriteria DataQualityAggregatedMetrics StatisticAnnotation TimestampedInclusionAnnotation AnnotationError DatapointInclusionAnnotation StatisticSummaryList StatisticSummary RunIdentifier StatisticModelResult DataQualityGlueTable — Operationen —StartDataQualityRulesetEvaluationRun (start_data_quality_ruleset_evaluation_run)CancelDataQualityRulesetEvaluationRun (cancel_data_quality_ruleset_evaluation_run)GetDataQualityRulesetEvaluationRun (get_data_quality_ruleset_evaluation_run)ListDataQualityRulesetEvaluationRuns (list_data_quality_ruleset_evaluation_runs)StartDataQualityRuleRecommendationRun (start_data_quality_rule_recommendation_run)CancelDataQualityRuleRecommendationRun (cancel_data_quality_rule_recommendation_run)GetDataQualityRuleRecommendationRun (get_data_quality_rule_recommendation_run)ListDataQualityRuleRecommendationRuns (list_data_quality_rule_recommendation_runs)GetDataQualityResult (get_data_quality_result)BatchGetDataQualityResult (batch_get_data_quality_result)ListDataQualityResults (list_data_quality_results)CreateDataQualityRuleset (create_data_quality_ruleset)DeleteDataQualityRuleset (delete_data_quality_ruleset)GetDataQualityRuleset (get_data_quality_ruleset)ListDataQualityRulesets (list_data_quality_rulesets)UpdateDataQualityRuleset (update_data_quality_ruleset)ListDataQualityStatistics (list_data_quality_statistics)TimestampFilter CreateDataQualityRulesetRequest GetDataQualityRulesetResponse GetDataQualityResultResponse StartDataQualityRuleRecommendationRunRequest GetDataQualityRuleRecommendationRunResponse BatchPutDataQualityStatisticAnnotation (batch_put_data_quality_statistic_annotation)GetDataQualityModel (get_data_quality_model)GetDataQualityModelResult (get_data_quality_model_result)ListDataQualityStatisticAnnotations (list_data_quality_statistic_annotations)PutDataQualityProfileAnnotation (put_data_quality_profile_annotation)

Data-Quality-API

Die Data-Quality-API beschreibt die Data-Quality-Datentypen und umfasst die API zum Erstellen, Löschen oder Aktualisieren von Datenqualitätsregelsätzen, -Ausführungen und -Bewertungen.

Datentypen

DataSource Struktur
DataQualityRulesetListDetails Struktur
DataQualityTargetTable Struktur
DataQualityRulesetEvaluationRunDescription Struktur
DataQualityRulesetEvaluationRunFilter Struktur
DataQualityEvaluationRunAdditionalRunOptions Struktur
DataQualityRuleRecommendationRunDescription Struktur
DataQualityRuleRecommendationRunFilter Struktur
DataQualityResult Struktur
DataQualityAnalyzerResult Struktur
DataQualityObservation Struktur
MetricBasedObservation Struktur
DataQualityMetricValues Struktur
DataQualityRuleResult Struktur
DataQualityResultDescription Struktur
DataQualityResultFilterCriteria Struktur
DataQualityRulesetFilterCriteria Struktur
DataQualityAggregatedMetrics Struktur
StatisticAnnotation Struktur
TimestampedInclusionAnnotation Struktur
AnnotationError Struktur
DatapointInclusionAnnotation Struktur
StatisticSummaryList Liste
StatisticSummary Struktur
RunIdentifier Struktur
StatisticModelResult Struktur
DataQualityGlueTable Struktur

DataSource Struktur

Eine Datenquelle (eine AWS Glue Tabelle), für die Sie Datenqualitätsergebnisse wünschen.

Felder

GlueTable – Ein GlueTable-Objekt.

Eine AWS Glue Tabelle.
DataQualityGlueTable – Ein DataQualityGlueTable-Objekt.

Eine AWS Glue Tabelle für Datenqualitätsoperationen.

DataQualityRulesetListDetails Struktur

Beschreibt einen Datenqualitätsregelsatz, der von GetDataQualityRuleset zurückgegeben wurde.

Felder

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes für die Datenqualität.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Regelsatzes für die Datenqualität.
CreatedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der der Datenqualitätsregelsatz erstellt wurde.
LastModifiedOn – Zeitstempel.

Das Datum und die Uhrzeit der letzten Änderung des Regelsatzes für die Datenqualität.
TargetTable – Ein DataQualityTargetTable-Objekt.

Ein Objekt, das eine AWS Glue Tabelle darstellt.
RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.
RuleCount – Zahl (Ganzzahl).

Die Anzahl der Regeln im Regelsatz.

DataQualityTargetTable Struktur

Ein Objekt, das eine AWS Glue Tabelle darstellt.

Felder

TableName – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der AWS Glue Tabelle.
DatabaseName – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Datenbank, in der die AWS Glue Tabelle existiert.
CatalogId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Katalog-ID, in der die AWS Glue Tabelle existiert.

DataQualityRulesetEvaluationRunDescription Struktur

Beschreibt das Ausführungsergebnis zur Auswertung des Datenqualitätsregelsatzes.

Felder

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.
Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

Der Status für diese Ausführung.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der die Ausführung gestartet wurde.
DataSource – Ein DataSource-Objekt.

Die dem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).

DataQualityRulesetEvaluationRunFilter Struktur

Die Filterkriterien.

Felder

DataSource – Erforderlich: Ein DataSource-Objekt.

Filter basierend auf einer Datenquelle (einer AWS Glue Tabelle), die dem Lauf zugeordnet ist.
StartedBefore – Zeitstempel.

Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.
StartedAfter – Zeitstempel.

Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.

DataQualityEvaluationRunAdditionalRunOptions Struktur

Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.

Felder

CloudWatchMetricsEnabled – Boolesch.

Ob CloudWatch Metriken aktiviert werden sollen oder nicht.
ResultsS3Prefix – UTF-8-Zeichenfolge.

Präfix für Amazon S3 zum Speichern von Ergebnissen.
CompositeRuleEvaluationMethod – UTF-8-Zeichenfolge (zulässige Werte: COLUMN | ROW).

Die Bewertungsmethode für zusammengesetzte Regeln im Regelsatz auf ZEILE/SPALTE festlegen

DataQualityRuleRecommendationRunDescription Struktur

Beschreibt das Ergebnis einer Empfehlungsausführung einer Datenqualitätsregel.

Felder

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.
Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

Der Status für diese Ausführung.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
DataSource – Ein DataSource-Objekt.

Die Datenquelle (AWS Glue Tabelle), die dem Empfehlungslauf zugeordnet ist.

DataQualityRuleRecommendationRunFilter Struktur

Ein Filter zum Auflisten von Empfehlungsausführungen zu Datenqualität.

Felder

DataSource – Erforderlich: Ein DataSource-Objekt.

Filter basierend auf einer angegebenen Datenquelle (AWS Glue Tabelle).
StartedBefore – Zeitstempel.

Filtert basierend auf der Zeit für Ergebnisse, die vor der angegebenen Zeit gestartet wurden.
StartedAfter – Zeitstempel.

Filtert basierend auf der Zeit für Ergebnisse, die nach der angegebenen Zeit gestartet wurden.

DataQualityResult Struktur

Beschreibt ein Datenqualitätsergebnis.

Felder

ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.
ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID für das Datenqualitätsergebnis.
Score – Zahl (Double), nicht mehr als 1,0.

Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.
DataSource – Ein DataSource-Objekt.

Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
RulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.
EvaluationContext – UTF-8-Zeichenfolge.

Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung gestartet wurde.
CompletedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung abgeschlossen wurde.
JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
RulesetEvaluationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die eindeutige Ausführungs-ID für die Regelsatzauswertung für dieses Datenqualitätsergebnis.
RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.
AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.
Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.
AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

Eine Zusammenfassung der DataQualityAggregatedMetrics Objekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

DataQualityAnalyzerResult Struktur

Beschreibt das Ergebnis der Bewertung eines Datenqualitätsanalysators.

Felder

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Datenqualitätsanalysators.
Description – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Datenqualitätsanalysators.
EvaluationMessage – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Bewertungsmeldung.
EvaluatedMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

Jeder Wert ist eine Zahl (doppelt).

Eine Zuordnung der Metriken, die der Auswertung des Analysators zugewiesen sind.

DataQualityObservation Struktur

Beschreibt die Beobachtung, die nach Auswertung der Regeln und Analysatoren generiert wurde.

Felder

Description – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung der Datenqualitätsbeobachtung.
MetricBasedObservation – Ein MetricBasedObservation-Objekt.

Ein Objekt vom Typ MetricBasedObservation, das die Beobachtung darstellt, die auf ausgewerteten Datenqualitätsmetriken basiert.

MetricBasedObservation Struktur

Beschreibt die metrikbasierte Beobachtung, die auf der Grundlage ausgewerteter Datenqualitätsmetriken generiert wurde.

Felder

MetricName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Datenqualitätsmetrik, die zur Generierung der Beobachtung verwendet wurde.
StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
MetricValues – Ein DataQualityMetricValues-Objekt.

Ein Objekt vom Typ DataQualityMetricValues, das die Analyse des Werts der Datenqualitätsmetrik darstellt.
NewRules – Ein UTF-8-Zeichenfolgen-Array.

Eine Liste neuer Datenqualitätsregeln, die im Rahmen der Beobachtung auf der Grundlage des Werts der Datenqualitätsmetrik generiert wurden.

DataQualityMetricValues Struktur

Beschreibt den Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

Felder

ActualValue – Nummer (doppelt).

Der tatsächliche Wert der Datenqualitätsmetrik.
ExpectedValue – Nummer (doppelt).

Der erwartete Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.
LowerLimit – Nummer (doppelt).

Die Untergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.
UpperLimit – Nummer (doppelt).

Die Obergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

DataQualityRuleResult Struktur

Beschreibt das Ergebnis der Auswertung einer Datenqualitätsregel.

Felder

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Datenqualitätsregel.
Description – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung der Datenqualitätsregel.
EvaluationMessage – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Bewertungsmeldung.
Result – UTF-8-Zeichenfolge (zulässige Werte: PASS | FAIL | ERROR).

Ein Status „Bestanden“ oder „Nicht bestanden“ für die Regel.
EvaluatedMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

Jeder Wert ist eine Zahl (doppelt).

Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind.
EvaluatedRule – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Die ausgewertete Regel.
RuleMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

Jeder Wert ist eine Zahl (doppelt).

Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind, basierend auf den Ergebnissen auf Zeilenebene.

DataQualityResultDescription Struktur

Beschreibt ein Datenqualitätsergebnis.

Felder

ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die eindeutige Ergebnis-ID für dieses Datenqualitätsergebnis.
DataSource – Ein DataSource-Objekt.

Der dem Datenqualitätsergebnis zugeordnete Tabellenname.
JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der dem Datenqualitätsergebnis zugeordnete Auftragsname.
JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist.
StartedOn – Zeitstempel.

Die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.

DataQualityResultFilterCriteria Struktur

Kriterien, die für die Rückgabe von Datenqualitätsergebnissen verwendet werden.

Felder

DataSource – Ein DataSource-Objekt.

Filtert Ergebnisse nach der angegebenen Datenquelle. Zum Beispiel das Abrufen aller Ergebnisse für eine AWS Glue Tabelle.
JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Filtert Ergebnisse nach dem angegebenen Auftragsnamen.
JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Filtert Ergebnisse nach der angegebenen Auftragsausführung-ID.
StartedAfter – Zeitstempel.

Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.
StartedBefore – Zeitstempel.

Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.

DataQualityRulesetFilterCriteria Struktur

Die Kriterien, die zum Filtern von Datenqualitätsregelsätzen verwendet werden.

Felder

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Regelsatz-Filterkriterien.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Die Beschreibung der Regelsatz-Filterkriterien.
CreatedBefore – Zeitstempel.

Filtert nach Regelsätzen, die vor diesem Datum erstellt wurden.
CreatedAfter – Zeitstempel.

Filtert nach Regelsätzen, die nach diesem Datum erstellt wurden.
LastModifiedBefore – Zeitstempel.

Filtert nach Regelsätzen, die zuletzt vor diesem Datum geändert wurden.
LastModifiedAfter – Zeitstempel.

Filter nach Regelsätzen, die zuletzt nach diesem Datum geändert wurden.
TargetTable – Ein DataQualityTargetTable-Objekt.

Der Name und der Datenbankname der Zieltabelle.

DataQualityAggregatedMetrics Struktur

Eine Zusammenfassung der Metriken, die die Gesamtzahl der verarbeiteten Zeilen und Regeln zeigt, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

Felder

TotalRowsProcessed – Nummer (doppelt).

Die Gesamtzahl der Zeilen, die bei der Datenqualitätsbewertung verarbeitet wurden.
TotalRowsPassed – Nummer (doppelt).

Die Gesamtzahl der Zeilen, für die alle geltenden Datenqualitätsregeln erfolgreich angewendet wurden.
TotalRowsFailed – Nummer (doppelt).

Die Gesamtzahl der Zeilen, für die eine oder mehrere Datenqualitätsregeln nicht erfolgreich angewendet wurden.
TotalRulesProcessed – Nummer (doppelt).

Die Gesamtzahl der Datenqualitätsregeln, die bewertet wurden.
TotalRulesPassed – Nummer (doppelt).

Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien erfüllt haben.
TotalRulesFailed – Nummer (doppelt).

Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien nicht erfüllt haben.

StatisticAnnotation Struktur

Eine statistische Anmerkung.

Felder

ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID.
StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
StatisticRecordedOn – Zeitstempel.

Der Zeitstempel, zu dem die mit Anmerkungen versehene Statistik aufgezeichnet wurde.
InclusionAnnotation – Ein TimestampedInclusionAnnotation-Objekt.

Die Einfügungsanmerkung, die auf die Statistik angewendet wurde.

TimestampedInclusionAnnotation Struktur

Eine Einfügungsanmerkung mit Zeitstempel.

Felder

Value – UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

Der Wert der Einfügungsanmerkung.
LastModifiedOn – Zeitstempel.

Der Zeitstempel, zu dem die Einfügungsanmerkung zuletzt geändert wurde.

AnnotationError Struktur

Eine fehlgeschlagene Anmerkung.

Felder

ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID für die fehlgeschlagene Anmerkung.
StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID für die fehlgeschlagene Anmerkung.
FailureReason – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Der Grund, warum die Anmerkung fehlgeschlagen ist.

DatapointInclusionAnnotation Struktur

Eine Einfügungsanmerkung.

Felder

ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die ID des Datenqualitätsprofils, zu dem die Statistik gehört.
StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
InclusionAnnotation – UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

Der Wert der Einfügungsanmerkung, die auf die Statistik angewendet wurde.

StatisticSummaryList Liste

Eine Liste von StatisticSummary.

Ein Array von StatisticSummary-Objekten.

Eine Liste von StatisticSummary.

StatisticSummary Struktur

Zusammenfassende Informationen zu einer Statistik.

Felder

StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID.
RunIdentifier – Ein RunIdentifier-Objekt.

Die Ausführungs-ID.
StatisticName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Custom string pattern #16.

Der Name der Statistik.
DoubleValue – Nummer (doppelt).

Der Wert der Statistik.
EvaluationLevel – UTF-8-Zeichenfolge (zulässige Werte: Dataset="DATASET" | Column="COLUMN" | Multicolumn="MULTICOLUMN").

Die Bewertungsebene der Statistik. Mögliche Werte: Dataset, Column, Multicolumn.
ColumnsReferenced – Ein UTF-8-Zeichenfolgen-Array.

Die Liste der Spalten, auf die in der Statistik verwiesen wird.
ReferencedDatasets – Ein UTF-8-Zeichenfolgen-Array.

Die Liste der Datensätze, auf die in der Statistik verwiesen wird.
StatisticProperties – Ein Map-Array von Schlüssel-Wert-Paaren.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.

Eine StatisticPropertiesMap, die eine NameString und DescriptionString enthalten
RecordedOn – Zeitstempel.

Der Zeitstempel, zu dem die Statistik aufgezeichnet wurde.
InclusionAnnotation – Ein TimestampedInclusionAnnotation-Objekt.

Die Einfügungsanmerkung für die Statistik.

RunIdentifier Struktur

Eine Ausführungs-ID.

Felder

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Ausführungs-ID.
JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Auftragsausführungs-ID.

StatisticModelResult Struktur

Das Ergebnis des statistischen Modells.

Felder

LowerBound – Nummer (doppelt).

Die Untergrenze.
UpperBound – Nummer (doppelt).

Die Obergrenze.
PredictedValue – Nummer (doppelt).

Der vorhergesagte Wert.
ActualValue – Nummer (doppelt).

Der tatsächliche Wert.
Date – Zeitstempel.

Das Datum.
InclusionAnnotation – UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

Die Einfügungsanmerkung.

DataQualityGlueTable Struktur

Die Datenbank und Tabelle in der AWS Glue Data Catalog , die für Eingabe- oder Ausgabedaten für Datenqualitätsoperationen verwendet werden.

Felder

DatabaseName – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein Datenbankname im AWS Glue Data Catalog.
TableName – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein Tabellenname im AWS Glue Data Catalog.
CatalogId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Eine eindeutige Kennung für AWS Glue Data Catalog.
ConnectionName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der zu löschenden Verbindung zu AWS Glue Data Catalog.
AdditionalOptions – Ein Map-Array von Schlüssel-Wert-Paaren, nicht weniger als 1 oder mehr als 10 Paare.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.

Zusätzliche Optionen für die Tabelle. Derzeit werden zwei Schlüssel unterstützt:
- pushDownPredicate: zum Filtern nach Partitionen, ohne alle Dateien in Ihrem Datensatz auflisten und lesen zu müssen.
- catalogPartitionPredicate: zur Verwendung des serverseitigen Partition-Pruning mithilfe von Partitionsindizes in der AWS Glue Data Catalog.
PreProcessingQuery – UTF-8-Zeichenfolge, nicht mehr als 256 Bytes lang, passend zum URI address multi-line string pattern.

SQL-Abfrage im SparkSQL-Format, mit der die Daten für die Tabelle vorverarbeitet werden können AWS Glue Data Catalog, bevor der Datenqualitätsvorgang ausgeführt wird.

Operationen

StartDataQualityRulesetEvaluationRun Aktion (Python: start_data_quality_ruleset_evaluation_run)
CancelDataQualityRulesetEvaluationRun Aktion (Python: cancel_data_quality_ruleset_evaluation_run)
GetDataQualityRulesetEvaluationRun Aktion (Python: get_data_quality_ruleset_evaluation_run)
ListDataQualityRulesetEvaluationRuns Aktion (Python: list_data_quality_ruleset_evaluation_runs)
StartDataQualityRuleRecommendationRun Aktion (Python: start_data_quality_rule_recommendation_run)
CancelDataQualityRuleRecommendationRun Aktion (Python: cancel_data_quality_rule_recommendation_run)
GetDataQualityRuleRecommendationRun Aktion (Python: get_data_quality_rule_recommendation_run)
ListDataQualityRuleRecommendationRuns Aktion (Python: list_data_quality_rule_recommendation_runs)
GetDataQualityResult Aktion (Python: get_data_quality_result)
BatchGetDataQualityResult Aktion (Python: batch_get_data_quality_result)
ListDataQualityResults Aktion (Python: list_data_quality_results)
CreateDataQualityRuleset Aktion (Python: create_data_quality_ruleset)
DeleteDataQualityRuleset Aktion (Python: delete_data_quality_ruleset)
GetDataQualityRuleset Aktion (Python: get_data_quality_ruleset)
ListDataQualityRulesets Aktion (Python: list_data_quality_rulesets)
UpdateDataQualityRuleset Aktion (Python: update_data_quality_ruleset)
ListDataQualityStatistics Aktion (Python: list_data_quality_statistics)
TimestampFilter Struktur
CreateDataQualityRulesetRequest Struktur
GetDataQualityRulesetResponse Struktur
GetDataQualityResultResponse Struktur
StartDataQualityRuleRecommendationRunRequest Struktur
GetDataQualityRuleRecommendationRunResponse Struktur
BatchPutDataQualityStatisticAnnotation Aktion (Python: batch_put_data_quality_statistic_annotation)
GetDataQualityModel Aktion (Python: get_data_quality_model)
GetDataQualityModelResult Aktion (Python: get_data_quality_model_result)
ListDataQualityStatisticAnnotations Aktion (Python: list_data_quality_statistic_annotations)
PutDataQualityProfileAnnotation Aktion (Python: put_data_quality_profile_annotation)

StartDataQualityRulesetEvaluationRun Aktion (Python: start_data_quality_ruleset_evaluation_run)

Sobald Sie eine Regelsatzdefinition haben (entweder empfohlen oder Ihre eigene), rufen Sie diese Operation auf, um den Regelsatz anhand einer Datenquelle (Tabelle) auszuwerten.AWS Glue Die Auswertung berechnet Ergebnisse, die Sie mit der GetDataQualityResult-API abrufen können.

Anforderung

DataSource – Erforderlich: Ein DataSource-Objekt.

Die diesem Lauf zugeordnete Datenquelle (AWS Glue Tabelle).
Role – Erforderlich: UTF-8-Zeichenfolge.

Eine IAM Rolle, die zur Verschlüsselung der Ergebnisse des Laufs bereitgestellt wird.
NumberOfWorkers – Zahl (Ganzzahl).

Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.
Timeout – Zahl (ganze Zahl), mindestens 1.

Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).
ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.
AdditionalRunOptions – Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.

Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.
RulesetNames – Erforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 10 Zeichenfolgen.

Eine Liste von Regelsatznamen.
AdditionalDataSources – Ein Map-Array von Schlüssel-Wert-Paaren.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

Jeder Wert ist ein A DataSource-Objekt.

Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.

Antwort

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.

Fehler

InvalidInputException
EntityNotFoundException
OperationTimeoutException
InternalServiceException
ConflictException

CancelDataQualityRulesetEvaluationRun Aktion (Python: cancel_data_quality_ruleset_evaluation_run)

Bricht eine Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung

RunId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort

Keine Antwortparameter.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

GetDataQualityRulesetEvaluationRun Aktion (Python: get_data_quality_ruleset_evaluation_run)

Ruft eine bestimmte Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung

RunId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.
DataSource – Ein DataSource-Objekt.

Die Datenquelle (eine Tabelle), die diesem Testlauf zugeordnet ist. AWS Glue
Role – UTF-8-Zeichenfolge.

Eine IAM Rolle, die zur Verschlüsselung der Ergebnisse des Rechenlaufs bereitgestellt wird.
NumberOfWorkers – Zahl (Ganzzahl).

Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.
Timeout – Zahl (ganze Zahl), mindestens 1.

Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).
AdditionalRunOptions – Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.

Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.
Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

Der Status für diese Ausführung.
ErrorString – UTF-8-Zeichenfolge.

Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
LastModifiedOn – Zeitstempel.

Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.
CompletedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.
ExecutionTime – Zahl (Ganzzahl).

Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.
RulesetNames – Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 10 Zeichenfolgen.

Eine Liste von Regelsatznamen für die Ausführung. Dieser Parameter akzeptiert derzeit nur einen Regelsatznamen.
ResultIds – Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 10 Zeichenfolgen.

Eine Ergebnisliste IDs für die Datenqualitätsergebnisse des Rechenlaufs.
AdditionalDataSources – Ein Map-Array von Schlüssel-Wert-Paaren.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

Jeder Wert ist ein A DataSource-Objekt.

Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

ListDataQualityRulesetEvaluationRuns Aktion (Python: list_data_quality_ruleset_evaluation_runs)

Listet alle Ausführungen auf, die den Filterkriterien entsprechen, bei denen ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung

Filter – Ein DataQualityRulesetEvaluationRunFilter-Objekt.

Die Filterkriterien.
NextToken – UTF-8-Zeichenfolge.

Ein paginiertes Token zum Ausgleich der Ergebnisse.
MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort

Runs – Ein Array mit DataQualityRulesetEvaluationRunDescription-Objekten.

Eine Liste von DataQualityRulesetEvaluationRunDescription-Objekten, die Ausführungen von Datenqualitätsregelsätzen darstellen.
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler

InvalidInputException
OperationTimeoutException
InternalServiceException

StartDataQualityRuleRecommendationRun Aktion (Python: start_data_quality_rule_recommendation_run)

Startet einen Empfehlungslauf, der zum Generieren von Regeln verwendet wird, wenn Sie nicht wissen, welche Regeln Sie schreiben sollen. AWS Glue Data Quality analysiert die Daten und gibt Empfehlungen für einen möglichen Regelsatz ab. Sie können dann den Regelsatz auswerten und den generierten Regelsatz nach Ihren Wünschen ändern.

Empfehlungsausführungen werden nach 90 Tagen automatisch gelöscht.

Anforderung

Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.

DataSource – Erforderlich: Ein DataSource-Objekt.

Die diesem Lauf zugeordnete Datenquelle (AWS Glue Tabelle).
Role – Erforderlich: UTF-8-Zeichenfolge.

Eine IAM Rolle, die zur Verschlüsselung der Ergebnisse des Laufs bereitgestellt wird.
NumberOfWorkers – Zahl (Ganzzahl).

Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.
Timeout – Zahl (ganze Zahl), mindestens 1.

Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).
CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein Name für den Regelsatz.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

Antwort

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.

Fehler

InvalidInputException
OperationTimeoutException
InternalServiceException
ConflictException

CancelDataQualityRuleRecommendationRun Aktion (Python: cancel_data_quality_rule_recommendation_run)

Bricht die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.

Anforderung

RunId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort

Keine Antwortparameter.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

GetDataQualityRuleRecommendationRun Aktion (Python: get_data_quality_rule_recommendation_run)

Ruft die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.

Anforderung

RunId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort

Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.
DataSource – Ein DataSource-Objekt.

Die diesem Lauf zugeordnete Datenquelle (eine Tabelle). AWS Glue
Role – UTF-8-Zeichenfolge.

Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.
NumberOfWorkers – Zahl (Ganzzahl).

Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.
Timeout – Zahl (ganze Zahl), mindestens 1.

Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).
Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

Der Status für diese Ausführung.
ErrorString – UTF-8-Zeichenfolge.

Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
LastModifiedOn – Zeitstempel.

Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.
CompletedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.
ExecutionTime – Zahl (Ganzzahl).

Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.
RecommendedRuleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).
CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes, der durch die Ausführung erstellt wurde.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

ListDataQualityRuleRecommendationRuns Aktion (Python: list_data_quality_rule_recommendation_runs)

Listet die Empfehlungsausführungen auf, die die Filterkriterien erfüllen.

Anforderung

Filter – Ein DataQualityRuleRecommendationRunFilter-Objekt.

Die Filterkriterien.
NextToken – UTF-8-Zeichenfolge.

Ein paginiertes Token zum Ausgleich der Ergebnisse.
MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort

Runs – Ein Array mit DataQualityRuleRecommendationRunDescription-Objekten.

Eine Liste von DataQualityRuleRecommendationRunDescription-Objekten.
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler

InvalidInputException
OperationTimeoutException
InternalServiceException

GetDataQualityResult Aktion (Python: get_data_quality_result)

Ruft das Ergebnis einer Auswertung einer Datenqualitätsregel ab.

Anforderung

ResultId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

Antwort

Die Antwort für das Datenqualitätsergebnis.

ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.
ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID für das Datenqualitätsergebnis.
Score – Zahl (Double), nicht mehr als 1,0.

Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.
DataSource – Ein DataSource-Objekt.

Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
RulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.
EvaluationContext – UTF-8-Zeichenfolge.

Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.
CompletedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.
JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
RulesetEvaluationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.
RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.
AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.
Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.
AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

Eine Zusammenfassung der DataQualityAggregatedMetrics Objekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

Fehler

InvalidInputException
OperationTimeoutException
InternalServiceException
EntityNotFoundException

BatchGetDataQualityResult Aktion (Python: batch_get_data_quality_result)

Ruft eine Liste von Datenqualitätsergebnissen für das angegebene Ergebnis ab. IDs

Anforderung

ResultIds – Erforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 100 Zeichenfolgen.

Eine Liste mit eindeutigen Ergebnissen IDs für die Datenqualitätsergebnisse.

Antwort

Results – Erforderlich: Ein Array mit DataQualityResult-Objekten.

Eine Liste von DataQualityResult-Objekten, die die Datenqualitätsergebnisse darstellen.
ResultsNotFound – Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 100 Zeichenfolgen.

Eine Liste von Ergebnissen, IDs für die keine Ergebnisse gefunden wurden.

Fehler

InvalidInputException
OperationTimeoutException
InternalServiceException

ListDataQualityResults Aktion (Python: list_data_quality_results)

Gibt alle Ausführungsergebnisse der Datenqualität für Ihr Konto zurück.

Anforderung

Filter – Ein DataQualityResultFilterCriteria-Objekt.

Die Filterkriterien.
NextToken – UTF-8-Zeichenfolge.

Ein paginiertes Token zum Ausgleich der Ergebnisse.
MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort

Results – Erforderlich: Ein Array mit DataQualityResultDescription-Objekten.

Eine Liste von DataQualityResultDescription-Objekten.
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler

InvalidInputException
OperationTimeoutException
InternalServiceException

CreateDataQualityRuleset Aktion (Python: create_data_quality_ruleset)

Erstellt einen Regelsatz für die Datenqualität mit DQDL-Regeln, die auf eine angegebene Tabelle angewendet werden. AWS Glue

Sie erstellen den Regelsatz mit der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

Anforderung

Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.

Name – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein eindeutiger Name für den Datenqualitätsregelsatz.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Regelsatzes für die Datenqualität.
Ruleset – Erforderlich: UTF-8-Zeichenkette, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Bytes lang ist.

Jeder Wert ist eine UTF-8-Zeichenfolge, die nicht mehr als 256 Bytes lang ist.

Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.
TargetTable – Ein DataQualityTargetTable-Objekt.

Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.
RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

Antwort

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein eindeutiger Name für den Datenqualitätsregelsatz.

Fehler

InvalidInputException
AlreadyExistsException
OperationTimeoutException
InternalServiceException
ResourceNumberLimitExceededException

DeleteDataQualityRuleset Aktion (Python: delete_data_quality_ruleset)

Löscht einen Datenqualitätsregelsatz.

Anforderung

Name – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein eindeutiger Name für den Datenqualitätsregelsatz.

Antwort

Keine Antwortparameter.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

GetDataQualityRuleset Aktion (Python: get_data_quality_ruleset)

Gibt einen vorhandenen Regelsatz nach Kennung oder Name zurück.

Anforderung

Name – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes.

Antwort

Gibt die Antwort für den Regelsatz für die Datenqualität zurück.

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Regelsatzes.
Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im Entwicklerhandbuch. AWS Glue
TargetTable – Ein DataQualityTargetTable-Objekt.

Der Name und der Datenbankname der Zieltabelle.
CreatedOn – Zeitstempel.

Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.
LastModifiedOn – Zeitstempel.

Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.
RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

ListDataQualityRulesets Aktion (Python: list_data_quality_rulesets)

Gibt eine paginierte Liste von Regelsätzen für die angegebene Tabellenliste zurück. AWS Glue

Anforderung

NextToken – UTF-8-Zeichenfolge.

Ein paginiertes Token zum Ausgleich der Ergebnisse.
MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

Die maximale Anzahl der auszugebenden Ergebnisse.
Filter – Ein DataQualityRulesetFilterCriteria-Objekt.

Die Filterkriterien.
Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Bytes lang ist.

Jeder Wert ist eine UTF-8-Zeichenfolge, die nicht mehr als 256 Bytes lang ist.

Eine Liste mit Tags für Schlüsselwertpaare.

Antwort

Rulesets – Ein Array mit DataQualityRulesetListDetails-Objekten.

Eine paginierte Liste von Regelsätzen für die angegebene Tabellenliste. AWS Glue
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

UpdateDataQualityRuleset Aktion (Python: update_data_quality_ruleset)

Aktualisiert den angegebenen Datenqualitätsregelsatz.

Anforderung

Name – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes für die Datenqualität.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Regelsatzes.
Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im Entwicklerhandbuch. AWS Glue

Antwort

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes für die Datenqualität.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Regelsatzes.
Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

Fehler

EntityNotFoundException
AlreadyExistsException
IdempotentParameterMismatchException
InvalidInputException
OperationTimeoutException
InternalServiceException
ResourceNumberLimitExceededException

ListDataQualityStatistics Aktion (Python: list_data_quality_statistics)

Ruft eine Liste mit Datenqualitätsstatistiken ab.

Anforderung

StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID.
TimestampFilter – Ein TimestampFilter-Objekt.

Ein Zeitstempelfilter.
MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.

Antwort

Statistics – Ein Array mit StatisticSummary-Objekten.

Ein StatisticSummaryList
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.

Fehler

EntityNotFoundException
InvalidInputException
InternalServiceException

TimestampFilter Struktur

Ein Zeitstempelfilter.

Felder

RecordedBefore – Zeitstempel.

Der Zeitstempel, vor dem Statistiken in die Ergebnisse aufgenommen werden sollen.
RecordedAfter – Zeitstempel.

Der Zeitstempel, nach dem Statistiken in die Ergebnisse aufgenommen werden sollen.

CreateDataQualityRulesetRequest Struktur

Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.

Felder

Name – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein eindeutiger Name für den Datenqualitätsregelsatz.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Regelsatzes für die Datenqualität.
Ruleset – Erforderlich: UTF-8-Zeichenkette, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

Jeder Schlüssel ist eine UTF-8-Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Bytes lang ist.

Jeder Wert ist eine UTF-8-Zeichenfolge, die nicht mehr als 256 Bytes lang ist.

Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.
TargetTable – Ein DataQualityTargetTable-Objekt.

Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.
RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

GetDataQualityRulesetResponse Struktur

Gibt die Antwort für den Regelsatz für die Datenqualität zurück.

Felder

Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes.
Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

Eine Beschreibung des Regelsatzes.
Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
TargetTable – Ein DataQualityTargetTable-Objekt.

Der Name und der Datenbankname der Zieltabelle.
CreatedOn – Zeitstempel.

Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.
LastModifiedOn – Zeitstempel.

Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.
RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

GetDataQualityResultResponse Struktur

Die Antwort für das Datenqualitätsergebnis.

Felder

ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.
ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID für das Datenqualitätsergebnis.
Score – Zahl (Double), nicht mehr als 1,0.

Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.
DataSource – Ein DataSource-Objekt.

Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
RulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.
EvaluationContext – UTF-8-Zeichenfolge.

Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.
CompletedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.
JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
RulesetEvaluationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.
RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.
AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.
Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.
AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

Eine Zusammenfassung der DataQualityAggregatedMetrics Objekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

StartDataQualityRuleRecommendationRunRequest Struktur

Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.

Felder

DataSource – Erforderlich: Ein DataSource-Objekt.

Die diesem Lauf zugeordnete Datenquelle (AWS Glue Tabelle).
Role – Erforderlich: UTF-8-Zeichenfolge.

Eine IAM Rolle, die zur Verschlüsselung der Ergebnisse des Laufs bereitgestellt wird.
NumberOfWorkers – Zahl (Ganzzahl).

Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.
Timeout – Zahl (ganze Zahl), mindestens 1.

Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).
CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Ein Name für den Regelsatz.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

GetDataQualityRuleRecommendationRunResponse Struktur

Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.

Felder

RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die dieser Ausführung zugeordnete eindeutige Kennung.
DataSource – Ein DataSource-Objekt.

Die diesem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).
Role – UTF-8-Zeichenfolge.

Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.
NumberOfWorkers – Zahl (Ganzzahl).

Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.
Timeout – Zahl (ganze Zahl), mindestens 1.

Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).
Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

Der Status für diese Ausführung.
ErrorString – UTF-8-Zeichenfolge.

Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.
StartedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
LastModifiedOn – Zeitstempel.

Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.
CompletedOn – Zeitstempel.

Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.
ExecutionTime – Zahl (Ganzzahl).

Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.
RecommendedRuleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).
CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name des Regelsatzes, der durch die Ausführung erstellt wurde.
DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

BatchPutDataQualityStatisticAnnotation Aktion (Python: batch_put_data_quality_statistic_annotation)

Versehen Sie Datenpunkte für eine bestimmte Datenqualitätsstatistik im Zeitverlauf mit Anmerkungen. Die API benötigt sowohl ProfileID als auch StatisticID als Teil der Eingabe. InclusionAnnotation Die API funktioniert nur für eine einzelne statisticId in mehreren Profilen.

Anforderung

InclusionAnnotations – Erforderlich: Ein Array mit DatapointInclusionAnnotation-Objekten.

Eine DatapointInclusionAnnotation-Liste. Die InclusionAnnotations müssen eine ProfileID und eine StatisticID enthalten. Wenn es mehrere gibt InclusionAnnotations, muss sich die Liste auf eine einzelne StatisticID für mehrere ProfileIDs beziehen.
ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Client-Token.

Antwort

FailedInclusionAnnotations – Ein Array mit AnnotationError-Objekten.

Eine AnnotationError-Liste.

Fehler

EntityNotFoundException
InvalidInputException
InternalServiceException
ResourceNumberLimitExceededException

GetDataQualityModel Aktion (Python: get_data_quality_model)

Rufen Sie den Trainingsstatus des Modells zusammen mit weiteren Informationen (,,) ab. CompletedOn StartedOn FailureReason

Anforderung

StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
ProfileId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID.

Antwort

Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | SUCCEEDED | FAILED).

Der Trainingsstatus des Datenqualitätsmodells.
StartedOn – Zeitstempel.

Der Zeitstempel, zu dem das Datenqualitätsmodell-Training gestartet wurde.
CompletedOn – Zeitstempel.

Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.
FailureReason – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Der Grund für das Fehlschlagen des Trainings.

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

GetDataQualityModelResult Aktion (Python: get_data_quality_model_result)

Ruft die Vorhersagen einer Statistik für eine bestimmte Profil-ID ab.

Anforderung

StatisticId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
ProfileId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID.

Antwort

CompletedOn – Zeitstempel.

Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.
Model – Ein Array mit StatisticModelResult-Objekten.

Eine Liste von StatisticModelResult

Fehler

EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException

ListDataQualityStatisticAnnotations Aktion (Python: list_data_quality_statistic_annotations)

Ruft die Anmerkungen für eine Datenqualitätsstatistik ab.

Anforderung

StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Statistik-ID.
ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die Profil-ID.
TimestampFilter – Ein TimestampFilter-Objekt.

Ein Zeitstempelfilter.
MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.

Antwort

Annotations – Ein Array mit StatisticAnnotation-Objekten.

Eine Liste von StatisticAnnotation, die auf die Statistik angewendet wurden
NextToken – UTF-8-Zeichenfolge.

Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.

Fehler

InvalidInputException
InternalServiceException

PutDataQualityProfileAnnotation Aktion (Python: put_data_quality_profile_annotation)

Versehen Sie alle Datenpunkte für ein Profil mit Anmerkungen.

Anforderung

ProfileId – Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

Die ID des Profils zur Überwachung der Datenqualität, das mit Anmerkungen versehen werden soll.
InclusionAnnotation – Erforderlich: UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

Der Wert der Einfügungsanmerkung, der auf das Profil angewendet werden soll.

Antwort

Keine Antwortparameter.

Fehler

EntityNotFoundException
InvalidInputException
InternalServiceException

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Machine Learning

Sensible Daten