Data-Quality-API - AWS Glue
 —  Datentypen  —DataSourceDataQualityRulesetListDetailsDataQualityTargetTableDataQualityRulesetEvaluationRunDescriptionDataQualityRulesetEvaluationRunFilterDataQualityEvaluationRunAdditionalRunOptionsDataQualityRuleRecommendationRunDescriptionDataQualityRuleRecommendationRunFilterDataQualityResultDataQualityAnalyzerResultDataQualityObservationMetricBasedObservationDataQualityMetricValuesDataQualityRuleResultDataQualityResultDescriptionDataQualityResultFilterCriteriaDataQualityRulesetFilterCriteriaDataQualityAggregatedMetricsStatisticAnnotationTimestampedInclusionAnnotationAnnotationErrorDatapointInclusionAnnotationStatisticSummaryListStatisticSummaryRunIdentifierStatisticModelResultDataQualityGlueTable —  Operationen  —StartDataQualityRulesetEvaluationRun (start_data_quality_ruleset_evaluation_run)CancelDataQualityRulesetEvaluationRun (cancel_data_quality_ruleset_evaluation_run)GetDataQualityRulesetEvaluationRun (get_data_quality_ruleset_evaluation_run)ListDataQualityRulesetEvaluationRuns (list_data_quality_ruleset_evaluation_runs)StartDataQualityRuleRecommendationRun (start_data_quality_rule_recommendation_run)CancelDataQualityRuleRecommendationRun (cancel_data_quality_rule_recommendation_run)GetDataQualityRuleRecommendationRun (get_data_quality_rule_recommendation_run)ListDataQualityRuleRecommendationRuns (list_data_quality_rule_recommendation_runs)GetDataQualityResult (get_data_quality_result)BatchGetDataQualityResult (batch_get_data_quality_result)ListDataQualityResults (list_data_quality_results)CreateDataQualityRuleset (create_data_quality_ruleset)DeleteDataQualityRuleset (delete_data_quality_ruleset)GetDataQualityRuleset (get_data_quality_ruleset)ListDataQualityRulesets (list_data_quality_rulesets)UpdateDataQualityRuleset (update_data_quality_ruleset)ListDataQualityStatistics (list_data_quality_statistics)TimestampFilterCreateDataQualityRulesetRequestGetDataQualityRulesetResponseGetDataQualityResultResponseStartDataQualityRuleRecommendationRunRequestGetDataQualityRuleRecommendationRunResponseBatchPutDataQualityStatisticAnnotation (batch_put_data_quality_statistic_annotation)GetDataQualityModel (get_data_quality_model)GetDataQualityModelResult (get_data_quality_model_result)ListDataQualityStatisticAnnotations (list_data_quality_statistic_annotations)PutDataQualityProfileAnnotation (put_data_quality_profile_annotation)

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Data-Quality-API

Die Data-Quality-API beschreibt die Data-Quality-Datentypen und umfasst die API zum Erstellen, Löschen oder Aktualisieren von Datenqualitätsregelsätzen, -Ausführungen und -Bewertungen.

Datentypen

DataSource-Struktur

Eine Datenquelle (eine AWS Glue-Tabelle), für die Sie Datenqualitätsergebnisse wünschen.

Felder
  • GlueTable – Ein GlueTable-Objekt.

    Eine AWS Glue-Tabelle.

  • DataQualityGlueTable – Ein DataQualityGlueTable-Objekt.

    Eine AWS Glue-Tabelle für Data-Quality-Vorgänge.

DataQualityRulesetListDetails-Struktur

Beschreibt einen Datenqualitätsregelsatz, der von GetDataQualityRuleset zurückgegeben wurde.

Felder
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes für die Datenqualität.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes für die Datenqualität.

  • CreatedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der der Datenqualitätsregelsatz erstellt wurde.

  • LastModifiedOn – Zeitstempel.

    Das Datum und die Uhrzeit der letzten Änderung des Regelsatzes für die Datenqualität.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Ein Objekt, das eine AWS Glue-Tabelle darstellt.

  • RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.

  • RuleCount – Zahl (Ganzzahl).

    Die Anzahl der Regeln im Regelsatz.

DataQualityTargetTable-Struktur

Ein Objekt, das eine AWS Glue-Tabelle darstellt.

Felder
  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Den Namen der AWS Glue-Tabelle

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Datenbank, in der die AWS Glue-Tabelle existiert.

  • CatalogId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Katalog-ID, in der die AWS Glue-Tabelle vorhanden ist.

DataQualityRulesetEvaluationRunDescription-Struktur

Beschreibt das Ausführungsergebnis zur Auswertung des Datenqualitätsregelsatzes.

Felder
  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung gestartet wurde.

  • DataSource – Ein DataSource-Objekt.

    Die Datenquelle (eine AWS Glue-Tabelle), die der Ausführung zugeordnet ist.

DataQualityRulesetEvaluationRunFilter-Struktur

Die Filterkriterien.

Felder
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Filtert basierend auf einer Datenquelle (einer AWS Glue-Tabelle), die der Ausführung zugeordnet ist.

  • StartedBefore – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.

  • StartedAfter – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.

DataQualityEvaluationRunAdditionalRunOptions-Struktur

Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.

Felder
  • CloudWatchMetricsEnabled – Boolesch.

    Ob CloudWatch-Metriken aktiviert werden sollen oder nicht.

  • ResultsS3Prefix – UTF-8-Zeichenfolge.

    Präfix für Amazon S3 zum Speichern von Ergebnissen.

  • CompositeRuleEvaluationMethod – UTF-8-Zeichenfolge (zulässige Werte: COLUMN | ROW).

    Die Bewertungsmethode für zusammengesetzte Regeln im Regelsatz auf ZEILE/SPALTE festlegen

DataQualityRuleRecommendationRunDescription-Struktur

Beschreibt das Ergebnis einer Empfehlungsausführung einer Datenqualitätsregel.

Felder
  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • DataSource – Ein DataSource-Objekt.

    Die Datenquelle (AWS Glue-Tabelle), die der Empfehlungsausführung zugeordnet ist.

DataQualityRuleRecommendationRunFilter-Struktur

Ein Filter zum Auflisten von Empfehlungsausführungen zu Datenqualität.

Felder
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Filtert basierend auf einer angegebenen Datenquelle (AWS Glue-Tabelle).

  • StartedBefore – Zeitstempel.

    Filtert basierend auf der Zeit für Ergebnisse, die vor der angegebenen Zeit gestartet wurden.

  • StartedAfter – Zeitstempel.

    Filtert basierend auf der Zeit für Ergebnisse, die nach der angegebenen Zeit gestartet wurden.

DataQualityResult-Struktur

Beschreibt ein Datenqualitätsergebnis.

Felder
  • ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID für das Datenqualitätsergebnis.

  • Score – Zahl (Double), nicht mehr als 1,0.

    Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.

  • DataSource – Ein DataSource-Objekt.

    Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.

  • EvaluationContext – UTF-8-Zeichenfolge.

    Im Kontext eines Auftrags in AWS Glue Studio wird jedem Knoten im Zeichenbereich in der Regel eine Art Name zugewiesen, und die Datenqualitätsknoten verfügen über Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung gestartet wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung abgeschlossen wurde.

  • JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetEvaluationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die eindeutige Ausführungs-ID für die Regelsatzauswertung für dieses Datenqualitätsergebnis.

  • RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.

  • AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.

  • Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

    Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.

  • AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

    Eine Zusammenfassung der DataQualityAggregatedMetrics-Objekte, die die Gesamtzahl der verarbeiteten Zeilen und Regeln zeigt, einschließlich ihrer „Pass“/„Fail“-Statistiken (erfolgreich/nicht erfolgreich) auf der Grundlage von Ergebnissen auf Zeilenebene.

DataQualityAnalyzerResult-Struktur

Beschreibt das Ergebnis der Bewertung eines Datenqualitätsanalysators.

Felder
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Datenqualitätsanalysators.

  • Description – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Datenqualitätsanalysators.

  • EvaluationMessage – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Bewertungsmeldung.

  • EvaluatedMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

    Jeder Wert ist eine Zahl (doppelt).

    Eine Zuordnung der Metriken, die der Auswertung des Analysators zugewiesen sind.

DataQualityObservation-Struktur

Beschreibt die Beobachtung, die nach Auswertung der Regeln und Analysatoren generiert wurde.

Felder
  • Description – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung der Datenqualitätsbeobachtung.

  • MetricBasedObservation – Ein MetricBasedObservation-Objekt.

    Ein Objekt vom Typ MetricBasedObservation, das die Beobachtung darstellt, die auf ausgewerteten Datenqualitätsmetriken basiert.

MetricBasedObservation-Struktur

Beschreibt die metrikbasierte Beobachtung, die auf der Grundlage ausgewerteter Datenqualitätsmetriken generiert wurde.

Felder
  • MetricName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Datenqualitätsmetrik, die zur Generierung der Beobachtung verwendet wurde.

  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • MetricValues – Ein DataQualityMetricValues-Objekt.

    Ein Objekt vom Typ DataQualityMetricValues, das die Analyse des Werts der Datenqualitätsmetrik darstellt.

  • NewRules – Ein UTF-8-Zeichenfolgen-Array.

    Eine Liste neuer Datenqualitätsregeln, die im Rahmen der Beobachtung auf der Grundlage des Werts der Datenqualitätsmetrik generiert wurden.

DataQualityMetricValues-Struktur

Beschreibt den Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

Felder
  • ActualValue – Nummer (doppelt).

    Der tatsächliche Wert der Datenqualitätsmetrik.

  • ExpectedValue – Nummer (doppelt).

    Der erwartete Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

  • LowerLimit – Nummer (doppelt).

    Die Untergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

  • UpperLimit – Nummer (doppelt).

    Die Obergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

DataQualityRuleResult-Struktur

Beschreibt das Ergebnis der Auswertung einer Datenqualitätsregel.

Felder
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Datenqualitätsregel.

  • Description – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung der Datenqualitätsregel.

  • EvaluationMessage – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Bewertungsmeldung.

  • Result – UTF-8-Zeichenfolge (zulässige Werte: PASS | FAIL | ERROR).

    Ein Status „Bestanden“ oder „Nicht bestanden“ für die Regel.

  • EvaluatedMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

    Jeder Wert ist eine Zahl (doppelt).

    Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind.

  • EvaluatedRule – UTF-8-Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Die ausgewertete Regel.

  • RuleMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

    Jeder Wert ist eine Zahl (doppelt).

    Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind, basierend auf den Ergebnissen auf Zeilenebene.

DataQualityResultDescription-Struktur

Beschreibt ein Datenqualitätsergebnis.

Felder
  • ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die eindeutige Ergebnis-ID für dieses Datenqualitätsergebnis.

  • DataSource – Ein DataSource-Objekt.

    Der dem Datenqualitätsergebnis zugeordnete Tabellenname.

  • JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der dem Datenqualitätsergebnis zugeordnete Auftragsname.

  • JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist.

  • StartedOn – Zeitstempel.

    Die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.

DataQualityResultFilterCriteria-Struktur

Kriterien, die für die Rückgabe von Datenqualitätsergebnissen verwendet werden.

Felder
  • DataSource – Ein DataSource-Objekt.

    Filtert Ergebnisse nach der angegebenen Datenquelle. Beispielsweise das Abrufen aller Ergebnisse für eine AWS Glue-Tabelle.

  • JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Filtert Ergebnisse nach dem angegebenen Auftragsnamen.

  • JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Filtert Ergebnisse nach der angegebenen Auftragsausführung-ID.

  • StartedAfter – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.

  • StartedBefore – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.

DataQualityRulesetFilterCriteria-Struktur

Die Kriterien, die zum Filtern von Datenqualitätsregelsätzen verwendet werden.

Felder
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Regelsatz-Filterkriterien.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Die Beschreibung der Regelsatz-Filterkriterien.

  • CreatedBefore – Zeitstempel.

    Filtert nach Regelsätzen, die vor diesem Datum erstellt wurden.

  • CreatedAfter – Zeitstempel.

    Filtert nach Regelsätzen, die nach diesem Datum erstellt wurden.

  • LastModifiedBefore – Zeitstempel.

    Filtert nach Regelsätzen, die zuletzt vor diesem Datum geändert wurden.

  • LastModifiedAfter – Zeitstempel.

    Filter nach Regelsätzen, die zuletzt nach diesem Datum geändert wurden.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Der Name und der Datenbankname der Zieltabelle.

DataQualityAggregatedMetrics-Struktur

Eine Zusammenfassung der Metriken, die die Gesamtzahl der verarbeiteten Zeilen und Regeln zeigt, einschließlich ihrer „Pass“/„Fail“-Statistiken (erfolgreich/nicht erfolgreich) auf der Grundlage von Ergebnissen auf Zeilenebene.

Felder
  • TotalRowsProcessed – Nummer (doppelt).

    Die Gesamtzahl der Zeilen, die bei der Datenqualitätsbewertung verarbeitet wurden.

  • TotalRowsPassed – Nummer (doppelt).

    Die Gesamtzahl der Zeilen, für die alle geltenden Datenqualitätsregeln erfolgreich angewendet wurden.

  • TotalRowsFailed – Nummer (doppelt).

    Die Gesamtzahl der Zeilen, für die eine oder mehrere Datenqualitätsregeln nicht erfolgreich angewendet wurden.

  • TotalRulesProcessed – Nummer (doppelt).

    Die Gesamtzahl der Datenqualitätsregeln, die bewertet wurden.

  • TotalRulesPassed – Nummer (doppelt).

    Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien erfüllt haben.

  • TotalRulesFailed – Nummer (doppelt).

    Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien nicht erfüllt haben.

StatisticAnnotation-Struktur

Eine statistische Anmerkung.

Felder
  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID.

  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • StatisticRecordedOn – Zeitstempel.

    Der Zeitstempel, zu dem die mit Anmerkungen versehene Statistik aufgezeichnet wurde.

  • InclusionAnnotation – Ein TimestampedInclusionAnnotation-Objekt.

    Die Einfügungsanmerkung, die auf die Statistik angewendet wurde.

TimestampedInclusionAnnotation-Struktur

Eine Einfügungsanmerkung mit Zeitstempel.

Felder
  • Value – UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

    Der Wert der Einfügungsanmerkung.

  • LastModifiedOn – Zeitstempel.

    Der Zeitstempel, zu dem die Einfügungsanmerkung zuletzt geändert wurde.

AnnotationError-Struktur

Eine fehlgeschlagene Anmerkung.

Felder
  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID für die fehlgeschlagene Anmerkung.

  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID für die fehlgeschlagene Anmerkung.

  • FailureReason – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Der Grund, warum die Anmerkung fehlgeschlagen ist.

DatapointInclusionAnnotation-Struktur

Eine Einfügungsanmerkung.

Felder
  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Datenqualitätsprofils, zu dem die Statistik gehört.

  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • InclusionAnnotation – UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

    Der Wert der Einfügungsanmerkung, die auf die Statistik angewendet wurde.

StatisticSummaryList-Liste

Eine Liste von StatisticSummary.

Ein Array von StatisticSummary-Objekten.

Eine Liste von StatisticSummary.

StatisticSummary-Struktur

Zusammenfassende Informationen zu einer Statistik.

Felder
  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID.

  • RunIdentifier – Ein RunIdentifier-Objekt.

    Die Ausführungs-ID.

  • StatisticName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Custom string pattern #16.

    Der Name der Statistik.

  • DoubleValue – Nummer (doppelt).

    Der Wert der Statistik.

  • EvaluationLevel – UTF-8-Zeichenfolge (zulässige Werte: Dataset="DATASET" | Column="COLUMN" | Multicolumn="MULTICOLUMN").

    Die Bewertungsebene der Statistik. Mögliche Werte: Dataset, Column, Multicolumn.

  • ColumnsReferenced – Ein UTF-8-Zeichenfolgen-Array.

    Die Liste der Spalten, auf die in der Statistik verwiesen wird.

  • ReferencedDatasets – Ein UTF-8-Zeichenfolgen-Array.

    Die Liste der Datensätze, auf die in der Statistik verwiesen wird.

  • StatisticProperties – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

    Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.

    Eine StatisticPropertiesMap, die eine NameString und DescriptionString enthalten

  • RecordedOn – Zeitstempel.

    Der Zeitstempel, zu dem die Statistik aufgezeichnet wurde.

  • InclusionAnnotation – Ein TimestampedInclusionAnnotation-Objekt.

    Die Einfügungsanmerkung für die Statistik.

RunIdentifier-Struktur

Eine Ausführungs-ID.

Felder
  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Ausführungs-ID.

  • JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Auftragsausführungs-ID.

StatisticModelResult-Struktur

Das Ergebnis des statistischen Modells.

Felder
  • LowerBound – Nummer (doppelt).

    Die Untergrenze.

  • UpperBound – Nummer (doppelt).

    Die Obergrenze.

  • PredictedValue – Nummer (doppelt).

    Der vorhergesagte Wert.

  • ActualValue – Nummer (doppelt).

    Der tatsächliche Wert.

  • Date – Zeitstempel.

    Das Datum.

  • InclusionAnnotation – UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

    Die Einfügungsanmerkung.

DataQualityGlueTable-Struktur

Die Datenbank und Tabelle im AWS Glue Data Catalog, die für Eingabe- oder Ausgabedaten der Vorgänge von Data Quality verwendet wird.

Felder
  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein Datenbankname im AWS Glue Data Catalog.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein Tabellenname im AWS Glue Data Catalog.

  • CatalogId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Eine eindeutige Kennung für AWS Glue Data Catalog.

  • ConnectionName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der zu löschenden Verbindung zu AWS Glue Data Catalog.

  • AdditionalOptions – Ein Map-Array von Schlüssel-Wert-Paaren, nicht weniger als 1 oder mehr als 10 Paare.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

    Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.

    Zusätzliche Optionen für die Tabelle. Derzeit werden zwei Schlüssel unterstützt:

    • pushDownPredicate: zum Filtern nach Partitionen, ohne alle Dateien in Ihrem Datensatz auflisten und lesen zu müssen.

    • catalogPartitionPredicate: zur Verwendung des serverseitigen Partition-Pruning mithilfe von Partitionsindizes in der AWS Glue Data Catalog.

  • PreProcessingQuery – UTF-8-Zeichenfolge, nicht mehr als 256 Bytes lang, passend zum URI address multi-line string pattern.

    SQL-Abfrage im SparkSQL-Format, die zur Vorverarbeitung der Daten für die Tabelle in AWS Glue Data Catalog verwendet werden kann, bevor der Data-Quality-Vorgang ausgeführt wird.

Operationen

StartDataQualityRulesetEvaluationRun-Aktion (Python: start_data_quality_ruleset_evaluation_run)

Sobald Sie über eine Regelsatzdefinition verfügen (entweder empfohlen oder Ihre eigene), rufen Sie diese Operation auf, um den Regelsatz anhand einer Datenquelle (AWS Glue-Tabelle) auszuwerten. Die Auswertung berechnet Ergebnisse, die Sie mit der GetDataQualityResult-API abrufen können.

Anforderung
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Die Datenquelle (AWS Glue-Tabelle), die dieser Ausführung zugeordnet ist.

  • RoleErforderlich: UTF-8-Zeichenfolge.

    Eine bereitgestellte IAM-Rolle, um die Ergebnisse der Ausführung zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

  • AdditionalRunOptions – Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.

    Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.

  • RulesetNamesErforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 10 Zeichenfolgen.

    Eine Liste von Regelsatznamen.

  • AdditionalDataSources – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

    Jeder Wert ist ein A DataSource-Objekt.

    Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.

Antwort
  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Fehler
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRulesetEvaluationRun-Aktion (Python: cancel_data_quality_ruleset_evaluation_run)

Bricht eine Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung
  • RunIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRulesetEvaluationRun-Aktion (Python: get_data_quality_ruleset_evaluation_run)

Ruft eine bestimmte Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung
  • RunIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort
  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • DataSource – Ein DataSource-Objekt.

    Die Datenquelle (eine AWS Glue-Tabelle), die dieser Ausführung der Auswertung zugeordnet ist.

  • Role – UTF-8-Zeichenfolge.

    Eine bereitgestellte IAM-Rolle, um die Ergebnisse der Ausführung zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • AdditionalRunOptions – Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.

    Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.

  • Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • ErrorString – UTF-8-Zeichenfolge.

    Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.

  • ExecutionTime – Zahl (Ganzzahl).

    Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.

  • RulesetNames – Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 10 Zeichenfolgen.

    Eine Liste von Regelsatznamen für die Ausführung. Dieser Parameter akzeptiert derzeit nur einen Regelsatznamen.

  • ResultIds – Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 10 Zeichenfolgen.

    Eine Liste von Ergebnis-IDs für die Datenqualitätsergebnisse für die Ausführung.

  • AdditionalDataSources – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, und entspricht dem Single-line string pattern.

    Jeder Wert ist ein A DataSource-Objekt.

    Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesetEvaluationRuns-Aktion (Python: list_data_quality_ruleset_evaluation_runs)

Listet alle Ausführungen auf, die den Filterkriterien entsprechen, bei denen ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung
  • Filter – Ein DataQualityRulesetEvaluationRunFilter-Objekt.

    Die Filterkriterien.

  • NextToken – UTF-8-Zeichenfolge.

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort
  • Runs – Ein Array mit DataQualityRulesetEvaluationRunDescription-Objekten.

    Eine Liste von DataQualityRulesetEvaluationRunDescription-Objekten, die Ausführungen von Datenqualitätsregelsätzen darstellen.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartDataQualityRuleRecommendationRun-Aktion (Python: start_data_quality_rule_recommendation_run)

Startet eine Empfehlungsausführung, die zum Generieren von Regeln verwendet wird, wenn Sie nicht wissen, welche Regeln Sie schreiben sollen. AWS Glue Data Quality analysiert die Daten und gibt Empfehlungen für einen möglichen Regelsatz. Sie können dann den Regelsatz auswerten und den generierten Regelsatz nach Ihren Wünschen ändern.

Empfehlungsausführungen werden nach 90 Tagen automatisch gelöscht.

Anforderung

Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.

  • DataSourceErforderlich: Ein DataSource-Objekt.

    Die Datenquelle (AWS Glue-Tabelle), die dieser Ausführung zugeordnet ist.

  • RoleErforderlich: UTF-8-Zeichenfolge.

    Eine bereitgestellte IAM-Rolle, um die Ergebnisse der Ausführung zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein Name für den Regelsatz.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

Antwort
  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRuleRecommendationRun-Aktion (Python: cancel_data_quality_rule_recommendation_run)

Bricht die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.

Anforderung
  • RunIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleRecommendationRun-Aktion (Python: get_data_quality_quality_quality_quality_rule_commendation_run)

Ruft die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.

Anforderung
  • RunIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort

Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.

  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • DataSource – Ein DataSource-Objekt.

    Die Datenquelle (eine AWS Glue-Tabelle), die dieser Ausführung zugeordnet ist.

  • Role – UTF-8-Zeichenfolge.

    Eine bereitgestellte IAM-Rolle, um die Ergebnisse der Ausführung zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • ErrorString – UTF-8-Zeichenfolge.

    Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.

  • ExecutionTime – Zahl (Ganzzahl).

    Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.

  • RecommendedRuleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).

  • CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes, der durch die Ausführung erstellt wurde.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRuleRecommendationRun-Aktion (Python: list_data_quality_quality_quality_rule_commendation_runs)

Listet die Empfehlungsausführungen auf, die die Filterkriterien erfüllen.

Anforderung
  • Filter – Ein DataQualityRuleRecommendationRunFilter-Objekt.

    Die Filterkriterien.

  • NextToken – UTF-8-Zeichenfolge.

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort
  • Runs – Ein Array mit DataQualityRuleRecommendationRunDescription-Objekten.

    Eine Liste von DataQualityRuleRecommendationRunDescription-Objekten.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityResult-Aktion (Python: get_data_quality_result)

Ruft das Ergebnis einer Auswertung einer Datenqualitätsregel ab.

Anforderung
  • ResultIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

Antwort

Die Antwort für das Datenqualitätsergebnis.

  • ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID für das Datenqualitätsergebnis.

  • Score – Zahl (Double), nicht mehr als 1,0.

    Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.

  • DataSource – Ein DataSource-Objekt.

    Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.

  • EvaluationContext – UTF-8-Zeichenfolge.

    Im Kontext eines Auftrags in AWS Glue Studio wird jedem Knoten im Zeichenbereich in der Regel eine Art Name zugewiesen, und die Datenqualitätsknoten verfügen über Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.

  • JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetEvaluationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.

  • RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.

  • AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.

  • Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

    Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.

  • AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

    Eine Zusammenfassung der DataQualityAggregatedMetrics-Objekte, die die Gesamtzahl der verarbeiteten Zeilen und Regeln zeigt, einschließlich ihrer „Pass“/„Fail“-Statistiken (erfolgreich/nicht erfolgreich) auf der Grundlage von Ergebnissen auf Zeilenebene.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • EntityNotFoundException

BatchGetDataQualityResult-Aktion (Python: batch_get_data_quality_result)

Ruft eine Liste mit Datenqualitätsergebnissen für die angegebenen Ergebnis-IDs ab.

Anforderung
  • ResultIdsErforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 100 Zeichenfolgen.

    Eine Liste mit eindeutigen Ergebnis-IDs für die Datenqualitätsergebnisse.

Antwort
  • ResultsErforderlich: Ein Array mit DataQualityResult-Objekten.

    Eine Liste von DataQualityResult-Objekten, die die Datenqualitätsergebnisse darstellen.

  • ResultsNotFound – Ein Array mit UTF-8-Zeichenfolgen, nicht weniger als 1 und nicht mehr als 100 Zeichenfolgen.

    Eine Liste mit Ergebnis-IDs, für die keine Ergebnisse gefunden wurden.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityResults-Aktion (Python: list_data_quality_results)

Gibt alle Ausführungsergebnisse der Datenqualität für Ihr Konto zurück.

Anforderung
  • Filter – Ein DataQualityResultFilterCriteria-Objekt.

    Die Filterkriterien.

  • NextToken – UTF-8-Zeichenfolge.

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort
  • ResultsErforderlich: Ein Array mit DataQualityResultDescription-Objekten.

    Eine Liste von DataQualityResultDescription-Objekten.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

CreateDataQualityRuleset-Aktion (Python: create_data_quality_ruleset)

Erstellt einen Datenqualitätsregelsatz mit DQDL-Regeln, die auf eine angegebene AWS Glue-Tabelle angewendet werden.

Sie erstellen den Regelsatz mit der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue-Entwicklerhandbuch.

Anforderung

Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.

  • NameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes für die Datenqualität.

  • RulesetErforderlich: UTF-8-Zeichenkette, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue-Entwicklerhandbuch.

  • Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Bytes lang ist.

    Jeder Wert ist eine UTF-8-Zeichenfolge, die nicht mehr als 256 Bytes lang ist.

    Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.

  • RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

Antwort
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

Fehler
  • InvalidInputException

  • AlreadyExistsException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

DeleteDataQualityRuleset-Aktion (Python: delete_data_quality_ruleset)

Löscht einen Datenqualitätsregelsatz.

Anforderung
  • NameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleset-Aktion (Python: get_data_quality_ruleset)

Gibt einen vorhandenen Regelsatz nach Kennung oder Name zurück.

Anforderung
  • NameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes.

Antwort

Gibt die Antwort für den Regelsatz für die Datenqualität zurück.

  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue-Entwicklerhandbuch.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Der Name und der Datenbankname der Zieltabelle.

  • CreatedOn – Zeitstempel.

    Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.

  • RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesets-Aktion (Python: list_data_quality_rulesets)

Gibt eine paginierte Liste von Regelsätzen für die angegebene Liste von AWS Glue-Tabellen zurück.

Anforderung
  • NextToken – UTF-8-Zeichenfolge.

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

  • Filter – Ein DataQualityRulesetFilterCriteria-Objekt.

    Die Filterkriterien.

  • Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Bytes lang ist.

    Jeder Wert ist eine UTF-8-Zeichenfolge, die nicht mehr als 256 Bytes lang ist.

    Eine Liste mit Tags für Schlüsselwertpaare.

Antwort
  • Rulesets – Ein Array mit DataQualityRulesetListDetails-Objekten.

    Eine paginierte Liste von Regelsätzen für die angegebene Liste von AWS Glue-Tabellen.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

UpdateDataQualityRuleset-Aktion (Python: update_data_quality_ruleset)

Aktualisiert den angegebenen Datenqualitätsregelsatz.

Anforderung
  • NameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes für die Datenqualität.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue-Entwicklerhandbuch.

Antwort
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes für die Datenqualität.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue-Entwicklerhandbuch.

Fehler
  • EntityNotFoundException

  • AlreadyExistsException

  • IdempotentParameterMismatchException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

ListDataQualityStatistics-Aktion (Python: list_data_quality_statistics)

Ruft eine Liste mit Datenqualitätsstatistiken ab.

Anforderung
  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID.

  • TimestampFilter – Ein TimestampFilter-Objekt.

    Ein Zeitstempelfilter.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.

Antwort
  • Statistics – Ein Array mit StatisticSummary-Objekten.

    Ein StatisticSummaryList.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

TimestampFilter-Struktur

Ein Zeitstempelfilter.

Felder
  • RecordedBefore – Zeitstempel.

    Der Zeitstempel, vor dem Statistiken in die Ergebnisse aufgenommen werden sollen.

  • RecordedAfter – Zeitstempel.

    Der Zeitstempel, nach dem Statistiken in die Ergebnisse aufgenommen werden sollen.

CreateDataQualityRulesetRequest-Struktur

Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.

Felder
  • NameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes für die Datenqualität.

  • RulesetErforderlich: UTF-8-Zeichenkette, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue-Entwicklerhandbuch.

  • Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Bytes lang ist.

    Jeder Wert ist eine UTF-8-Zeichenfolge, die nicht mehr als 256 Bytes lang ist.

    Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.

  • RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

GetDataQualityRulesetResponse-Struktur

Gibt die Antwort für den Regelsatz für die Datenqualität zurück.

Felder
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue-Entwicklerhandbuch.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Der Name und der Datenbankname der Zieltabelle.

  • CreatedOn – Zeitstempel.

    Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.

  • RecommendationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

GetDataQualityResultResponse-Struktur

Die Antwort für das Datenqualitätsergebnis.

Felder
  • ResultId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID für das Datenqualitätsergebnis.

  • Score – Zahl (Double), nicht mehr als 1,0.

    Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.

  • DataSource – Ein DataSource-Objekt.

    Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.

  • EvaluationContext – UTF-8-Zeichenfolge.

    Im Kontext eines Auftrags in AWS Glue Studio wird jedem Knoten im Zeichenbereich in der Regel eine Art Name zugewiesen, und die Datenqualitätsknoten verfügen über Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.

  • JobName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • JobRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetEvaluationRunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.

  • RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.

  • AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.

  • Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

    Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.

  • AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

    Eine Zusammenfassung der DataQualityAggregatedMetrics-Objekte, die die Gesamtzahl der verarbeiteten Zeilen und Regeln zeigt, einschließlich ihrer „Pass“/„Fail“-Statistiken (erfolgreich/nicht erfolgreich) auf der Grundlage von Ergebnissen auf Zeilenebene.

StartDataQualityRuleRecommendationRunRequest-Struktur

Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.

Felder
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Die Datenquelle (AWS Glue-Tabelle), die dieser Ausführung zugeordnet ist.

  • RoleErforderlich: UTF-8-Zeichenfolge.

    Eine bereitgestellte IAM-Rolle, um die Ergebnisse der Ausführung zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Ein Name für den Regelsatz.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

GetDataQualityRuleRecommendationRunResponse-Struktur

Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.

Felder
  • RunId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • DataSource – Ein DataSource-Objekt.

    Die Datenquelle (eine AWS Glue-Tabelle), die dieser Ausführung zugeordnet ist.

  • Role – UTF-8-Zeichenfolge.

    Eine bereitgestellte IAM-Rolle, um die Ergebnisse der Ausführung zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED | RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • ErrorString – UTF-8-Zeichenfolge.

    Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.

  • ExecutionTime – Zahl (Ganzzahl).

    Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.

  • RecommendedRuleset – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 65 536 Bytes lang.

    Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).

  • CreatedRulesetName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name des Regelsatzes, der durch die Ausführung erstellt wurde.

  • DataQualitySecurityConfiguration – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

BatchPutDataQualityStatisticAnnotation-Aktion (Python: batch_put_data_quality_statistic_annotation)

Versehen Sie Datenpunkte für eine bestimmte Datenqualitätsstatistik im Zeitverlauf mit Anmerkungen. Die API benötigt sowohl profileID als auch statisticID als Teil der Eingabe der InclusionAnnotation. Die API funktioniert nur für eine einzelne statisticId in mehreren Profilen.

Anforderung
  • InclusionAnnotationsErforderlich: Ein Array mit DatapointInclusionAnnotation-Objekten.

    Eine DatapointInclusionAnnotation-Liste. Die InclusionAnnotations müssen eine profileId und eine statisticId enthalten. Wenn es mehrere InclusionAnnotations gibt, muss sich die Liste auf eine einzelne statisticId für mehrere profileIds beziehen.

  • ClientToken – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Client-Token.

Antwort
  • FailedInclusionAnnotations – Ein Array mit AnnotationError-Objekten.

    Eine AnnotationError-Liste.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • ResourceNumberLimitExceededException

GetDataQualityModel-Aktion (Python: get_data_quality_model)

Rufen Sie den Trainingsstatus des Modells zusammen mit weiteren Informationen ab (CompletedOn, StartedOn, FailureReason).

Anforderung
  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • ProfileIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID.

Antwort
  • Status – UTF-8-Zeichenfolge (zulässige Werte: RUNNING | SUCCEEDED | FAILED).

    Der Trainingsstatus des Datenqualitätsmodells.

  • StartedOn – Zeitstempel.

    Der Zeitstempel, zu dem das Datenqualitätsmodell-Training gestartet wurde.

  • CompletedOn – Zeitstempel.

    Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.

  • FailureReason – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Grund für das Fehlschlagen des Trainings.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityModelResult-Aktion (Python: get_data_quality_model_result)

Ruft die Vorhersagen einer Statistik für eine bestimmte Profil-ID ab.

Anforderung
  • StatisticIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • ProfileIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID.

Antwort
  • CompletedOn – Zeitstempel.

    Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.

  • Model – Ein Array mit StatisticModelResult-Objekten.

    Eine Liste von StatisticModelResult

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityStatisticAnnotations-Aktion (Python: list_data_quality_statistic_annotations)

Ruft die Anmerkungen für eine Datenqualitätsstatistik ab.

Anforderung
  • StatisticId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Statistik-ID.

  • ProfileId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Profil-ID.

  • TimestampFilter – Ein TimestampFilter-Objekt.

    Ein Zeitstempelfilter.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.

Antwort
  • Annotations – Ein Array mit StatisticAnnotation-Objekten.

    Eine Liste von StatisticAnnotation, die auf die Statistik angewendet wurden

  • NextToken – UTF-8-Zeichenfolge.

    Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.

Fehler
  • InvalidInputException

  • InternalServiceException

PutDataQualityProfileAnnotation-Aktion (Python: put_data_quality_profile_annotation)

Versehen Sie alle Datenpunkte für ein Profil mit Anmerkungen.

Anforderung
  • ProfileIdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Profils zur Überwachung der Datenqualität, das mit Anmerkungen versehen werden soll.

  • InclusionAnnotationErforderlich: UTF-8-Zeichenfolge (zulässige Werte: INCLUDE | EXCLUDE).

    Der Wert der Einfügungsanmerkung, der auf das Profil angewendet werden soll.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException