Gängige Datentypen - AWS Glue

Gängige Datentypen

Die gängigen Datentypen beschreiben verschiedene Datentypen, die in AWS Glue üblich sind.

Tag-Struktur

Das Tag-Objekt stellt eine Markierung dar, die Sie einer AWS-Ressource zuweisen können. Jeder Tag besteht aus einem Schlüssel und einem optionalen Wert, beides können Sie bestimmen.

Weitere Informationen über Tags und die Steuerung des Zugriffs auf Ressourcen in AWS Glue finden Sie unter AWS-Tags in AWS Glue und Angeben von AWS Glue-Ressourcen-ARNs im Entwicklerhandbuch.

Felder
  • key – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 128 Bytes lang.

    Der Tag-Schlüssel. Der Schlüssel ist erforderlich, wenn Sie ein Tag für ein Objekt erstellen. Bei dem Schlüssel wird die Groß-/Kleinschreibung berücksichtigt und er darf nicht das Präfix "aws" enthalten.

  • value – UTF-8-Zeichenfolge, nicht mehr als 256 Bytes lang.

    Der Tag-Wert. Der Wert ist optional, wenn Sie ein Tag für ein Objekt erstellen. Bei dem Wert wird die Groß-/Kleinschreibung berücksichtigt und er darf nicht das Präfix "aws" enthalten.

DecimalNumber-Struktur

Enthält einen numerischen Wert im Dezimalformat.

Felder
  • UnscaledValueErforderlich: Blob.

    Der nicht skalierte numerische Wert.

  • ScaleErforderlich: Zahl (Ganzzahl).

    Die Skalierung, die bestimmt, wo das Dezimalzeichen im nicht skalierten Wert gesetzt wird.

ErrorDetail-Struktur

Enthält Details über einen Fehler.

Felder
  • ErrorCode – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Code im Zusammenhang mit diesem Fehler.

  • ErrorMessage – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Meldung mit einer Beschreibung des Fehlers.

PropertyPredicate-Struktur

Definiert ein Eigenschaftsprädikat.

Felder
  • Key – Wertzeichenfolge, mindestens 1 und höchstens 1024 Byte lang.

    Der Schlüssel der Eigenschaft.

  • Value – Wertzeichenfolge, mindestens 1 und höchstens 1024 Byte lang.

    Der Wert der Eigenschaft.

  • Comparator – UTF-8-Zeichenfolge (zulässige Werte: EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS).

    Der Vergleichsoperator, mit dem diese Eigenschaft mit anderen verglichen wird.

ResourceUri-Struktur

Die URIs für Funktionsressourcen.

Felder
  • ResourceType – UTF-8-Zeichenfolge (zulässige Werte: JAR | FILE | ARCHIVE).

    Der Ressourcentyp.

  • Uri – Uniform Resource Identifier (uri), nicht weniger als 1 oder mehr als 1024 Bytes lang, passend zum URI address multi-line string pattern.

    Der URI für den Zugriff auf die Ressource.

ColumnStatistics-Struktur

Stellt die generierten Statistiken auf Spaltenebene für eine Tabelle oder Partition dar.

Felder
  • ColumnNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Name der Spalte, zu der Statistiken gehören.

  • ColumnTypeErforderlich: Typ-Name, nicht mehr als 20 000 Bytes lang, passend zum Single-line string pattern.

    Der Datentyp der Spalte.

  • AnalyzedTimeErforderlich: Zeitstempel.

    Der Zeitstempel für die Generierung der Spaltenstatistiken.

  • StatisticsDataErforderlich: Ein ColumnStatisticsData-Objekt.

    Ein ColumnStatisticData-Objekt, das die Statistikdatenwerte enthält.

ColumnStatisticsError-Struktur

Enthält ein fehlgeschlagenes ColumnStatistics-Objekt und den Grund für den Fehler.

Felder
  • ColumnStatistics – Ein ColumnStatistics-Objekt.

    Die ColumnStatistics der Spalte.

  • Error – Ein ErrorDetail-Objekt.

    Eine Fehlermeldung mit dem Grund für den Fehler eines Vorgangs.

ColumnError-Struktur

Enthält den Namen der fehlgeschlagenen Spalte und den Grund für den Fehler.

Felder
  • ColumnName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Spalte, die fehlgeschlagen ist.

  • Error – Ein ErrorDetail-Objekt.

    Eine Fehlermeldung mit dem Grund für den Fehler eines Vorgangs.

ColumnStatisticsData-Struktur

Enthält die einzelnen Typen von Spaltenstatistikdaten. Es sollte nur ein Datenobjekt festgelegt und durch das Type-Attribut angegeben werden.

Felder
  • TypeErforderlich: UTF-8-Zeichenfolge (zulässige Werte: BOOLEAN | DATE | DECIMAL | DOUBLE | LONG | STRING | BINARY).

    Der Typ der Spaltenstatistikdaten.

  • BooleanColumnStatisticsData – Ein BooleanColumnStatisticsData-Objekt.

    Boolesche Spaltenstatistikdaten.

  • DateColumnStatisticsData – Ein DateColumnStatisticsData-Objekt.

    Datum der Spaltenstatistikdaten.

  • DecimalColumnStatisticsData – Ein DecimalColumnStatisticsData-Objekt.

    Dezimal-Spaltenstatistikdaten. Bei den darin enthaltenen UnscaledValues handelt es sich um Base64-codierte Binärobjekte, die Big-Endian-Zweierkomplementdarstellungen des unskalierten Dezimalwerts speichern.

  • DoubleColumnStatisticsData – Ein DoubleColumnStatisticsData-Objekt.

    Double-Spaltenstatistikdaten.

  • LongColumnStatisticsData – Ein LongColumnStatisticsData-Objekt.

    Lange Spaltenstatistikdaten.

  • StringColumnStatisticsData – Ein StringColumnStatisticsData-Objekt.

    Zeichenfolgen-Spaltenstatistikdaten.

  • BinaryColumnStatisticsData – Ein BinaryColumnStatisticsData-Objekt.

    Binäre Spaltenstatistikdaten.

BooleanColumnStatisticsData-Struktur

Definiert Spaltenstatistiken, die für boolesche Datenspalten unterstützt werden.

Felder
  • NumberOfTruesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der wahren Werte in der Spalte.

  • NumberOfFalsesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der falschen Werte in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

DateColumnStatisticsData-Struktur

Definiert Spaltenstatistiken, die für Zeitstempel-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Zeitstempel.

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Zeitstempel.

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

DecimalColumnStatisticsData-Struktur

Definiert Spaltenstatistiken, die für Festkommazahl-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Ein DecimalNumber-Objekt.

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Ein DecimalNumber-Objekt.

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

DoubleColumnStatisticsData-Struktur

Definiert Spaltenstatistiken, die für Gleitkommazahl-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Nummer (doppelt).

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Nummer (doppelt).

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

LongColumnStatisticsData-Struktur

Definiert Spaltenstatistiken, die für Ganzzahl-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Zahl (lang).

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Zahl (lang).

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

StringColumnStatisticsData-Struktur

Definiert Spaltenstatistiken, die für Zeichenfolge-Datenwerte unterstützt werden.

Felder
  • MaximumLengthErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Größe der längsten Zeichenfolge in der Spalte.

  • AverageLengthErforderlich: Zahl (Double), nicht mehr als Keine.

    Die durchschnittliche Länge der Zeichenfolge in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

BinaryColumnStatisticsData-Struktur

Definiert Spaltenstatistiken, die für Bitfolge-Datenwerte unterstützt werden.

Felder
  • MaximumLengthErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Größe der längsten Bitfolge in der Spalte.

  • AverageLengthErforderlich: Zahl (Double), nicht mehr als Keine.

    Die durchschnittliche Bitfolgelänge in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

Zeichenfolgemuster

Die API verwendet die folgenden regulären Ausdrücke, um zu definieren, welche Inhalte für verschiedene Zeichenfolgenparameter und -mitglieder gültig sind:

  • Einzeiliges Zeichenfolgenmuster – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • Mehrzeilige Zeichenfolgenmuster für URI-Adressen – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*"

  • Ein Logstash-Grok-Zeichenfolgenmuster – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • Bezeichner-Zeichenfolgemuster – "[A-Za-z_][A-Za-z0-9_]*"

  • AWS IAM-ARN-Zeichenfolgemuster – "arn:aws:iam::\d{12}:role/.*"

  • Versionszeichenfolgemuster – "^[a-zA-Z0-9-_]+$"

  • Protokollgruppen-Zeichenfolgemuster – "[\.\-_/#A-Za-z0-9]+"

  • Protokollstream-Zeichenfolgemuster – "[^:*]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #10 – "[a-zA-Z0-9-_]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #11 – "[-a-zA-Z0-9+=/:_]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #12 – "[\S\s]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #13 – ".*\S.*"

  • Benutzerdefiniertes Zeichenfolgenmuster #14 – "[a-zA-Z0-9-=._/@]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #15 – "[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #16 – "[A-Z][A-Za-z\.]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #17 – "[\S]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #18 – "[\w]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #19 – "arn:aws[a-z\-]*:iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #20 – "subnet-[a-z0-9]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #21 – "\d{12}"

  • Benutzerdefiniertes Zeichenfolgenmuster #22 – "([a-z]+)-([a-z]+-)?([a-z]+)-[0-9]+[a-z]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #23 – "[a-zA-Z0-9.-]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #24 – "arn:aws[a-z0-9\-]*:lambda:[a-z0-9\-]+:\d{12}:function:([\w\-]{1,64})"

  • Benutzerdefiniertes Zeichenfolgenmuster #25 – "^(?!(.*[.\/\\]|aws:)).*$"

  • Benutzerdefiniertes Zeichenfolgenmuster #26 – "[^\r\n]"

  • Benutzerdefiniertes Zeichenfolgenmuster #27 – "^\w+\.\w+\.\w+$"

  • Benutzerdefiniertes Zeichenfolgenmuster #28 – "^\w+\.\w+$"

  • Benutzerdefiniertes Zeichenfolgenmuster #29 – "^$|arn:aws[a-z0-9-]*:kms:.*"

  • Benutzerdefiniertes Zeichenfolgenmuster #30 – "arn:aws[^:]*:iam::[0-9]*:role/.+"

  • Benutzerdefiniertes Zeichenfolgenmuster #31 – "[\.\-_A-Za-z0-9]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #32 – "^s3://([^/]+)/([^/]+/)*([^/]+)$"

  • Benutzerdefiniertes Zeichenfolgenmuster #33 – ".*"

  • Benutzerdefiniertes Zeichenfolgenmuster #34 – „^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 35 – „[a-zA-Z0-9_.-]+

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 36 – „^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 37 – „\S+

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 38 – „^[\x20-\x7E]*$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 39 – „^([a-zA-Z0-9_=]+)\.([a-zA-Z0-9_=]+)\.([a-zA-Z0-9_\-\+\/=]*)

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 40 – „^(https?)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 41 – „^(https?):\/\/[^\s/$.?#].[^\s]*$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 42 – „^subnet-[a-z0-9]+$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 43 – „[\p{L}\p{N}\p{P}]*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 44 – „[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 45 – „[a-zA-Z0-9-_$#.]+

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 46 – „^\d{12}$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 47 – „^(\w+\.)+\w+$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 48 – „^([2-3]|3[.]9)$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 49 – „arn:aws(-(cn|us-gov|iso(-[bef])?))?:glue:.*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 50 – „(^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::\w{12}:root)

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 51 – „^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 52 – „[\s\S]*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 53 – „([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 54 – „^[A-Z\_]+$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 55 – „^[A-Za-z0-9]+$

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 56 – „[*A-Za-z0-9_-]*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 57 – „([\u0020-\u007E\r\s\n])*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 58 – „[A-Za-z0-9_-]*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 59 – „([\u0009\u000B\u000C\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF])*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 60 – „([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 61 – „([^\r\n])*