Univocità - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Univocità

Verifica la percentuale di valori univoci in una colonna rispetto a una determinata espressione. I valori univoci si verificano esattamente una volta.

Sintassi

Uniqueness <COL_NAME> <EXPRESSION>
  • COL_NAME: il nome della colonna in base alla quale si desidera valutare la regola di qualità dei dati.

    Tipi di colonna supportati: qualsiasi tipo di colonna

  • EXPRESSION: un'espressione da eseguire sulla risposta del tipo di regola per produrre un valore booleano. Per ulteriori informazioni, consulta Espressioni.

Esempio

La seguente regola di esempio verifica se la percentuale di valori univoci in una colonna corrisponde a determinati criteri numerici.

Uniqueness "email" = 1.0 Uniqueness "Customer_ID" != 1.0 where "Customer_ID < 10"

La regola di esempio seguente controlla più colonne.

Uniqueness "vendorid" "tpep_pickup_datetime" = 1

Regole dinamiche di esempio

  • Uniqueness "colA" between min(last(10)) and max(last(10))

  • Uniqueness "colA" >= avg(last(10))