Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwalten des Zeitplans für die Generierung von Spaltenstatistiken
Sie können die Planungsvorgänge wie Aktualisieren, Starten, Stoppen und Löschen von Zeitplänen für die Erstellung von Spaltenstatistiken in AWS Glue verwalten. Sie können API-Operationen für AWS GlueAWS CLI Konsolen- oder AWS Glue Spaltenstatistiken verwenden, um diese Aufgaben auszuführen.
Aktualisieren des Zeitplans für die Generierung von Spaltenstatistiken
Sie können den Zeitplan aktualisieren, um die Aufgabe zur Generierung der Spaltenstatistiken nach deren Erstellung auszulösen. Sie können die AWS Glue Konsole verwenden oder den UpdateColumnStatisticsTaskSettingsVorgang ausführen AWS CLI, um den Zeitplan für eine Tabelle zu aktualisieren. Die Parameter eines bestehenden Zeitplans, z. B. der Zeitplantyp (auf Abruf oder geplant) und andere optionale Parameter lassen sich ändern.
- AWS-Managementkonsole
So aktualisieren Sie die Einstellungen für eine Aufgabe zur Generierung von Spaltenstatistiken
Melden Sie sich bei der AWS Glue Konsole an unter https://console.aws.amazon.com/glue/.
Wählen Sie aus der Tabellenliste die Tabelle aus, die Sie aktualisieren möchten.
Wählen Sie im unteren Bereich der Detailseite der Tabelle die Option Spaltenstatistiken.
Wählen Sie unter Aktionen die Option Bearbeiten aus, um den Zeitplan zu aktualisieren.
Nehmen Sie die gewünschten Änderungen am Zeitplan vor und wählen Sie Speichern.
- AWS CLI
-
Wenn Sie die Funktion zur Generierung AWS Glue von Statistiken in der Konsole nicht verwenden, können Sie den Zeitplan mithilfe des update-column-statistics-task-settings Befehls manuell aktualisieren. Im folgenden Beispiel wird gezeigt, wie Sie Spaltenstatistiken mithilfe von AWS CLI aktualisieren.
aws glue update-column-statistics-task-settings \
--database-name 'database_name' \
--table-name 'table_name' \
--role arn:aws:iam::123456789012:role/stats_role \
--schedule 'cron(0 0-5 16 * * ?)' \
--column-name-list 'col-1' \
--sample-size '20.0' \
--catalog-id '123456789012'\
--security-configuration 'test-security'
Beenden des Zeitplans für die Generierung von Spaltenstatistiken
Wenn Sie die inkrementellen Statistiken nicht mehr benötigen, können Sie die geplante Generierung stoppen, um Ressourcen und Kosten zu sparen. Das Anhalten des Zeitplans hat keine Auswirkungen auf die zuvor generierten Statistiken. Sie können den Zeitplan nach Belieben fortsetzen.
- AWS-Managementkonsole
So beenden Sie den Zeitplan für die Generierung von Spaltenstatistiken
Wählen Sie in der AWS Glue Konsole unter Datenkatalog die Option Tabellen aus.
Wählen Sie eine Tabelle mit Spaltenstatistiken aus.
Wählen Sie auf der Seite Tabellendetails die Option Spaltenstatistiken aus.
Wählen Sie unter Aktionen die Option Geplante Generierung und dann Pausieren aus.
Bestätigen Sie mit Pausieren.
- AWS CLI
-
Um die Ausführung einer Aufgabe mit Spaltenstatistiken mithilfe von zu beenden AWS CLI, können Sie den folgenden Befehl verwenden:
aws glue stop-column-statistics-task-run-schedule \
--database-name ''database_name' \
--table-name 'table_name'
Ersetzen Sie database_name und table_name durch die tatsächlichen Namen der Datenbank und Tabelle, für die Sie den Zeitplan für die Ausführung der Spaltenstatistikaufgabe beenden möchten.
Fortsetzen des Zeitplans für die Generierung von Spaltenstatistiken
Wenn Sie den Zeitplan für die Statistikgenerierung angehalten haben, AWS Glue können Sie den Zeitplan nach Belieben fortsetzen. Sie können den Zeitplan über die AWS Glue
Konsole oder den AWS CLIStartColumnStatisticsTaskRunScheduleVorgang fortsetzen.
- AWS-Managementkonsole
So setzen Sie den Zeitplan für die Generierung von Spaltenstatistiken fort
Wählen Sie auf der AWS Glue Konsole unter Datenkatalog die Option Tabellen aus.
Wählen Sie eine Tabelle mit Spaltenstatistiken aus.
Wählen Sie auf der Seite Tabellendetails die Option Spaltenstatistiken aus.
Wählen Sie unter Aktionen die Option Geplante Generierung und dann Fortsetzen aus.
Bestätigen Sie mit Fortsetzen.
- AWS CLI
-
Ersetzen Sie database_name und table_name durch die tatsächlichen Namen der Datenbank und Tabelle, für die Sie den Zeitplan für die Ausführung der Spaltenstatistikaufgabe beenden möchten.
aws glue start-column-statistics-task-run-schedule \
--database-name 'database_name' \
--table-name 'table_name'
Löschen des Zeitplans für die Generierung von Spaltenstatistiken
Für eine optimale Abfrageleistung wird zwar generell empfohlen, up-to-date Statistiken zu verwalten, es gibt jedoch spezielle Anwendungsfälle, in denen es von Vorteil sein könnte, den Zeitplan für die automatische Generierung zu entfernen.
Bleiben die Daten relativ statisch, können die vorhandenen Spaltenstatistiken über einen längeren Zeitraum hinweg genau bleiben, wodurch die Notwendigkeit häufiger Aktualisierungen verringert wird. Das Löschen des Zeitplans kann unnötigen Ressourcenverbrauch und Overhead verhindern, der mit der Neugenerierung von Statistiken zu unveränderten Daten verbunden ist.
Wenn eine manuelle Steuerung der Statistikgenerierung bevorzugt wird. Durch das Löschen des automatischen Zeitplans können Administratoren die Spaltenstatistiken in bestimmten Intervallen oder nach wesentlichen Datenänderungen selektiv aktualisieren und den Prozess so an ihre Wartungsstrategien und Anforderungen an die Ressourcenzuweisung anpassen.
- AWS-Managementkonsole
So löschen Sie den Zeitplan für die Generierung von Spaltenstatistiken
Wählen Sie auf der AWS Glue Konsole unter Datenkatalog die Option Tabellen aus.
Wählen Sie eine Tabelle mit Spaltenstatistiken aus.
Wählen Sie auf der Seite Tabellendetails die Option Spaltenstatistiken aus.
Wählen Sie unter Aktionen die Option Geplante Generierung und dann Löschen aus.
Bestätigen Sie mit Löschen.
- AWS CLI
-
Ersetzen Sie database_name und table_name durch die tatsächlichen Namen der Datenbank und Tabelle, für die Sie den Zeitplan für die Ausführung der Spaltenstatistikaufgabe beenden möchten.
Sie können den Zeitplan für Spaltenstatistiken mithilfe der DeleteColumnStatisticsTaskSettingsAPI-Operation oder löschen AWS CLI. Das folgende Beispiel zeigt, wie der Zeitplan für die Generierung von Spaltenstatistiken mithilfe von AWS Command Line Interface (AWS CLI) gelöscht wird.
aws glue delete-column-statistics-task-settings \
--database-name 'database_name' \
--table-name 'table_name'